Add files via upload

simplesisu · Apr 13, 2023 · d44d4e1 · d44d4e1
commit d44d4e1
Showing 1 changed file with 134 additions and 0 deletions.
diff --git a/img2text-v1.py b/img2text-v1.py
@@ -0,0 +1,134 @@
+import sys
+import os
+from PyQt5.QtWidgets import (QApplication, QWidget, QVBoxLayout, QHBoxLayout, QLabel, QPushButton, QFileDialog,
+                             QTextEdit, QProgressBar, QGroupBox, QRadioButton, QPlainTextEdit)
+from PyQt5.QtGui import QImage, QPixmap, QClipboard
+from PyQt5.QtCore import Qt, QBuffer, QIODevice
+import pytesseract
+from PIL import Image
+
+pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe'
+
+class OCRApp(QWidget):
+    def __init__(self):
+        super().__init__()
+
+        self.init_ui()
+
+    def init_ui(self):
+        self.setWindowTitle('OCR Application')
+        self.setGeometry(100, 100, 800, 600)
+
+        main_layout = QVBoxLayout()
+
+        image_layout = QHBoxLayout()
+        self.label = QLabel(self)
+        self.label.setText('No image loaded.')
+        image_layout.addWidget(self.label)
+
+        button_layout = QVBoxLayout()
+        self.load_button = QPushButton('Load Image', self)
+        self.load_button.clicked.connect(self.load_image)
+        button_layout.addWidget(self.load_button)
+
+        self.paste_button = QPushButton('Paste Image', self)
+        self.paste_button.clicked.connect(self.paste_image)
+        button_layout.addWidget(self.paste_button)
+
+        self.save_button = QPushButton('Save Text', self)
+        self.save_button.clicked.connect(self.save_text)
+        self.save_button.setEnabled(False)
+        button_layout.addWidget(self.save_button)
+
+        image_layout.addLayout(button_layout)
+        main_layout.addLayout(image_layout)
+
+        text_layout = QVBoxLayout()
+        self.text_edit = QPlainTextEdit(self)
+        self.text_edit.setReadOnly(True)
+        text_layout.addWidget(self.text_edit)
+        main_layout.addLayout(text_layout)
+
+        self.setLayout(main_layout)
+
+    def load_image(self):
+        options = QFileDialog.Options()
+        file_name, _ = QFileDialog.getOpenFileName(self, "Open Image", "", "Images (*.png *.xpm *.jpg *.bmp);;All Files (*)", options=options)
+        if file_name:
+            image = QImage(file_name)
+            pixmap = QPixmap.fromImage(image)
+            self.label.setPixmap(pixmap.scaled(300, 300, Qt.KeepAspectRatio))
+            self.label.setScaledContents(True)
+            self.perform_ocr(file_name)
+
+    def paste_image(self):
+        clipboard = QApplication.clipboard()
+        mime_data = clipboard.mimeData()
+
+        if mime_data.hasImage():
+            image = clipboard.image()
+            pixmap = QPixmap.fromImage(image)
+            self.label.setPixmap(pixmap.scaled(300, 300, Qt.KeepAspectRatio))
+            self.label.setScaledContents(True)
+
+            temp_path = os.path.join(os.path.dirname(os.path.abspath(__file__)), "temp.png")
+            buffer = QBuffer()
+            buffer.open(QIODevice.WriteOnly)
+            image.save(buffer, "PNG")
+            with open(temp_path, "wb") as f:
+                f.write(buffer.data())
+
+            self.perform_ocr(temp_path)
+        else:
+            print("No image found in the clipboard.")
+
+    def perform_ocr(self, image_path):
+        extracted_text = pytesseract.image_to_string(Image.open(image_path))
+        self.text_edit.setPlainText(extracted_text)
+        self.save_button.setEnabled(True)
+
+    def save_text(self):
+        options = QFileDialog.Options()
+        file_name, _ = QFileDialog.getSaveFileName(self, "Save Text", "", "Text Files (*.txt);;Word Files (*.docx);;PDF Files (*.pdf);;All Files (*)", options=options)
+        if file_name:
+            file_extension = os.path.splitext(file_name)[-1].lower()
+            if file_extension == ".docx":
+                self.save_text_to_docx(file_name)
+            elif file_extension == ".pdf":
+                self.save_text_to_pdf(file_name)
+            else:
+                with open(file_name, 'w', encoding='utf-8') as f:
+                    f.write(self.text_edit.toPlainText())
+
+    def save_text_to_docx(self, file_name):
+        try:
+            from docx import Document
+        except ImportError:
+            print("python-docx module is not installed.")
+            return
+
+        doc = Document()
+        doc.add_paragraph(self.text_edit.toPlainText())
+        doc.save(file_name)
+
+    def save_text_to_pdf(self, file_name):
+        try:
+            from reportlab.pdfgen import canvas
+        except ImportError:
+            print("reportlab module is not installed.")
+            return
+
+        text = self.text_edit.toPlainText()
+        pdf = canvas.Canvas(file_name)
+        pdf.setFont("Helvetica", 12)
+        x, y = 50, 750
+        for line in text.split('\n'):
+            pdf.drawString(x, y, line)
+            y -= 14
+        pdf.save()
+
+if __name__ == '__main__':
+    app = QApplication(sys.argv)
+    ocr_app = OCRApp()
+    ocr_app.show()
+    sys.exit(app.exec_())