文章詳情頁

如何使用Python進行PDF圖片識別OCR

瀏覽：2日期：2022-06-29 11:54:07

使用場景

使用圖片識別可以快速提取圖片中的信息，方便高效。

Python并不能直接對PDF進行識別，所以如果是識別PDF的話，需要先將PDF轉化為圖片，然后再進行識別。

必備工具 Python

可以安裝3.7及以上版本

tesseract-ocr

下載地址： https://github.com/UB-Mannheim/tesseract/wiki 使用最新版本即可

需要用到的庫

pip install pillowpip install opencv-pythonpip install fitzpip install PyMuPDFpip install pytesseract代碼示例

from PIL import Imageimport osimport pytesseract import cv2 as cvimport fitzdef pdf_image(pdfPath,imgPath,zoom_x,zoom_y,rotation_angle): # 打開PDF文件 pdf = fitz.open(pdfPath) # 逐頁讀取PDF for pg in range(0, pdf.pageCount): page = pdf[pg] # 設置縮放和旋轉系數 trans = fitz.Matrix(zoom_x, zoom_y).preRotate(rotation_angle) pm = page.getPixmap(matrix=trans, alpha=False) # 開始寫圖像 pm.writePNG(imgPath+str(pg)+'.png') #pm.writePNG(imgPath) pdf.close()pdf_path =’D:/123.pdf’img_path =’D:/123.png’pdf_image(pdf_path,img_path,5,5,0)# 依賴opencvimg=cv.imread(img_path)text=pytesseract.image_to_string(Image.fromarray(img),lang=’chi_tra’)# 不依賴opencv寫法# text=pytesseract.image_to_string(Image.open(img_path))print(text)總結

識別清晰的文字圖片的時候準確率非常高

但是識別手寫體的話效果不太好

注意事項

在安裝tesseract-ocr 的時候一定要記得選擇對應的語言，不然是無法正常使用的。

以上就是如何使用Python進行PDF圖片識別OCR的詳細內容，更多關于python pdf圖片識別ocr的資料請關注好吧啦網其它相關文章！

Python 編程

上一條：python將YUV420P文件轉PNG圖片格式的兩種方法下一條：python實現簡單的井字棋游戲(gui界面)

相關文章：

1. HTML <!DOCTYPE> 標簽2. 使用AJAX實現UTF8編碼表單提交到GBK編碼腳本無亂碼的解決方法3. 詳解盒子端CSS動畫性能提升4. asp在iis7報錯行號不準問題的解決方法5. 告別AJAX實現無刷新提交表單6. ASP中解決“對象關閉時,不允許操作。”的詭異問題……7. msxml3.dll 錯誤 800c0019 系統錯誤:-2146697191解決方法8. CSS代碼檢查工具stylelint的使用方法詳解9. 三個不常見的 HTML5 實用新特性簡介10. HTML中的XML數據島記錄編輯與添加

排行榜

					
					在vue中封裝方法以及多處引用該方法詳解
PHP連接MySQL數據庫操作代碼實例解析
詳解Python中openpyxl模塊基本用法
Vue中父子組件的值傳遞與方法傳遞
深度源碼解析Java 線程池的實現原理
springboot攔截器Interceptor的使用,你都了解嗎
asp在iis7報錯行號不準問題的解決方法
Vue實現div滾輪放大縮小
Java面向對象程序設計：類的定義，靜態變量，成員變量，構造函數，封裝與私有，this概念與用法詳解
JDBC連接數據庫經驗集萃
Sun明確Java開源時間表