免費開源的PC端掃描軟件!離線OCR識別、批量識別、水印去除

【前言】

大家在使用PDF資料時應該都有過類似的經歷吧:文件裏的文字是圖片類型的,不能自由複製和編輯,或者在進行PDF轉Word時出現文檔格式錯亂的問題,今天這款OCR工具就能幫你解決這個問題。

Umi-OCR是免費開源的離線OCR軟件,支持Windows10/11,可以批量識別普通圖片並識別文字內容導出,以及還有支持忽略指定區域的特殊功能,例如可以屏蔽掉視頻右上角水印和遊戲的 UI 內容。含中英識別庫,支持多國語言擴展包。

【軟件特點】

免費:本項目所有代碼開源,完全免費。

方便:解壓即用,離線運行,無需網絡。

批量:可批量導入處理圖片,結果保存到本地多種格式文件。也可以即時截屏識別。

高效:採用識別引擎。只要電腦性能足夠,通常比在線OCR服務更快。

精準:默認使用PPOCR-v3模型庫。除了能準確辨認常規文字,對手寫、方向不正、雜亂背景等情景也有不錯的識別率。可設置忽略區域排除水印、設置文塊後處理合併排版段落,得到規整的文本。

【軟件截圖】

軟件截圖

【功能展示】

截圖OCR

截圖OCR

打開這一頁後,就可以用快捷鍵喚起截圖,識別圖中的文字。比QQ的識別屏幕好用很多,準確率也高很多。左側的圖片預覽欄,可直接用鼠標劃選複製。右側的識別記錄欄,可以編輯文字,允許劃選多個記錄複製。也支持在別處複製圖片,粘貼到Umi-OCR進行識別。

文本後處理

文本後處理

可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:

  • 多欄-按自然段換行:適合大部分情景,自動識別多欄佈局,按自然段規則進行換行。

  • 多欄-總是換行:每段語句都進行換行。

  • 多欄-無換行:強制將所有語句合併到同一行。

  • 單欄-按自然段換行/總是換行/無換行:與上述類似,不過 不區分多欄佈局。

  • 單欄-保留縮進:適用於解析代碼截圖,保留行首縮進和行中空格。

  • 不做處理:OCR引擎的原始輸出,默認每段語句都進行換行。

上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)

批量OCR

批量OCR

  • 支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。

  • 保存識別結果的支持格式:txt, jsonl, md, csv(Excel)。

  • 與截圖OCR一樣,支持文本後處理功能,整理OCR文本的排版和順序。

  • 沒有數量上限,可一次性導入幾百張圖片進行任務。

  • 支持任務完成後自動關機/待機。

  • 如果要識別像素超大的長圖或大圖,請調整:頁面的設置→文字識別→限制圖像邊長→【調高數值】

  • 擁有特殊功能 忽略區域 。


以上只是列舉了一些比較常用的功能,軟件很有很多實用的功能,真的強烈推薦!


【下載地址】

「Umi-OCR PDF一鍵識別文字」

https://pan.quark.cn/s/c67ffc441c25

長按可以複製


感謝大家的點贊和收藏支持,我會持續爲大家推薦好用好玩實用的軟件分享,歡迎關注我。

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com