41k星標!這款爆紅文字識別工具大受歡迎,離線內網也可使用

最近有朋友再問,有沒有操作簡單效果又好的單位內網也可以用的OCR文字識別工具推薦一下,軟件格律詩 重點推薦一下 Umi-OCR 這款免費開源的文字識別工具,它在開源社區已經獲得了41k星標,可以想象多麼受到歡迎,想到現在很多識別工具動不動要聯網又或者是爲了AI大模型配置API,搞不好還得付費,OCR識別又不是經常使用的話,就顯得特別折騰,那麼你可以試試這個體積不大,功能還蠻全面的小鋼炮。

Umi-OCR 是一款完全免費、開源且無需聯網的本地 OCR(光學字符識別)軟件,適用於 Windows 和 Linux 系統。它能從截圖本地圖片PDF文檔精準提取文字內容,並支持多國語言識別排版還原水印排除二WeiMa等實用功能。所有處理均在用戶設備本地完成,不上傳任何數據,充分保障隱私安全。

pan.quark.cn/s/83cad040a7d1

他能幹什麼?

1. 完全離線運行,隱私無憂

內置高性能離線 OCR 引擎(支持 PaddleOCRRapidOCR),無需連接互聯網即可完成全部識別任務。這意味着我們的截圖、文檔、身份證等敏感內容永遠不會離開本地設備,避免了雲端 OCR 服務可能帶來的隱私泄露風險,尤其適合處理含個人信息或機密資料的場景。

2. 多種輸入方式,覆蓋日常需求

  • 截圖 OCR:按下快捷鍵即可截取屏幕任意區域,自動識別文字並顯示結果,支持重複上一次截圖;

  • 批量 OCR:一次性導入數百張 JPG、PNG、BMP 等格式圖片,自動排隊識別,支持任務完成後自動關機或休眠;

  • PDF 文檔識別:可對掃描版 PDF 進行全文文字提取,或生成“雙層可搜索 PDF”(保留原圖+疊加可選文本層),便於歸檔與檢索。

3. 智能排版解析,輸出更易讀

OCR 原始結果常因段落錯亂、換行混亂而難以直接使用。Umi-OCR 提供多種文本後處理方案,自動優化排版:

  • “多欄-按自然段換行”:智能識別報紙、論文等多欄佈局,按語義分段;

  • “單欄-保留縮進”:適用於代碼截圖,保留空格與縮進格式;

  • “豎排識別”:支持從右向左的中文古籍或日文豎排文本(需引擎支持);

  • 用戶還可選擇“不做處理”,保留原始識別順序。

4. 忽略區域功能,精準排除干擾

在批量識別或 PDF 處理時,頁面常含有頁眉、頁腳、水印、LOGO 等無關內容。允許用戶手動繪製“忽略區域”矩形框,系統將自動過濾框內文字。例如,可設定每頁頂部 50 像素爲忽略區,批量去除統一水印,大幅提升識別準確率。

5. 內置二WeiMa識別與生成

  • SaoMa:支持從截圖、粘貼圖或本地文件中讀取 19 種碼制(包括 QR Code、DataMatrix、PDF417 等),一圖多碼也能識別;

  • 生成:輸入文本即可生成自定義二WeiMa圖片,支持調整糾錯等級、尺寸與格式,方便日常分享鏈接或信息。

6. 靈活輸出與外部調用

識別結果可保存爲 TXT、JSONL、Markdown、CSV(兼容 Excel)等多種格式,滿足不同後續處理需求。同時,Umi-OCR 提供:

  • 命令行接口:便於腳本自動化調用;

  • HTTP API:支持其他程序通過網絡請求提交任務(僅限本地迴環地址,默認不開放公網);

  • 插件機制允許用戶切換 OCR 引擎或擴展功能,兼顧兼容性與性能。

怎麼使用?

界面語言

支持的界面多國語言。在第一次打開軟件時,將會按照你的電腦的系統設置,自動切換語言。 如果需要手動切換語言,請參考下圖,全局設置→語言/Language 。

標籤頁

Umi-OCR v2 由一系列靈活好用的標籤頁組成。您可按照自己的喜好,打開需要的標籤頁。 標籤欄左上角可以切換窗口置頂。右上角能夠鎖定標籤頁,以防止日常使用中誤觸關閉標籤頁。

截圖OCR

打開這一頁後,就可以用快捷鍵喚起截圖,識別圖中的文字。

  • 左側的圖片預覽欄,可直接用鼠標劃選複製。

  • 右側的識別記錄欄,可以編輯文字,允許劃選多個記錄複製。

  • 也支持在別處複製圖片,粘貼到Umi-OCR進行識別。

  • 關於 公式識別 功能

文本後處理

可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:

  1. 多欄-按自然段換行:適合大部分情景,自動識別多欄佈局,按自然段規則進行換行。

  2. 多欄-總是換行:每段語句都進行換行。

  3. 多欄-無換行:強制將所有語句合併到同一行。

  4. 單欄-按自然段換行/總是換行/無換行:與上述類似,不過 不區分多欄佈局。

  5. 單欄-保留縮進:適用於解析代碼截圖,保留行首縮進和行中空格。

  6. 不做處理:OCR引擎的原始輸出,默認每段語句都進行換行。

上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)

批量OCR

這一頁用於批量導入本地圖片進行識別:

  1. 支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。

  2. 保存識別結果的支持格式:txt, jsonl, md, csv(Excel)。

  3. 與截圖OCR一樣,支持文本後處理功能,整理OCR文本的排版和順序。

  4. 沒有數量上限,可一次性導入幾百張圖片進行任務。

  5. 支持任務完成後自動關機/待機。

  6. 如果要識別像素超大的長圖或大圖,請調整:頁面的設置→文字識別→限制圖像邊長→【調高數值】。

  7. 擁有特殊功能 忽略區域 。

忽略區域

批量OCR中的一種特殊功能,適用於排除圖片中的不想要的文字。

  1. 在批量識別頁的右欄設置中可進入忽略區域編輯器。

  2. 如上方樣例,圖片頂部和右下角存在多個水印 / LOGO。如果批量識別這類圖片,水印會對識別結果造成干擾。

  3. 按住右鍵,繪製多個矩形框。這些區域內的文字將在任務中被忽略。

  4. 請儘量將矩形框畫得大一些,完全包裹住水印所有可能出現的位置。

  5. 注意,只有處於忽略區域框內部的整個文本塊(而不是單個字符)會被忽略。如下圖所示,黃色邊框的深色矩形是一個忽略區域。那麼只有key_mouse纔會被忽略。pubsub_connector.py、pubsub_service.py 這兩個文本塊得以保留。

文檔識別

  1. 支持格式:pdf, xps, epub, mobi, fb2, cbz。

  2. 對掃描件進行OCR,或提取原有文本。可輸出爲 雙層可搜索PDF 。

  3. 支持設定 忽略區域 ,可用於排除頁眉頁腳的文字。

  4. 可設置任務完成後 自動關機/休眠 。

二WeiMa

掃碼:

  • 截圖/粘貼/拖入本地圖片,讀取。

  • 支持一圖多Ma。

  • 支持19種協議,如下:Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE

生成Ma

  1. 輸入文本,生成二WeiMa圖片。

  2. 支持19種協議和糾錯等級等參數。

全局設置

在這裏可以調整軟件的全局參數。常用功能如下:

  1. 一鍵添加快捷方式或設置開機自啓。

  2. 更改界面語言。Umi支持繁中、英語、日語等語言。

  3. 切換界面主題。Umi擁有多個亮/暗主題。

  4. 調整界面文字的大小和字體。

  5. 切換OCR插件。

  6. 渲染器:軟件界面默認支持顯卡加速渲染。如果在你的機器上出現截屏閃爍、UI錯位的情況,請調整界面和外觀 → 渲染器 ,嘗試切換到不同渲染方案,或關閉硬件加速。

更新日誌

  1. 新增:日誌機制。在命令行中啓動 Umi-OCR 可查看實時日誌。指定級別以上

  2. 新增:大部分標籤頁能手動切換左右/上下雙欄模式。

  3. 新增:Esc鍵隱藏主窗口。

  4. 新增:調整二WeiMa生成相關參數後,自動刷新二WeiMa生成。

  5. 新增:命令行指令 --reload ,用於重新加載配置文件。

  6. 修復:文檔識別提取PDF自帶的文本內容時,未考慮頁面旋轉的影響。

  7. 修復:文檔識別生成單層PDF時,未寫入原PDF自帶的文本內容。

  8. 修復:OCR結果展示列表的一些顯示Bug和鼠標劃選Bug。

  9. 修復:調整標籤頁順序或刪除標籤頁後,未及時保存順序信息。

  10. 修復:HTTP接口 /api/doc/download 參數 ignore_blank 的錯誤。

  11. 修復:Linux版本截圖時,系統任務欄推移頂層窗口,導致截圖位置偏移。

  12. 修復:Linux版本截圖後,主窗口的位置與操作前不一致。

  13. 優化:圖片/文檔的異步加載機制。現在可以流暢地加載含有數萬個子文件的文件夾,且能預覽加載進度。

  14. Windows 版本更新第三方依賴庫:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0

  15. 新增UI語言:俄語 Русский

喜歡我的推薦,歡迎點贊+關注+充電!~這將對我很重要!

往期回顧

太猛了!歪斜圖像智能糾位,漂白去底變成紙質版,精準摳出手寫字

在Windows上使用蘋果macOS 鼠標指針~扁平化,現代感十足!

舒服了!這是我見過最美的書籤側邊欄,果斷替換瀏覽器原版書籤!

低調分享!通過一個小插件實現網頁版微博圖片和視頻批量下載

打開新世界了!讓電腦全局任意頁面支持平滑滾動,高幀率享受!

PotPlayer播放器皮膚03|現代簡約無邊框~看着就爽!

送女友系列~16枚Q感又矜持鼠標指針,單身狗也能用

關鍵時刻總能用到,輕鬆解鎖網站右鍵限制問題

懂得都懂~這個插件就能瞬間提升N倍115網盤使用體驗!

這兩套鼠標指針真是好感度爆棚!

微軟還能做出這麼好口碑的獨立軟件?

更多遊戲資訊請關註:電玩幫遊戲資訊專區

電玩幫圖文攻略 www.vgover.com