最近有朋友再問,有沒有操作簡單效果又好的單位內網也可以用的OCR文字識別工具推薦一下,軟件格律詩 重點推薦一下 Umi-OCR 這款免費開源的文字識別工具,它在開源社區已經獲得了41k星標,可以想象多麼受到歡迎,想到現在很多識別工具動不動要聯網又或者是爲了AI大模型配置API,搞不好還得付費,OCR識別又不是經常使用的話,就顯得特別折騰,那麼你可以試試這個體積不大,功能還蠻全面的小鋼炮。
Umi-OCR 是一款完全免費、開源且無需聯網的本地 OCR(光學字符識別)軟件,適用於 Windows 和 Linux 系統。它能從截圖、本地圖片或 PDF文檔精準提取文字內容,並支持多國語言識別、排版還原、水印排除、二WeiMa等實用功能。所有處理均在用戶設備本地完成,不上傳任何數據,充分保障隱私安全。
![]()
pan.quark.cn/s/83cad040a7d1
他能幹什麼?
1. 完全離線運行,隱私無憂
內置高性能離線 OCR 引擎(支持 PaddleOCR 與 RapidOCR),無需連接互聯網即可完成全部識別任務。這意味着我們的截圖、文檔、身份證等敏感內容永遠不會離開本地設備,避免了雲端 OCR 服務可能帶來的隱私泄露風險,尤其適合處理含個人信息或機密資料的場景。
2. 多種輸入方式,覆蓋日常需求
截圖 OCR:按下快捷鍵即可截取屏幕任意區域,自動識別文字並顯示結果,支持重複上一次截圖;
批量 OCR:一次性導入數百張 JPG、PNG、BMP 等格式圖片,自動排隊識別,支持任務完成後自動關機或休眠;
PDF 文檔識別:可對掃描版 PDF 進行全文文字提取,或生成“雙層可搜索 PDF”(保留原圖+疊加可選文本層),便於歸檔與檢索。
3. 智能排版解析,輸出更易讀
OCR 原始結果常因段落錯亂、換行混亂而難以直接使用。Umi-OCR 提供多種文本後處理方案,自動優化排版:
“多欄-按自然段換行”:智能識別報紙、論文等多欄佈局,按語義分段;
“單欄-保留縮進”:適用於代碼截圖,保留空格與縮進格式;
“豎排識別”:支持從右向左的中文古籍或日文豎排文本(需引擎支持);
用戶還可選擇“不做處理”,保留原始識別順序。
4. 忽略區域功能,精準排除干擾
在批量識別或 PDF 處理時,頁面常含有頁眉、頁腳、水印、LOGO 等無關內容。允許用戶手動繪製“忽略區域”矩形框,系統將自動過濾框內文字。例如,可設定每頁頂部 50 像素爲忽略區,批量去除統一水印,大幅提升識別準確率。
5. 內置二WeiMa識別與生成
SaoMa:支持從截圖、粘貼圖或本地文件中讀取 19 種碼制(包括 QR Code、DataMatrix、PDF417 等),一圖多碼也能識別;
生成:輸入文本即可生成自定義二WeiMa圖片,支持調整糾錯等級、尺寸與格式,方便日常分享鏈接或信息。
6. 靈活輸出與外部調用
識別結果可保存爲 TXT、JSONL、Markdown、CSV(兼容 Excel)等多種格式,滿足不同後續處理需求。同時,Umi-OCR 提供:
命令行接口:便於腳本自動化調用;
HTTP API:支持其他程序通過網絡請求提交任務(僅限本地迴環地址,默認不開放公網);
插件機制允許用戶切換 OCR 引擎或擴展功能,兼顧兼容性與性能。
怎麼使用?
界面語言
支持的界面多國語言。在第一次打開軟件時,將會按照你的電腦的系統設置,自動切換語言。 如果需要手動切換語言,請參考下圖,全局設置→語言/Language 。
![]()
標籤頁
Umi-OCR v2 由一系列靈活好用的標籤頁組成。您可按照自己的喜好,打開需要的標籤頁。 標籤欄左上角可以切換窗口置頂。右上角能夠鎖定標籤頁,以防止日常使用中誤觸關閉標籤頁。
截圖OCR
打開這一頁後,就可以用快捷鍵喚起截圖,識別圖中的文字。
左側的圖片預覽欄,可直接用鼠標劃選複製。
右側的識別記錄欄,可以編輯文字,允許劃選多個記錄複製。
也支持在別處複製圖片,粘貼到Umi-OCR進行識別。
關於 公式識別 功能
![]()
文本後處理
可以整理OCR結果的排版和順序,使文本更適合閱讀和使用。預設方案:
多欄-按自然段換行:適合大部分情景,自動識別多欄佈局,按自然段規則進行換行。
多欄-總是換行:每段語句都進行換行。
多欄-無換行:強制將所有語句合併到同一行。
單欄-按自然段換行/總是換行/無換行:與上述類似,不過 不區分多欄佈局。
單欄-保留縮進:適用於解析代碼截圖,保留行首縮進和行中空格。
不做處理:OCR引擎的原始輸出,默認每段語句都進行換行。
上述方案,均能自動處理橫排和豎排(從右到左)的排版。(豎排文字還需要OCR引擎本身支持)
![]()
批量OCR
這一頁用於批量導入本地圖片進行識別:
支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
保存識別結果的支持格式:txt, jsonl, md, csv(Excel)。
與截圖OCR一樣,支持文本後處理功能,整理OCR文本的排版和順序。
沒有數量上限,可一次性導入幾百張圖片進行任務。
支持任務完成後自動關機/待機。
如果要識別像素超大的長圖或大圖,請調整:頁面的設置→文字識別→限制圖像邊長→【調高數值】。
擁有特殊功能 忽略區域 。
![]()
忽略區域
批量OCR中的一種特殊功能,適用於排除圖片中的不想要的文字。
![]()
在批量識別頁的右欄設置中可進入忽略區域編輯器。
如上方樣例,圖片頂部和右下角存在多個水印 / LOGO。如果批量識別這類圖片,水印會對識別結果造成干擾。
按住右鍵,繪製多個矩形框。這些區域內的文字將在任務中被忽略。
請儘量將矩形框畫得大一些,完全包裹住水印所有可能出現的位置。
注意,只有處於忽略區域框內部的整個文本塊(而不是單個字符)會被忽略。如下圖所示,黃色邊框的深色矩形是一個忽略區域。那麼只有key_mouse纔會被忽略。pubsub_connector.py、pubsub_service.py 這兩個文本塊得以保留。
![]()
文檔識別
支持格式:pdf, xps, epub, mobi, fb2, cbz。
對掃描件進行OCR,或提取原有文本。可輸出爲 雙層可搜索PDF 。
支持設定 忽略區域 ,可用於排除頁眉頁腳的文字。
可設置任務完成後 自動關機/休眠 。
![]()
二WeiMa
掃碼:
截圖/粘貼/拖入本地圖片,讀取。
支持一圖多Ma。
支持19種協議,如下:Aztec,Codabar,Code128,Code39,Code93,DataBar,DataBarExpanded,DataMatrix,EAN13,EAN8,ITF,LinearCodes,MatrixCodes,MaxiCode,MicroQRCode,PDF417,QRCode,UPCA,UPCE
![]()
生成Ma:
輸入文本,生成二WeiMa圖片。
支持19種協議和糾錯等級等參數。
![]()
全局設置
在這裏可以調整軟件的全局參數。常用功能如下:
一鍵添加快捷方式或設置開機自啓。
更改界面語言。Umi支持繁中、英語、日語等語言。
切換界面主題。Umi擁有多個亮/暗主題。
調整界面文字的大小和字體。
切換OCR插件。
渲染器:軟件界面默認支持顯卡加速渲染。如果在你的機器上出現截屏閃爍、UI錯位的情況,請調整界面和外觀 → 渲染器 ,嘗試切換到不同渲染方案,或關閉硬件加速。
![]()
更新日誌
新增:日誌機制。在命令行中啓動 Umi-OCR 可查看實時日誌。指定級別以上
新增:大部分標籤頁能手動切換左右/上下雙欄模式。
新增:Esc鍵隱藏主窗口。
新增:調整二WeiMa生成相關參數後,自動刷新二WeiMa生成。
新增:命令行指令 --reload ,用於重新加載配置文件。
修復:文檔識別提取PDF自帶的文本內容時,未考慮頁面旋轉的影響。
修復:文檔識別生成單層PDF時,未寫入原PDF自帶的文本內容。
修復:OCR結果展示列表的一些顯示Bug和鼠標劃選Bug。
修復:調整標籤頁順序或刪除標籤頁後,未及時保存順序信息。
修復:HTTP接口 /api/doc/download 參數 ignore_blank 的錯誤。
修復:Linux版本截圖時,系統任務欄推移頂層窗口,導致截圖位置偏移。
修復:Linux版本截圖後,主窗口的位置與操作前不一致。
優化:圖片/文檔的異步加載機制。現在可以流暢地加載含有數萬個子文件的文件夾,且能預覽加載進度。
Windows 版本更新第三方依賴庫:PyMuPDF 1.24.11 ,fontTools 4.56.0 ,Pillow 10.4.0 ,psutil 10.4.0 ,pynput 1.8.0 ,zxing-cpp 2.3.0
新增UI語言:俄語 Русский
喜歡我的推薦,歡迎點贊+關注+充電!~這將對我很重要!
往期回顧
太猛了!歪斜圖像智能糾位,漂白去底變成紙質版,精準摳出手寫字
在Windows上使用蘋果macOS 鼠標指針~扁平化,現代感十足!
舒服了!這是我見過最美的書籤側邊欄,果斷替換瀏覽器原版書籤!
PotPlayer播放器皮膚03|現代簡約無邊框~看着就爽!
更多遊戲資訊請關註:電玩幫遊戲資訊專區
電玩幫圖文攻略 www.vgover.com

