【前言】
大家在使用PDF资料时应该都有过类似的经历吧:文件里的文字是图片类型的,不能自由复制和编辑,或者在进行PDF转Word时出现文档格式错乱的问题,今天这款OCR工具就能帮你解决这个问题。
Umi-OCR是免费开源的离线OCR软件,支持Windows10/11,可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。含中英识别库,支持多国语言扩展包。
【软件特点】
免费:本项目所有代码开源,完全免费。
方便:解压即用,离线运行,无需网络。
批量:可批量导入处理图片,结果保存到本地多种格式文件。也可以即时截屏识别。
高效:采用识别引擎。只要电脑性能足够,通常比在线OCR服务更快。
精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。
【软件截图】
软件截图
【功能展示】
截图OCR
截图OCR
打开这一页后,就可以用快捷键唤起截图,识别图中的文字。比QQ的识别屏幕好用很多,准确率也高很多。左侧的图片预览栏,可直接用鼠标划选复制。右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。也支持在别处复制图片,粘贴到Umi-OCR进行识别。
文本后处理
文本后处理
可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:
多栏-按自然段换行:适合大部分情景,自动识别多栏布局,按自然段规则进行换行。
多栏-总是换行:每段语句都进行换行。
多栏-无换行:强制将所有语句合并到同一行。
单栏-按自然段换行/总是换行/无换行:与上述类似,不过 不区分多栏布局。
单栏-保留缩进:适用于解析代码截图,保留行首缩进和行中空格。
不做处理:OCR引擎的原始输出,默认每段语句都进行换行。
上述方案,均能自动处理横排和竖排(从右到左)的排版。(竖排文字还需要OCR引擎本身支持)
批量OCR
批量OCR
支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。
保存识别结果的支持格式:txt, jsonl, md, csv(Excel)。
与截图OCR一样,支持文本后处理功能,整理OCR文本的排版和顺序。
没有数量上限,可一次性导入几百张图片进行任务。
支持任务完成后自动关机/待机。
如果要识别像素超大的长图或大图,请调整:页面的设置→文字识别→限制图像边长→【调高数值】。
拥有特殊功能 忽略区域 。
以上只是列举了一些比较常用的功能,软件很有很多实用的功能,真的强烈推荐!
【下载地址】
「Umi-OCR PDF一键识别文字」
https://pan.quark.cn/s/c67ffc441c25
长按可以复制
感谢大家的点赞和收藏支持,我会持续为大家推荐好用好玩实用的软件分享,欢迎关注我。
更多游戏资讯请关注:电玩帮游戏资讯专区
电玩帮图文攻略 www.vgover.com