免费开源的PC端扫描软件!离线OCR识别、批量识别、水印去除

【前言】

大家在使用PDF资料时应该都有过类似的经历吧:文件里的文字是图片类型的,不能自由复制和编辑,或者在进行PDF转Word时出现文档格式错乱的问题,今天这款OCR工具就能帮你解决这个问题。

Umi-OCR是免费开源的离线OCR软件,支持Windows10/11,可以批量识别普通图片并识别文字内容导出,以及还有支持忽略指定区域的特殊功能,例如可以屏蔽掉视频右上角水印和游戏的 UI 内容。含中英识别库,支持多国语言扩展包。

【软件特点】

免费:本项目所有代码开源,完全免费。

方便:解压即用,离线运行,无需网络。

批量:可批量导入处理图片,结果保存到本地多种格式文件。也可以即时截屏识别。

高效:采用识别引擎。只要电脑性能足够,通常比在线OCR服务更快。

精准:默认使用PPOCR-v3模型库。除了能准确辨认常规文字,对手写、方向不正、杂乱背景等情景也有不错的识别率。可设置忽略区域排除水印、设置文块后处理合并排版段落,得到规整的文本。

【软件截图】

软件截图

【功能展示】

截图OCR

截图OCR

打开这一页后,就可以用快捷键唤起截图,识别图中的文字。比QQ的识别屏幕好用很多,准确率也高很多。左侧的图片预览栏,可直接用鼠标划选复制。右侧的识别记录栏,可以编辑文字,允许划选多个记录复制。也支持在别处复制图片,粘贴到Umi-OCR进行识别。

文本后处理

文本后处理

可以整理OCR结果的排版和顺序,使文本更适合阅读和使用。预设方案:

  • 多栏-按自然段换行:适合大部分情景,自动识别多栏布局,按自然段规则进行换行。

  • 多栏-总是换行:每段语句都进行换行。

  • 多栏-无换行:强制将所有语句合并到同一行。

  • 单栏-按自然段换行/总是换行/无换行:与上述类似,不过 不区分多栏布局。

  • 单栏-保留缩进:适用于解析代码截图,保留行首缩进和行中空格。

  • 不做处理:OCR引擎的原始输出,默认每段语句都进行换行。

上述方案,均能自动处理横排和竖排(从右到左)的排版。(竖排文字还需要OCR引擎本身支持)

批量OCR

批量OCR

  • 支持格式:jpg, jpe, jpeg, jfif, png, webp, bmp, tif, tiff。

  • 保存识别结果的支持格式:txt, jsonl, md, csv(Excel)。

  • 与截图OCR一样,支持文本后处理功能,整理OCR文本的排版和顺序。

  • 没有数量上限,可一次性导入几百张图片进行任务。

  • 支持任务完成后自动关机/待机。

  • 如果要识别像素超大的长图或大图,请调整:页面的设置→文字识别→限制图像边长→【调高数值】

  • 拥有特殊功能 忽略区域 。


以上只是列举了一些比较常用的功能,软件很有很多实用的功能,真的强烈推荐!


【下载地址】

「Umi-OCR PDF一键识别文字」

https://pan.quark.cn/s/c67ffc441c25

长按可以复制


感谢大家的点赞和收藏支持,我会持续为大家推荐好用好玩实用的软件分享,欢迎关注我。

更多游戏资讯请关注:电玩帮游戏资讯专区

电玩帮图文攻略 www.vgover.com