最好用的离线ocr(完全免费不用联网)

最好用的离线ocr(完全免费不用联网)(1)

前段时间,微信 PC 端更新了一个 OCR 功能,能识别图片里的文字。

说实话,这应该是微信 10 年来推出的最实用功能之一了。

比如你用微信截图时,只要点击下方的「 识别文字 」,就可以获取截图里的文字。

最好用的离线ocr(完全免费不用联网)(2)

在微信里收到的图片,也支持你直接选取文字复制。

最好用的离线ocr(完全免费不用联网)(3)

除了功能实用,另一方面,微信早已成了电脑上必装软件,微信截图也是很多人默认截图工具。

所以微信 OCR 就好比系统功能一样,无需任何安装成本,以后遇到什么无法复制的文字,调出微信就好。

最好用的离线ocr(完全免费不用联网)(4)

一般来说,微信 OCR 是可以满足大部分人的需求。

但因为功能较基础,在一些特殊情况时,它就显得有点笨了。

比如你有很多文字需要识别,那就得一次次截图再一次次识别,再一次次复制。

或者你要 OCR 一段古诗,文字是纵向且自右向左,那微信识别出的顺序就会乱。

就在最近,世超发现了一款叫 Umi-OCR 的工具( 支持 Win10&11 )。

它的功能很强大,支持你批量识别图片、选择屏蔽区域、指定文字方向,微信能不到的它都能做到。

噢最关键的是,它免费开源,无需安装、无需网络,离线可用。

最好用的离线ocr(完全免费不用联网)(5)

简单给大家演示一下。

假如下面是一段要充钱才能复制的文字,我们点击软件的截图功能,然后把文字框住,0.73 秒后就能获得文字。

因为是本地运行,电脑性能越强,耗时会越短。

最好用的离线ocr(完全免费不用联网)(6)

和微信不同的是,Umi-OCR 自带了一个记录板,每次识别出的文字会出现在记录板,并一直保存。

这就是说,如果你有一堆要识别的文字,就可以像打连狙一样,连续截图。

截完所有的图片,记录板上也已经识别了所有文字。

到这时你再来复制粘贴啥的,会方便很多。

最好用的离线ocr(完全免费不用联网)(7)

当然还有一种情况,你本地里已经存好了所有的图片,那这就更方便了。

Umi-OCR 支持批量识别,如果说刚才是连狙,那么这个功能就是一键加特林。

直接扔几百张图片过去,剩下的交给 Umi-OCR。

最好用的离线ocr(完全免费不用联网)(8)

接着,记录板上就会出现一行行的文字。

与此同时,识别结果还会以 txt 文件保存起来,可以说一条龙服务齐全了。

最好用的离线ocr(完全免费不用联网)(9)

如果你不需要 txt,而是 md、jsonl 的格式,没关系它都支持。

最好用的离线ocr(完全免费不用联网)(10)

除了刚才说的这几项,Umi-OCR 还有一些细节功能,可以照顾到特殊情况。

举个例子,下面这个图你只想要正文里的那一句话,水印等其他无效信息不想要。

最好用的离线ocr(完全免费不用联网)(11)

要是一张图,你截图划一个区域就行了。

但要是有 100 张类似的图呢?

诶,这个软件支持你指定识别区域。

最好用的离线ocr(完全免费不用联网)(12)

只要你导入一张照片,然后选择一些要屏蔽的区域,那接下来所有同分辨率的图片,识别时就会自动屏蔽这些区域。

最好用的离线ocr(完全免费不用联网)(13)

这样批量识别出的结果,就只有我们想要的部分了。

最好用的离线ocr(完全免费不用联网)(14)

另外,Umi-OCR 还可以调整段落化。

什么意思呢,一般 OCR 段落识别是根据行距来的,行与行之间空隙大了,它就会判断为下一段。

最好用的离线ocr(完全免费不用联网)(15)

但如果遇到下面这样的特殊格式,一句话就是一段,距离很近,那 OCR 工具会把它们识别成一句话,合在一起。

比如微信识别出来是这样的。

最好用的离线ocr(完全免费不用联网)(16)

但 Umi-OCR 支持段落优化,不同的段落格式可以选择不同的设置,如单行优化、左对齐、自然段等等。

最好用的离线ocr(完全免费不用联网)(17)

遇到刚才的格式,就可以选择「 优化单行 」。

最好用的离线ocr(完全免费不用联网)(18)

其他的情况也都有对应的选项,下图供参考。

最好用的离线ocr(完全免费不用联网)(19)

最后,Umi-OCR 还支持更改文字识别方向。

比如你要识别一首古诗,只要选择一下「 文字方向为纵向、从右到左 」即可。

最好用的离线ocr(完全免费不用联网)(20)

对了有一点忘了提,除了支持中文、英文识别,通过导入多语言识别扩展包,Umi-OCR 还支持繁中、日、韩、俄、德、法等语言,链接会一起放在文末。

我知道,大家肯定关心它的识别准确率,我只能说表现尚可。

在第一张测试图里,世超就发现捂脸表情被识别成一个,然后少了一个引号和一个句号。

最好用的离线ocr(完全免费不用联网)(21)

小表情识别成文字,这点错误各位应该可以接受,毕竟没多少文章像我们这样,写着写着塞点表情。

引号和句号丢失,我认为无伤大雅。

但除了这几个问题,Umi-OCR 也会识别错文字,比如把「 毕竟 」识别成了「 华竟 」。

最好用的离线ocr(完全免费不用联网)(22)

另外,世超建议各位不要用它识别一些粗体字,效果不太理想。

最好用的离线ocr(完全免费不用联网)(23)

当然,大家也不要因此拒绝使用 Umi-OCR,市面上就没有一家 OCR 工具敢保证 100% 准确率。

像刚才的古诗,Umi-OCR 错了最后一个字,但微信 OCR 识别下来,就没几个对的了。

最好用的离线ocr(完全免费不用联网)(24)

此外,微信 OCR 还会把粗体的 MVP 识别成 MUP。

最好用的离线ocr(完全免费不用联网)(25)

所以说,使用 OCR,不管你用的是哪家,都要做好会遇到识别错误的准备。世超是建议大家每次自己再简单检查一遍。

还是那句话,如果只是偶尔需要 OCR,那还是微信好。

但如果你的需求很大,很特殊,害怕泄露隐私啥的,那这款 Umi-OCR 更适合你。

,

免责声明:本文仅代表文章作者的个人观点,与本站无关。其原创性、真实性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容文字的真实性、完整性和原创性本站不作任何保证或承诺,请读者仅作参考,并自行核实相关内容。文章投诉邮箱:anhduc.ph@yahoo.com

    分享
    投诉
    首页