博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
开源OCR光学字符识别
阅读量:7281 次
发布时间:2019-06-30

本文共 849 字,大约阅读时间需要 2 分钟。

纸张在 许多地方已日益失宠,无纸化办公谈论40多年,办公环境正限制纸山的生成。而过去几年,无纸化办公的概念发生了显着的转变。在计算机软件的帮助 下,包含大量重要管理数据和资讯的文档可以更方便的以电子形式储存。扫描文档的好处不纯粹是存档理由。为了访问基于纸张的信息和将信息整合进数字工作流, 光学字符识别(OCR)技术至关重要。选择正确的OCR工具要基于特定需求而定,例如在线OCR服务对某些人有用,但可能存在隐私问题和文件大小限制。 OCR软件非大众产品,因此开源替代相对于商业级重量级产品相对较少,再加上OCR软件需要先进的算法将扫描的图像正确翻译成实际的文字,而图像不仅仅含 有文字,它还包含布局、图形和表格,可能会跨越多页。

优秀的开源OCR软件包括:

原本由惠普开发的图像识别类库tesseract-ocr已经更新到2.04, 就是最近Google支持的那个OCR。原先是惠普写的,现在Open source了。

Ocropus的(TM)是一个先进的文件分析和OCR系统,采用可插入的布局分析,可插入的字符识别,自然语言统计建模和多语言支持功能。

Cuneiform 是一个 OCR 文字识别系统的商标,最开始是由Cognitive 技术所开发的运行在 Windows 下的软件。而这个项目是该软件在 Linux 系统下的移植版本。

GOCR 是一个开源的OCR光学识别程序。

OCRFeeder 是 GNOME 桌面下的一个开源 OCR 套件。可将纸质或者图形文档转成电子文档。

linux-intelligent-ocr-solution (Lios) 是Linux下一个开源的 OCR 解决方案,可将打印的文档转成可编辑的文本。

转载地址:http://unkjm.baihongyu.com/

你可能感兴趣的文章
MyBatis-多对一查询
查看>>
Virtual PC 2007下虚拟机与本机双XP系统实现互联与上网详解
查看>>
css中display设置为table、table-row、table-cell后的作用及其注意点
查看>>
Domino 8.5 迁移步骤-看图说话
查看>>
Openssl及加密解密(二)openssl
查看>>
个性心理测试
查看>>
Redis集群及管理讲解
查看>>
ps命令详解
查看>>
配置系列:ssm中applicationContext.xml的简单配置
查看>>
nginx启动脚本
查看>>
linux 出现bash: ****: /lib64/ld-linux-x86-64.so.2: bad ELF interpreter: No such file or directory
查看>>
kickstart安装linux
查看>>
蓝色心情win7主题一键安装包 v 2.0
查看>>
MySQL5.7修改密码
查看>>
10个趣味Linux动画命令
查看>>
Linux协议栈(4)——sk_buff及代码
查看>>
DDOS防御
查看>>
python 学习笔记
查看>>
python的property语法的使用
查看>>
Nginx配置文件nginx.conf详解
查看>>