CSharp - C# 自定义 OCR,返回格式化字符串

  显示原文与译文双语对照的内容
0 0

对于我的个人兴趣,我从我的研究中看到,它是 NOT 容易启动你自己的OCR 。 然而,我想听一些关于如何实现 NOT的挑战的想法,只是识别字符,同时还给出格式化字符串中的结果。 例如我有一个表( 想象一下它是一个"|"还有"_"被画成直线)的图像:


|Number,AnotherNumber|Some文本|


|1,4 |Blah |


在使用静默的OCR之后,我得到了"|number,AnotherNumber|SomeText|n|1,4|Blah|"的任何想法的结果,以及我可以使用的工具/库。 我还想用 Visual Studio 2010在 C# 中写这个。 理想的做法是使用pdf但不同的图像格式很好。 我已经查看过一些,但是它们看起来不兼容,因为它们使用 C++ 或者C 。 谢谢你。Alina 。

时间: 原作者:

0 0

ocr libaries是很难( 当然,如果你不为它付费) 你可以试试这个,不是免费的,但如果你有 Office 2007: http://www.codeproject.com/Articles/41709/How-To-Use-Office-2007-OCR-Using-C

原作者:
...