关于tesseract

目的

主要想找一个可以OpenCV用的OCR工具包。搜到了tesseract,于是装上了测试一下。
该项目google-code上的网址:https://code.google.com/p/tesseract-ocr/

安装

安装过程参考了https://code.google.com/p/tesseract-ocr/wiki/Compiling

使用

在Ubuntu下,shell中输入:

tesseract -l chi_sim imgpath outfilepath

效果

输入图片:

输出文字:

A2 儡惩认为本级政府的腐败^扩青况与5年前相伫匕是
a. 更严宣宣
xb扩有改善
C. 变儡匕′交大

比想象要差。

很久没有更新网站,发现多了不少评论和问题,无法一一回复,如果现在仍有问题请再次留言 :) 2016.03.29