目的
主要想找一个可以OpenCV用的OCR工具包。搜到了tesseract,于是装上了测试一下。
该项目google-code上的网址:https://code.google.com/p/tesseract-ocr/
安装
安装过程参考了https://code.google.com/p/tesseract-ocr/wiki/Compiling
使用
在Ubuntu下,shell中输入:
tesseract -l chi_sim imgpath outfilepath
效果
输入图片:
输出文字:
A2 儡惩认为本级政府的腐败^扩青况与5年前相伫匕是
a. 更严宣宣
xb扩有改善
C. 变儡匕′交大
比想象要差。