2011年9月7日 星期三

Tesseract OCR

在 linux 上可用的 ocr 軟體。

ref: http://superhbin.pixnet.net/blog/post/28743913-google-code%E5%B0%8B%E5%AF%B6-1.tesseract-ocr

需要將圖檔轉成 tif 格式。

r 在轉為文字檔時, 會存在 r.txt 這檔案。 -l eng 表示轉成英文。
tesseract IMGA0784.tif r -l eng

辨識英文效果還不錯。

沒有留言:

張貼留言

使用 google 的 reCAPTCHA 驗證碼, 總算可以輕鬆留言了。

我實在受不了 spam 了, 又不想讓大家的眼睛花掉, 只好放棄匿名留言。這是沒辦法中的辦法了。留言的朋友需要有 google 帳號。