メディア研究開発センターの倉井です。 最近Tesseractを使ってOCRをしたいことがあったのですが、新たにフォントを学習させたい場合など、いくつか初見では難しい設定をする必要があったので、備忘録的に残したいと思います。 合わせて元の画像のノイズ ...
ここに渡すtesseract_layoutの種類についてちゃんと確認します。 適当に設定してたら全然読み取り精度出ないんだもん。 で、コマンドの一覧が出てきます。 その中の、「Page segmentation modes:」の部分がtesseract_layoutの引数に該当します。 0 オリエンテーションと ...
一部の結果でアクセス不可の可能性があるため、非表示になっています。
アクセス不可の結果を表示する