最近、LLMへのRAGを用いた文書データの連携等を目的に海外を中心にOCRや文書画像解析技術に関連する新しいサービスが活発にリリースされています。 しかし、その多くは日本語をメインターゲットに開発されているわけではありません。日本語文書は ...
Tesseract OCRの「easyocr」というライブラリを用いて、画像(PNG形式)の文字抽出を今回はやっていく知識のシェアです。 最近MENTAで学んだことをとりまとめました。 今回のテーマ ①コマンドプロンプトやVSCODEでの設定方法 ②画像から文字抽出して、ExcelのCSV ...
翔泳社では、「独習」「徹底入門」「スラスラわかる」「絵で見てわかる」「一年生」などの人気シリーズをはじめ、言語や開発手法、最新技術を解説した書籍を多数手がけています。プロジェクトマネジメントやチームビルティングといった管理職向けの ...