業務効率化のためのAI-OCR活用術

前回の「中小企業の生産性を高めるRPAとは?仕組みと導入準備をわかりやすく解説」では、メールで送付された注文書(PDF)を特定のフォルダに自動保存する仕組みを、Power Automateで構築する方法を紹介しました。

今回はその続きとして、保存された注文書の内容をOCR(光学文字認識)で読み取り、注文情報を表形式でデータ化する方法について解説します。

まずはAI-OCRの代表的な実現方法を整理し、次にその中から無料で試せる手法として、Google Vision APIを使った実演を行います。

AI-OCRの実現方法とは?

AI-OCR製品は数多く提供されており、以下のページが比較に非常に役立ちます。

👉【2025・比較表あり】AI OCRおすすめ39選!価格相場や選定ポイントを解説
https://digi-mado.jp/category/business/ai-ocr/

このページから読み取れる製品の分類軸としては、以下の6つが挙げられます:

  1. 対応帳票の種類:定型帳票、準定型帳票、非定型帳票に対応できるかどうか
  2. 文字認識の精度と対応文字種:手書き文字、活字、縦書き、他言語への対応
  3. 導入形態:クラウド型/オンプレミス型/ハイブリッド型
  4. 連携機能:RPA・API連携、ExcelやPDFへの出力など
  5. 価格体系:初期費用、月額費用、従量課金の有無
  6. サポート体制:導入支援やトライアルの有無

業務の生産性を向上させる観点で重要なのは、特に以下の2点かと思います。

 1.対応帳票の種類:様々な形式の帳票を扱う業務では、柔軟に対応できる製品の選定が不可欠です。

 2.文字認識精度:手書き帳票が多い現場では、AI-OCRの認識精度が結果を左右します。

下図は、以前にテクノロジーの活用レベルを整理した際のモデルです。今回取り上げるAI-OCRは、その中でも最上位の高度な処理領域に位置づけています。

とはいえ、AI-OCRを実現する手段は一つではない。汎用的なツールを組み合わせて構築することも十分可能である。たとえば、ChatGPTを用いてOCR後のテキストを構造化する方法や、MicrosoftのAI BuilderとPower Automateを組み合わせて自動処理を構築する方法などがあるでしょう。

今回はその中でも比較的精度が高いとされる Google Cloud Vision API を活用し、実践的にAI-OCR処理を構築してみることにします。

今回の実践シナリオ

企業の販売管理システムと連携して「メールで受け取った注文書(PDF)を自動でシステムに取り込む」ことができれば、大幅な人手削減になります。

今回はその一部として、PDFを指定フォルダに保存したあとにPDFデータをOCRで読み込んでデータ化するまでの白い部分を対象とします。今回は行いませんが、この処理も定期的に実行しておけば良いと思います。

※メール添付発注書を保存に関しては以前の記事を参照ください

OCR処理の結果(Vision API使用)

Google Cloud Vision APIをPythonから呼び出して、以下の発注書に対してOCR処理を実行しました。


結果として返ってきた生のテキストは以下のようなものです。レイアウト情報がなく、文字の情報だけ抜き出してきた形になっています。


python-replコピーする編集する発注書
ROUTE33 Business Partner合同会社
発注No.
101
発行日
2025年5月12日
...
E-Mail: daigo@aiseki.co.jp
担当: 千鳥大悟
...
数量 単位
単価
金額
2個
¥2,000
¥4,000
20 個
¥1,000
¥20,000
...

最終的に目指したのは、以下のような表形式のデータ(発注日、発注番号、発注先、担当者、E-Mail、No、項目、数量、単位、単価、金額)を作成することでした。

そのため、プログラム内でOCRによって取得したテキストデータに対して、各データがどの項目に該当するかを判断するルールを定義し、整形する方式を採用しました。

多少手間はかかりましたが、結果として以下のような整ったデータを生成することができました。

ここまで処理が進めば、あとは販売管理システムにデータを取り込むだけで、一連の作業は完了となります。
出力された文字データを見ても、特に問題なく変換されていることが確認できるでしょう。

今回は印刷された帳票を使用したため、文字認識に大きな誤りは見られませんでした。
しかし、「手書きだった場合にどうなるのか?」という疑問もあるかと思います。
そこで、筆者が実際に手書きで記入した発注書を用いて、同様の処理を行った場合の検証も試みました。

結果は以下の通りです。なぜか「いか」の注文情報は正しく取り込まれた一方で、「まぐろ」の注文情報はうまく認識されず、データ化されませんでした。もう少しルール化の処理を見直す必要がありそうです。

とはいえ、「いか」の注文については数量・単価・金額まで含めて正確に読み込めていることが確認できました。この結果から、手書きであっても条件次第では十分に実用可能であることがわかります。

まとめ:AI-OCRで業務効率化を現実にするために

今回は、注文書PDFを対象に Google Cloud Vision APIを活用してAI-OCR処理を行い、構造化データとして出力する実践例を紹介しました。その結果、以下のポイントが明確になりました。


✅ ポイント整理

  • Vision APIの活用により、PDFから高精度に文字認識が可能
    • 特に定型帳票であれば、構造化もルールベースで十分対応可能
  • 汎用ツール(Python・Colab・GASなど)を使えば、無料で業務に組み込める
    • 高価なAI-OCR専用ソフトを使わなくても実現できる
  • 手書き帳票でもある程度の精度が期待できる
    • 全件対応は難しいが、条件付きで実用レベルに届くことを確認

🧭 今後に向けて

  • 受注・請求・経費精算など、定型帳票が多い業務はAI-OCRの効果が非常に高い
  • 自社の帳票に合わせてテンプレート処理を加えることで、さらに精度と効率が向上
  • Vision APIを活用した処理は、GASやColabにより自動化・定期実行も可能

業務のデジタル化・自動化を進めたい中小企業にとって、AI-OCRは今すぐにでも取り入れられる強力な武器です。
まずは一部の帳票から、手作業の削減にチャレンジしてみることをおすすめします。

やってみると結構はまるものです。。このような取り組みを行う際にはぜひご相談ください。

コメント