docker_ocr_appの動作説明

 

目次


 

はじめに


i-PROカメラアプリケーション開発環境の構築が完成していることを前提に説明します。
開発環境の構築が準備できていない場合、こちらを参考に完成させてください。

また、このチュートリアルではSDKのインストールディレクトリを${SDK_DIR}として記載します。

 

動作概要


docker_ocr_appはカメラが撮影した映像から文字を読み取り、読み取った文字を表示するサンプルアプリです。

 

動作に必要な外部ライブラリ


C/C++でビルドする場合は下記が必要ですが、Dockerイメージをビルドする過程で自動でインストールされます。サンプルアプリに含まれる Dockerfile.azureIoT ファイルをご参照ください。

tesseract

 

サンプルアプリのディレクトリパス


C/C++のソースコードは下記に格納されています。

${SDK_DIR}/src/adamapp/docker_ocr_app

Pythonのソースコードはありません。

 

サンプルアプリのビルド方法(C/C++)


C/C++でビルドする場合はこちらを参照してください。

 

サンプルアプリの使用方法


アプリのインストールはAzure Portalから行います。詳細は をご参照ください。

動作確認の方法は、 を参照ください。

 

下記のように、アプリを起動した際にカメラが撮影した画像に文字が入るようにします

20240306-171400.png

文字認識に成功すると下記のように認識した文字が表示されます。

20240306-171401.png

文字認識の精度が低いため、環境に依存して文字を読み取れない場合があります。
文字のフォントやサイズを変更して試してください。

 

補足情報


・設定の変更

このアプリケーションには、ユーザーが変更できるいくつかの設定があります。
以下は、ユーザーが現在変更できる設定のリストです。

Resoultion:
JPEG 画像を取得するための解像度。
"160x90", "320x180", "640x360", "1280x720", "1920x1080", "2560x1440", "3840x2160", "160x120", "320x240", "400x300", "640x480", "800x600", "1280x960", "1600x1200", "2048x1536", "2560x1920", "4000x3000", "320x320", "640x640", "1280x1280", "2192x2192", "2992x2992"
ただし、カメラの性能によっては指定した値で動作しない場合があります。

Frame rate:
JPEG画像にエンコードされたYC(YUV)画像を取得するためのフレームレート。 1以上を指定してください。 ただし、カメラの性能によっては指定された値で動作しない場合があります。