[調査・レポート]

神奈川県、手書き帳票をAI-OCRで読み取る実証実験を終了、正読率は93.4%、処理時間は25%減

2020年1月31日(金)日川 佳三(IT Leaders編集部)

神奈川県は2020年1月31日、手書き文字をデジタルデータに変換する「AI-OCR」の実証実験を終えたと発表した。正読率の平均は93.4%と高かった。スピードは、100枚を処理した場合、手作業と比べて約75%の時間でデジタル化できた。

 神奈川県は、手書き文字をデジタルデータに変換する「AI-OCR」の実証実験を、2019年10月31日から2019年12月16日まで実施した。3つの帳票(7様式)を対象に、正確性、迅速性、継続性、操作性の4つの観点で検証した(表1)。実験は、インターネットイニシアティブ(IIJ)とIIJエンジニアリングが協力した。

表1:AI-OCRの検証結果(出典:神奈川県)
検証項目 検証結果
正確性 3帳票の正読率の平均は93.4%と高かったが、人間でも判読困難な文字が多く含まれていた帳票の正読率は大幅に低下した
迅速性 100枚を処理した場合、手作業と比較し、約75%の時間で手書き文字をデジタル化できた(1000枚を処理した場合、約60%の時間でデジタル化できた)
継続性 24時間365日の処理が可能で、複数の帳票を同時に処理することも可能だが、使用時間帯は県のIT環境のメンテナンスなどを考慮する必要あり
操作性 職員アンケートの平均は5点満点中3.2点、読取結果については高評価

 実証実験の対象として、手書き文字が記入されており、なおかつ未公開の個人情報などが含まれていない帳票を3つ選定した。具体的には、「政治資金収支報告書」(5様式)、「漁獲量に関する送り状」(1様式)、「かながわの水源地域キャンペーンアンケート」(1様式)の3種類である。

 正確性(手書き文字を正確に読み取ったか)については、3帳票(7様式)の平均で、正読率が93.44%となった。「政治資金収支報告書」(5様式、170枚)の正読率は、5様式の平均で96.93%だった。「漁獲量に関する送り状」(1様式、10枚)の正読率は、68.04%だった。「かながわの水源地域キャンペーンアンケート」(1様式、100枚)の正読率は、93.44%だった。

 「漁獲量に関する送り状」の正読率が低い理由は、水揚現場で記入された文字のため、職員の目視によっても判読が困難だったことである。

 正確性に関する課題と対応策はこうだ。読取部分の付近に文字や記号が印字されているとAI-OCRが誤認識するので、読取部分と文字との間に十分に余白を設けた帳票設計をする必要がある。また、帳票の所定の枠から文字がはみ出るケースや、任意で記載した「¥」まで読み取ってしまうケースがあったので、記入者への分かりやすい注意喚起が必要になる。

 迅速性(手作業より迅速に処理できたか)については、「かながわの水源地域キャンペーンアンケート」を、AI-OCRと手作業でそれぞれ30枚分を処理した時間を計測し、1枚あたりの時間を算出した。これを100枚分の時間に換算して比べた結果、手作業では93分を要したが、AI-OCRでは70分となり、23分短縮できた。約75%の作業時間で済んだ。

 迅速性に関する課題と対応策はこうだ。AI-OCRの読取処理の速さ自体は、100枚の帳票の処理を5分で終える速いものである。しかし、正読率が低い帳票の場合は、その後の修正作業に時間を取られてしまう。このため、迅速性のメリットを損なわない帳票設計をする必要がある。

関連キーワード

神奈川県 / AI-OCR

関連記事

Special

-PR-

神奈川県、手書き帳票をAI-OCRで読み取る実証実験を終了、正読率は93.4%、処理時間は25%減神奈川県は2020年1月31日、手書き文字をデジタルデータに変換する「AI-OCR」の実証実験を終えたと発表した。正読率の平均は93.4%と高かった。スピードは、100枚を処理した場合、手作業と比べて約75%の時間でデジタル化できた。

PAGE TOP