データ入力とは?AI-OCRによるデータ化との違いについても解説
電子化が進みペーパーレスな世の中になってきていますが、紙文化が根強い日本では、まだ紙ベースのまま重要な情報が保管されていることが多いです。その中で、顧客情報や統計・分析に必要な情報が紙に記載されていてデータ化する必要がある際に、AI-OCRの導入によって従業員の負荷軽減、業務効率化を実現しようとする企業が増えてきています。AI-OCRとは、機械学習を特徴とした光学文字認識機能を備えるツールのことです。人間の代わりに紙の文字などをデータ化してくれる非常に便利な存在かと思われますが、導入してみても期待どおりの効果が得られないといった声もインターネット上では見受けられます。
このAI-OCRですが、読み取る書類の特徴によって人間と同じく得手不得手があるのをご存知でしょうか。書類によっては、AI-OCRを導入した運用方法よりも、データ入力技術を有する専門業者へ委託した方がデータ化の精度を高め、かつ、低コストで書類に記載された情報をデータ化できるケースがあります。
本稿では、データ入力について詳しく説明したうえでAI-OCRに向いている書類とデータ入力に向いている書類の違いについてと、外部委託時のポイントや弊社の実績についてお伝えいたします。
BPO導入ガイドや、委託先選定に便利なチェックシート配布中!
資料をお求めの方はこちら
データ入力とは
ここでのデータ入力とは、一般的なPCとキーボードを用いたローマ字変換による文章入力ではなく、専門知識を持つオペレーターが入力専用機を用いて書類の文字や数字をデータ化することを指します。専門知識や入力専用機とは何かについて皆様に理解していただくためにも、一例として弊社のデータ入力の特徴についてご紹介いたします。
データ入力の特徴①エントリー&ベリファイ方式
特徴の1つ目として、エントリー&ベリファイ方式があります。エントリー&ベリファイ方式とは2名体制で入力を行い、高精度なデータを作成する方式です。1人目のオペレーターが書類を見ながら文字データを入力し、2人目のオペレーターが、同じ書類を見ながら1人目と同様に入力を行います。1人目と2人目のオペレーターの入力内容が全く同じであれば入力が完了しますが、一文字でも異なった場合には、その時点でエラー音が鳴り、正しく入力を行わなければ以降の文字を入力することができません。これにより高い精度が実現できます。
この方式だとエラーがどこで生じたかがすぐにわかるので、読み取り後のデータに対して目視検査を行う一般的なAI-OCRの方式よりもチェックにおいては効率的であると言えます。
データ入力の特徴②連想入力
連想入力とは、漢字を効率的に入力することを目的に作られた入力方法です。すべての漢字1字に対し、2つのカナ文字が対応づけられています。2つのカナ文字を入力することで、自動的に漢字1文字が表示されます。「連想」とはオペレーターが記憶し易いように、2つのカナから「読み」「形」「意味」などを通して該当の漢字を連想できるようにされています。
例えば、「車」という漢字1文字を入力したい場合、一般的なローマ字入力だと「kuruma」と入力した後に漢字変換が必要となり、7タッチ(キーを打つ回数)以上の入力が必要です。しかし連想入力であれば、「カ」、「ア」(英語のcarという読み方から連想)と連想コードを入力すれば自動的に「車」という漢字が出てきます。結果的に2タッチの入力で必要な漢字を出せるので、はるかに効率的です。
具体例として以下の内容が記載されたキャンペーンなどの応募はがきを入力する場合
一般的なPC入力であれば約150タッチかかりますが、連想入力による入力であれば約90タッチと40%ほど手間の削減が可能です。
連想入力について理解を深めていただくためにも、【連想入力クイズ】をご用意いたしました。
Q. 以下の連想コードではどんな漢字が出力されるでしょうか。
連想入力による入力のメリットは、タッチ数の削減だけではありません。PC入力と比較すると大きなメリットがあります。それは、変換候補の選択が不要であることです。入力ミスのひとつである誤変換が生じない仕組みとなっているので、効率的で高品質なデータ入力を実現します。
さらに、書類ごとに正しく入力されているかをチェックするプログラムを構築するため、より精度を高めています。
▶プログラムチェックの例
①入力必須項目が未入力であった場合エラーとなる
②郵便番号の入力項目において7桁以外だった場合エラーとなる
③電話番号の入力項目において数字以外が入力されていた場合エラーとなる
データ入力の特徴について理解は深まりましたでしょうか。次にどういった書類がデータ入力に向いているのかについて、注目度が高まっているAI-OCRにおける書類の向き不向きという特徴を明らかにしたうえで説明いたします。
AI-OCRにおける書類の向き不向き
冒頭文でお伝えしたとおり、書類に記載されている手書き文字などを自動的に読み取ってデータ化するAI-OCRには書類の特徴によって向き不向きがあります。具体的には、以下の表のように分けられます。
予防接種に必要な予診票や企業が自治体に提出する給与支払報告書など、書類のフォーマットの種類が少ない定型帳票や、一つ一つの種類ごとに大量の枚数が発生するものがAI-OCRには向いています。フォーマットを1~3種類ほどAI-OCRに登録するだけで何千枚、何万枚の書類を一気に処理することができれば大幅な効率化が見込めるでしょう。
逆に、契約書などフォーマットの種類が多く一つ一つの枚数が少ないものは向いていません。できないことはありませんが、一般的なAI-OCRですと事前に帳票ごとのフォーマットを登録する必要があるため、種類が複数あるフォーマットを登録して処理件数が少量だったとすれば、それはあまり効率的とは言えません。
加えて、フォーマットとして登録した範囲外に記入された文字は読み取りが難しいのでAI-OCRに不向きと言えます。しかし、アンケートの回答者やキャンペーンの応募者からの意見を収集したいという場合もあります。そのような場合には範囲外に記入された文字も高い精度でデータ化する必要があるということです。
このように、AI-OCRには向き不向きがあります。書類の特徴によってはAI-OCRを導入するのではなく、専門業者へ委託することで社内負荷が軽減される可能性があります。
セキュリティの重要性
データ化が必要な書類に機密情報や個人情報が記載されている場合は、セキュリティに対して注意が必要です。AI-OCRにはさまざまな種類がございますが、クラウド型のAI-OCRは不正アクセスによる情報漏洩などのリスクがあるため、「サービス利用するパスワードを複雑にする」、「VPNで接続できるクラウド型AI-OCRを選択する」といったセキュリティ対策をとる必要があります。総務省による「安心してインターネットを使うために 国民のためのサイバーセキュリティサイト」にも、クラウドサービスの利用については注意喚起がされております。
一方で専門業者によるデータ入力を活用する場合は、プライバシーマークを取得していたり、ISMS(Information Security Management System=情報セキュリティマネージメントシステム)を導入している企業であれば安心して委託できると期待できます。具体的な対策まで気になる場合は、インターネットに非接続なネットワーク環境となっているか、防犯カメラが設置されているかなど、情報セキュリティの観点で納得できる環境であるかまで調べると良いでしょう。
(参照:プライバシーマーク「一般社団法人 日本情報経済社会推進協会」)
(参照:ISMS「一般社団法人情報マネジメントシステム認定センター」)
データ入力業者を選定する際のポイント
データ入力のサービスを利用する際のチェックポイント3点を下記に記載いたしました。
①品質保証の体制はどうか
この点を抜きにしたまま手書き書類などのデータ化を委託して、社内の負担がようやく軽減された……と安心するのは危険です。いざ入力されたデータを確認すると書類と異なる文字データが入力されていたり、事前に決めていた仕様と異なっているなどのケースが想定されます。結果的に委託費用だけかさんでしまい、修正の負担が社内に生じるとなると本末転倒です。
委託業者によって入力されたデータに誤りがないかを確認する品質保証の体制や方法は異なりますので、説明を求めたうえで納得できる委託業者を選びましょう。書類のサンプルを提供して本格的に委託する前にテスト入力を依頼するのも良い手段です。
②データ作成にかかる時間はどれくらいか
急な納期でのデータ化が求められる書類の場合、委託業者による納期遅延が生じてしまうとその後の工程に悪影響が及んでしまいます。委託化に向けたやり取りの中で、実現可能なスケジュール構築や調整をしてくれる委託業者であれば心強いです。イレギュラーが起きても解決できる盤石な入力体制であるかも確認すると良いでしょう。
③類似の業務実績があるか
データ化を予定している書類のサンプルを共有し、委託業者に類似の実績があるか確認してみましょう。過去の対応実績からデータ化するにあたっての想定されるリスクや改善策などが共有されることが多いです。
他にも委託業者を選ぶ際の注意点として、確認が必要な事項を「委託業者選定チェックポイントリスト」としてまとめていますので、ぜひご覧ください。
弊社におけるデータ入力実績
弊社はさまざまな業界・業種のお客様よりデータ入力のご相談を頂いており、規模の大小や入稿頻度、数量なども問わず実績がございます。一部をご紹介します。
弊社はプライバシーマーク・ISMSを取得しており、個人情報の取り扱いが生じる案件であれば、厳重なセキュリティ便やウイルスチェック、データ暗号化、誤送信対策などがされたファイル送受信サービスの活用といったセキュリティ対策を講じておりますのでご安心ください。お客様のご要望を叶えるデータ入力をご提案します。
まとめ
AI-OCRとデータ入力について理解を深めることができましたでしょうか。書類のデータ化についてお困りの際は、ぜひ1度「AI-OCRを活用した運用方法」と「データ入力業者への外部委託」とでコストや業務の負担、品質といったあらゆる観点から比較を行いましょう。弊社にご相談いただければ、データ化のみならず、書類の不備確認を目的とした架電業務や、データ入力後の集計や分析など、前後で付随する業務を提案することも可能です。昭和57年設立当初より、40年間データ入力業務に携わってきた歴史をもつ弊社国和システムが、誠心誠意ご対応させていただきますので、お気軽にお問い合わせくださいませ。
【連想入力クイズ】の答え
①「ミ・ラ」⇒鏡(英語のmirrorという読み方から連想)
②「ス・ネ」⇒息(息子による脛かじりから連想)
③「イ・ヒ」⇒化(対象となるカタカナ同士の組み合わせから連想)
▼こちらの記事も参考にご覧ください
キャンペーン事務局をどのように利用すれば良いのか気になりますよね。本記事では、キャンペーン事務局の概要や外部委託するメリット、実施するために必要な工程をご紹介いたします。
新型コロナウイルスの感染が広がる社会状況の中で、さらに大きな注目を浴びるようになったコンタクトセンター。その役割や委託業者の選定ポイントを解説いたします。