AIを導入・運用・実装するときの3段階のうち、PaaS(Software as a Service)を導入する場合について、一般に9つのサブプロセス(❶データの取得→❷データの蓄積→❸データの確認→❹教師データの作成→❺モデルの設計→❻学習→❼デプロイ→❽推論→❾再学習)がありますが、そのうちの最初の❶データの取得~❸データの確認までをご紹介します。まずは❶データを取得し、❷蓄積します。この場合、「どんなデータを取るか」が最も重要な点です。たとえば、クルマの車種判定をしたければ、車種のデータがないと始まりません。ファッションの判定をしたければ、服の種類、デザイン、色柄、生地などのデータがないと判定できません。動物の判定をしたければ、当然、識別したいすべての種類の動物のデータが入力されていないと意味をなしません。その後に、❸データの確認です。これは、意外に引っかかる企業が多いので、要注意です。「このデータフォーマッ卜で送ってください」と事前に細かく打ち合わせて確認をしておいても、なぜか違ったフォーマットでデータを送ってくるケースがあります。異なるフォーマッ卜のデータが送られてくると、どうなるか。データをすべて確認する作業が必要になります。AI企業にとっては時間のムダ、顧客側にとってはお金のムダになりますので、そうならないためにも、「データ確認」というプロセスが重要です。ここではデータフォーマットだけでなく、欠損データの確認も行ないます。(1)データフォーマッ卜の確認(たとえばUTF-8の文字コードのcsv形式のデータなど)。(2 ) データのクレンジング (データ欠損を補う、異常値の取り除き)