データ分析と機械学習・人工知能モデルの関係性

データ分析と機械学習・人工知能は、密接に関係しています。「データがあれば人工知能を使って何かができる」というわけではありません。機械学習・人工知能を活用する際には、活用するための「データの集め方・分析の仕方」があり、正しい手順を踏まないと、効果的なモデル構築や活用までは到達できません。

機械学習・人工知能モデルの多くは、教師データ(学習データ)を必要とします。例えば、最も古典的なモデル構築例の一つに、「手書き文字認識」というものがあります。これは、0-9までの10種類の手書き文字画像を集めたサンプルデータです。画像をモデルに入れて、その画像の数字が0-9のどれが書いてあるかを当てる、というものです。

この場合は、「この画像は0である」「この画像は1である」というような、正解がついた画像データをもとに機械学習・人工知能モデルが「学習」を行う必要があります。その上で、「学習」したモデルがどの程度の精度が出るか、を検証します。

一部例外として、強化学習のように、学習モデルが試行錯誤を繰り返しながらベストな人工知能モデルを導き出す(ベストなパラメータを計算する)というモデルも存在します。この場合でも、何をモデルへ投入し、何を得るのか、つまり人工知能モデルのInput変数とOutput変数として何を選ぶのか、学習方法はどうするのか、などのモデル構築のための設計をする必要があります。

機械学習・人工知能モデル構築までのステップ

機械学習・人工知能モデルを構築する際には、以下のようにモデル活用までの設計をする必要があります。

①問いを立てる:機械学習・人工知能モデルで「何をしたいか」を明確化します。実際にモデルで推定したいもの(目的変数)を明らかにします。
②モデル構築方法を設計する:①で明らかにした「推定したいもの(目的変数)」を当てるために、どのようなデータを使い、モデルを構築するかを決めます。
③分析をする:②のデータで目的変数が実際に当てられそうか、概ねのあたりをつけます。モデル構築には時間と手間がかかるので、手戻りを防ぐために行います。
④モデルを構築する:実際に複数のモデル構築を試します。場合によっては、計算に時間がかかるフェーズです。
⑤試運用を行う:精度が確認できたら、段階的に運用に取り込んでいきます。問題がなければ、適用範囲を徐々に拡大します。

実際、こうした機械学習・人工知能モデル活用の全体設計を行い、ディレクションを取ることができる人材は、まだ多くないのが実情です。一部データ活用や人工知能活用が進んでいる企業では、データサイエンティスト、あるいはデータ分析や人工知能モデルを理解している方が全体の段取りを仕切っていますが、一部企業には「自社にもデータがあるから、人工知能モデルを使えば何かできるのではないか」という程度の理解の方も多いです。

人工知能や機械学習は、やみくもにデータを突っ込めば何かでる、というものではありません。無理ない現実的な目的を設定し、段階的に人工知能活用を進めていくことが必要です。

弊社では、機械学習・人工知能モデルの構築に関するコンサルティングも行っています。コンサルティングの具体的な内容については、「データ分析・人工知能活用コンサルティングの進め方」に、一部実例も交えながら進め方を記載しています。また、より一般的なデータ分析の進め方については、「データ分析とは」にも掲載していますので、併せてお読みください。



弊社では、データ分析や人工知能の活用に関するお問合せを随時受付けております。
弊社へのお問合せは info _at_ datastrategy.jp までお願いいたします。

Comments are closed.