こんにちはシバタアキラです。つい先日、DataRobotの第四回ユーザー会を開催しました。回を重ねるごとに参加者の人数が倍々に増え、今回は200人ものユーザーさんにご参加頂くことが出来ました。残念ながら、その内容は来ていただいた方の間だけでのご共有ということでお話頂いたので、ここでは公開できないのですが、金融、製造、医療、メディア等幅広い種類のお客さんが各社での導入事例を紹介してくれました。
各ユーザーさんのあまりに進んだ事例に、参加している誰もがものすごく興奮していました。これはもう機械学習中毒ですね。中にはまだ数ヶ月しか利用していないのに、もうデプロイ寸前まで到達しているお客さんもいれば、諸事情でデプロイまで到達できなかった、ということを素直にお話いただき、他のユーザーさんからの「ある、ある」とともに新たなディスカッションに発展したりと、非常に有意義な時間を過ごすことが出来ました。お話できないのが本当に残念!
同じ問題を解決するのならば簡単な技術を使うに越したことはないんです。一方で、今は多くの企業で「機械学習を使ってどのような問題が解決できるのか」への理解を進めたいという関心が高まり、ありとあらゆる活用事例がハーレム状態です。DataRobotが素晴らしいと思うのは、本来非常に時間のかかる機械学習の技術的な問題をあっという間にすっ飛ばして、ビジネスインパクトやデプロイ方法の検討に進むことが出来ることです。
何しろ機械学習ほどいま経営者の関心を集めている技術も珍しいです。データ分析は、会社の根幹に関わる価値を生み出すポテンシャルを持っているだけでなく、オペレーションサイドの人間にとっても、業務の効率化に伴うプロセスの変更や、人員削減にも至る可能性があるため、今や会社のあらゆる人にとって自分ごとになりつつあります。
予測分析の実行担当はシチズンデータサイエンティスト
そんな中で、分析を主体的に行う人材は本来データサイエンティストが主流でしたが、その数はユニコーンよりも少なく、「どうやったらデータサイエンティスト以外の人材がAI/機械学習を操れるのか」が大企業だけでなくお茶の間でも喫緊の課題となっています。特にエンジニアや研究者などの非分析専門技術者や事業部門責任者総合職の方などは事業ドメインの知識も持ち合わせている上、今までもなんだかの形でデータ分析に関わってきた方も多く、機械学習モデル生成ユーザー候補になりやすいといえます。図示してみるとこんな感じです:

機械学習技術は経験のあるデータサイエンティスト以外の生物が実行するのは非常に困難でしたが、この点に関してはDataRobotが分析の各ステップを自動化してくれたので、作業実施のハードルは大幅に下がってきました。一方モデル生成ユーザーは、ビジネスの大切な意思決定を機械学習モデルに委ねることになるため、説明責任を求めるのは当然です。しかし、内在的に複雑な技術を扱う中で、簡単にその中身を解釈することは困難です。あえて複雑な技術を使うからにはその結果は高いものであるという期待値がありますが、元来説明責任と、結果責任は相反する関係にあります。元大阪ガスの分析センター長だった河本さんが、以前DataRobotのカンファレンスで非常にわかりやすくこのポイントをお話してくれました:

技術活用への「覚悟を決められる」環境
機械学習を使いモデルの複雑性が増すと、精度は高くなり結果責任は果たしやすく成るものの、反対に解釈可能性が下がり、説明責任を果たしにくくなるのです。そこで、入念に設計された可視化技術を通じてモデルの解釈可能性を上げてくれれば、技術は受け入れやすくなります(上の図の左下の破線から、右上の実線に)。ここでもDataRobotは優れたツールを提供してくれます(もはや宣伝)。それでも河本さんは、ある程度精度が高く、ある程度解釈ができたら最終的には「納得するというよりも、覚悟を決める」ことができて初めて前に進むことが出来るのだ、と指摘されていたのが大変印象的でした。武士ですね。
モデルが肩代わりしてくれる意思決定に対し、モデル特性の解釈可能性を改善することで、モデル生成を担当する事業責任者が結果責任を負うことを「覚悟する」ことが出来るような環境を作ってあげることが私が企業に提供することの出来る最も大きな価値ではないかと考えています。そのためには新たにデータモデリングを担当する人たちに対して、企業の経営層がトレーニング、ツール、データへのアクセスを社内に提供していくことが必須です。
モデルの事業実装を阻む鬼門を越えるには
他方現場担当者への導入おいては別の種類の注意が必要です。先程図示した中の一番右下に表したポイントです。特にオペレーションの現場にいる方たちに受け入れられ、正しい形で使ってもらう(「事業実装してもらう」「プロダクションに移る」)事ができなければ、どんなに精度の高いモデルでも効果を生み出せないといえます。モデル生成の担当者から、最終的に予測結果を利用する現場担当者は一般的にモデルを作った人たちよりも分析リテラシーは低いですし、モデルそのものを作ったり触ったりせずに、予測値だけに接することがほとんどですので、今度は予測結果に対する説明を求めるます(例えば、この営業先は見込みがあると予測されているが、何故か?等)また、モデル生成担当者以上に他社実績やオペレーション時における信頼性、またそれを感じさせるイメージを重視する傾向もあります。
このように、せっかく精度の良い予測モデルが出来ても、現場のxxさんが導入に反対した、などの理由でオペレーションへの実装が阻まれてしまうということは非常によく見受けられ、上図ではそれを「鬼門」と表現しました。重要なことはプロジェクト開始当初からこの大きなギャップの存在を意識して行動することです。事業責任者のレベルでプロジェクトを開始し、モデルが出来てみたが、現場に持っていったら「で?」という反応を受けた、というような事例も聞かれます。プロジェクトの初期から現場担当者も巻き込み、モデルの予測値が実際にオペレーションレベルで導入可能なものなのかは、まとまった時間を使う前に確認する必要があります。どのような課題の解決に機械学習が有効なのか、ということに対する経験則は各インダストリーで蓄積が進んできており、私も前述のユーザー会なども通じて情報交換を促進しています。
最後は人の粘り強さに委ねられる
最終的な事業実装にこぎつけるためには、プロジェクト推進担当者が明確にアサインされ、実装までを、現場への理解を得て、導入を実現するために粘り強く推し進めて行く人間的努力がどうしても不可欠です。どんなにモデリング技術が自動化されてもこのプロセスを自動化することは出来ません。折しも年度初めのこの時期、まだ実装が済んでいないのにプロジェクト推進を担当していた方が他部署に移動になった、なんてことが起こったケースもあります。トップダウンで号令をかけ、プロジェクト担当者を後押して事業実装を推進できるよう、経営層もこの鬼門を初めから意識して乗り切る準備が求められます。プロジェクトの全体像を開始前から意識出来るようなトレーニングを私も行っていますので、そのような課題を感じられている方はぜひお声がけ下さい。