優れた開発言語がデータサイエンティスト短期間育成のカギとなる

ph1-3

シバタアキラ (@punkphysicist) です。

データサイエンティストという職業に急速に注目が集まり、ここ数年はその人材不足が嘆かれるようになった。だが、状況は徐々に変わりつつある。

ビッグデータのインフラ構築から、データ解析、そしてビジネスへの提案までできる「フルスタック」なスーパーデータサイエンティストは探し出すことも育成することも非常に難しい。最近のデータ解析の現場では、色々なタイプのデータサイエンティストが活躍し、お互いにその強みを活かしながらチームを形成して成功する例が見られるようになった。能力の育成の面でも、より現実的なアプローチが生まれてきている。データサイエンティストの育成パスを大きく分けると4種類のパターンが考えられる。

・ビジネスパーソン型
今までExcelやAccessなどのツールや、SQL言語での分析をしていたビジネスパーソンが、新しい可視化ツールを使って分析力を高める。

・サイエンティスト型
既にデータ解析技術を持っている研究者が、ビジネスへの洞察を深めてデータ解析を行う。

・エンジニア型
サーバー開発やアプリケーション開発を行っていたエンジニアが、データ分析に向いた開発言語を習得することで分析力を高める。

・インフラ型
サーバーやインフラ寄りのエンジニアが、ビッグデータ特有のデータベース技術を習得し、データマネジメントの立場から分析に関わる。

サイエンティスト型は様々な意味から理想的なパターンではあるが、博士号を持った科学者の数はエンジニアやビジネスパーソンに比べると圧倒的に少数である。

ビジネスで分野のデータ解析は単純な手法だけでも大きなインパクトを出せることがある。データを管理するインフラさえ整っていれば、ビジネスパーソン型のデータサイエンティストにも大きな活躍の場がある。

一方で、クラスタリングによる分類、統計モデリングによる予測・シミュレーション、ユーザーセグメントごとのレコメンドなどのためには、一段高度な分析が必要になる。そこで今回特に注目したいのがエンジニア型のデータサイエンティスト育成である。

続きは日経ビッグデータで御覧ください!こちらから