LLM(巨大言語モデル)をこれからどのようにビジネスに活かしていくのか?LLMをスクラッチで開発することはできなくても、各企業が自社のオリジナルデータを上手く基盤モデルの追加学習に使うことで、独自の価値を生み出せる素地が整いつつあります。
カテゴリーアーカイブ: 深層学習
音楽が映像に何故あっているのかを言葉で説明できる人は少ないと思いますし、「しっくりくる」音楽を探してこい、と言われたとしても、音楽に関する知識と選曲の経験がなければ難しいと感じるでしょう。また、正解は一つではなく、あえて少しずれてるのがいい効果につながる、ということもあったりする複雑な問題です。このような問題をAIで部分的にでも解決するために、私達は様々な実験を繰り返し、幅広い動画に対して腹落ち感のある音楽の候補を提示するAIの開発に成功しました。
音楽制作・パフォーマンスを行うクリエーターが使う音楽制作プラットフォームでリアルタイムにPyTorchのAIモデルを呼び出すためのプラグイン型アプリケーションのNeutoneを今年の頭から開発し、音楽という分野においてMLOpsを実現し、世界的にも評価を得ることができました。
社会に大きな影響を持ちうるこれらの技術が、アートやデザインはもちろん、ビジネスにおいてどのような変化を引き起こしていくのか。先日開催した特別セミナーでは、Qosmoの徳井さん(@naotokui)と私(@madyagi)に加え、深津貴之氏(@fladdict)と水野祐弁護士(@TasukuMizuno)にもご参加いただき、様々な確度から検証してきました。本稿では特にビジネスにおける技術活用と、法的・倫理的注意点にフォーカスした2日目のセミナーサマリーをお届けします。
Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事。この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。
AIが意識を持つレベルになりつつあるとしたら(そして意識だけではなく、人間には到底できないような能力すら獲得しているとしたら)、これは人間にとって大きな転換期にもなりうる出来事と考えられるでしょう。また、捉え方に程度の差こそあれそのときは近づいているかもしれません。また、意識を持っているかどうかをゼロイチで捉えることよりも、意識あるものとない(とされる)ものの間を連続的に認識することで、意識に対する理解は深まっていくでしょう。
QosmoでアートにおけるAIの活用を進めているのは、そんな状況の中でも音楽や音に関連したAI技術がどのように活路を見いだせるのかに私自身強い関心があるからです。今年の春にはそれまでのリサーチの成果として「音楽生成AIの現状と可能性」というホワイトペーパーを執筆・リリースし、たくさんの反響を頂きました。
CodeZineの連載で書きました。TensorFlowは深層学習(ディープラーニング)をやるならば、今後圧倒的にスタンダードなプラットフォームになるでしょう。使い方はちょっとパイソンがわかる人なら(それって全人類でいうと1%に満たないかもですが)すぐに使えます。