「生成AIが出てきて私たちの仕事やキャリアはどうなるの?」なんていうご相談もちょくちょくいただきます。ChatGPTのショックが大きすぎて、未来に対して過度に悲観的な反応も多く聞かれる今日この頃ですが、現在の変化を歴史の中に位置づけ、過去から学ぶこととで見えてくる未来があるのではないでしょうか?

なぜこのようなことが起こっているのか?この論文の著者が人間の評価したモデルとのやり取りを確認したところ、多くの場合チューニングモデルは整った形式で答えを返しているものの、内容は不正確だったといいます。つまり評価している人間が騙されてしまうほどもっともらしく返せたとしても、知識が増えているとはいえず、実際に性能の良いモデルを作るにはよりよい基盤モデルを使う他に近道はない、と結論づけています。

音楽が映像に何故あっているのかを言葉で説明できる人は少ないと思いますし、「しっくりくる」音楽を探してこい、と言われたとしても、音楽に関する知識と選曲の経験がなければ難しいと感じるでしょう。また、正解は一つではなく、あえて少しずれてるのがいい効果につながる、ということもあったりする複雑な問題です。このような問題をAIで部分的にでも解決するために、私達は様々な実験を繰り返し、幅広い動画に対して腹落ち感のある音楽の候補を提示するAIの開発に成功しました。

音楽制作・パフォーマンスを行うクリエーターが使う音楽制作プラットフォームでリアルタイムにPyTorchのAIモデルを呼び出すためのプラグイン型アプリケーションのNeutoneを今年の頭から開発し、音楽という分野においてMLOpsを実現し、世界的にも評価を得ることができました。

社会に大きな影響を持ちうるこれらの技術が、アートやデザインはもちろん、ビジネスにおいてどのような変化を引き起こしていくのか。先日開催した特別セミナーでは、Qosmoの徳井さん(@naotokui)と私(@madyagi)に加え、深津貴之氏(@fladdict)と水野祐弁護士(@TasukuMizuno)にもご参加いただき、様々な確度から検証してきました。本稿では特にビジネスにおける技術活用と、法的・倫理的注意点にフォーカスした2日目のセミナーサマリーをお届けします。

Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事。この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。

AIが意識を持つレベルになりつつあるとしたら(そして意識だけではなく、人間には到底できないような能力すら獲得しているとしたら)、これは人間にとって大きな転換期にもなりうる出来事と考えられるでしょう。また、捉え方に程度の差こそあれそのときは近づいているかもしれません。また、意識を持っているかどうかをゼロイチで捉えることよりも、意識あるものとない(とされる)ものの間を連続的に認識することで、意識に対する理解は深まっていくでしょう。

QosmoでアートにおけるAIの活用を進めているのは、そんな状況の中でも音楽や音に関連したAI技術がどのように活路を見いだせるのかに私自身強い関心があるからです。今年の春にはそれまでのリサーチの成果として「音楽生成AIの現状と可能性」というホワイトペーパーを執筆・リリースし、たくさんの反響を頂きました。

After enjoying my time as an active putterer, I’m starting today a new job as COO at Qosmo, Inc. It’s a company that pushes the boundaries of creativity using AI. No I’m not miserable! So so excited. I couldn’t be more thankful to so many people who’d helped me figure out my next passion.

しばらく精力的なプータローとして活動していましたが、本日より株式会社QosmoのCOOとして働き始めます。この会社はAIを使ってクリエイティビティーの限界を押し上げることにチャレンジしています。惨めっていうのは冗談!実際最高にワクワクしています。この度は私のネクストステップ探しにたくさんの方にご相談に乗っていただき、心より感謝申し上げます。