Stable Diffusionがオープンソースで公開されてちょうど1ヶ月が立ちました。OpenAIがDall-E2をリリースしたのが4月。こういう異次元なリソースを使ってモデルを作れるのはごく限られたプレーヤーだけと思い込んでいたものが、若干十数人のチームがMidjourneyをリリースしたのが7月。一連の騒ぎがここ半年程度の出来事。この文化的特異点とも言える1ヶ月に起こったことを振り返ってみたいと思います。

AIが意識を持つレベルになりつつあるとしたら(そして意識だけではなく、人間には到底できないような能力すら獲得しているとしたら)、これは人間にとって大きな転換期にもなりうる出来事と考えられるでしょう。また、捉え方に程度の差こそあれそのときは近づいているかもしれません。また、意識を持っているかどうかをゼロイチで捉えることよりも、意識あるものとない(とされる)ものの間を連続的に認識することで、意識に対する理解は深まっていくでしょう。

QosmoでアートにおけるAIの活用を進めているのは、そんな状況の中でも音楽や音に関連したAI技術がどのように活路を見いだせるのかに私自身強い関心があるからです。今年の春にはそれまでのリサーチの成果として「音楽生成AIの現状と可能性」というホワイトペーパーを執筆・リリースし、たくさんの反響を頂きました。