単語を生成した後は、単語を結び付けて歌詞を作る。ここでは著作権フリーの小説など64万文書を学習した文章生成AIが用いられた。
「文章生成が最も苦労しました。意味不明とクリエーティブの線引きが難しかったです」
あまりに支離滅裂な文章は人間が手を加えて単語の再選択を行った一方「『にこにこうぱうぱブルーベリー』のように、意味は全く分からないけれど雰囲気がかわいい歌詞は、そのまま採用しました(笑)」。
AIは学習データの量、内容に応じて、さまざまな歌詞を生成する。「人間も、積んだ経験に応じた価値観を持つという点ではAIと共通していると思います」と坂本教授。
「AIに優れた曲を作成させることも面白い試みですが、似たところもあるAIと人間が足りないところを補いながら一つの楽曲を制作できたら、それも素晴らしいことです」
■自動作曲で新感覚の1曲を
AIによる音楽制作は作詞にとどまらない。「Orpheus」はいくつかキーワードを与えるだけで作詞に加え、条件を設定すれば作曲、伴奏、歌唱まで全てAIが自動で行ってくれるシステムだ。インターネット上でユーザー登録をすれば誰でも作曲ができ、現在40万曲以上が作曲されている。
「私は音楽が好きで、自分でも作曲を試みましたが、なかなか納得のいく完成に至りませんでした。似た経験をした人もいるでしょう」
Orpheus開発者の嵯峨山茂樹名誉教授(東京大学)はそう話す。機械による音声認識・合成が専門だった嵯峨山名誉教授は「専門分野の確率モデルと日本語処理と音声処理に音楽理論を組み合わせれば、機械による作曲ができるのではと考え、学生と一緒にOrpheusの開発を始めました」。
Orpheusの作曲アルゴリズムでは、さぞかし大量の曲を学習に用いているのだろうと予想してしまうが、実際はそうではないという。
「確かに、最近のAIでは、大量の学習データをディープニューラルネットワーク(DNN)と呼ばれる数理モデルに学習させる深層学習が盛んに使われますが、Orpheusの作曲は、大量の学習曲もDNNも使いません。代わりに、人間自身が長い歴史の中で学習して得た音楽理論を確率モデルに組み込んで作曲をします。ただし作曲とは対照的に、Orpheusの自動作詞では、大量の学習データを用いています」