音楽を作ることは、今や多くの人の手の届く場所にある。ではそれを「見せること」は?


何が起きたか

ベルリン拠点のAIミュージックビデオ生成スタートアップ Neural Frames が、年間収益率(ARR)500万ドル(約7.5億円)を突破した。Music Ally が2026年6月2日に報じた。

プラットフォームはすでに 4万人を超えるミュージシャン に使われており、生成されたミュージックビデオの本数は 200万本超。無料トライアルあり、サブスクリプションは月額$26・$66・$199の3段階で提供されている。

マイルストーンと同時に、著名な人物の参加も発表された。AI音楽テクノロジー企業Musiioの創業者であり、現在は投資家として活動するHazel Savageが、Neural Framesの戦略アドバイザーに就任した。

創業者はDr. Nicolai Klemke。昨年9月のアムステルダム・ダンス・イベント(ADE)での出会いをきっかけに、SavageがKlemkeに注目するようになったという。

「その時点ですでに信じられないほどの収益を上げていた。次に話した時には、2ヶ月で収益が倍になっていた」

そう語るSavageは続ける。

「ロケットシップが目の前で飛び立つのを見ている、そんな感覚の時がある。当然、乗りたかった」


なぜこれが重要か

SunoやUdioが「誰でも音楽を作れる」入口を広げた今、制作コストは大きく下がった。だが音楽を公開し、ストリーミングプラットフォームやSNSで届けようとする段になると、別の壁がある。ミュージックビデオだ。

YouTubeやTikTok、Instagramで音楽を届ける文脈において、「絵のない音楽」は不利だ。スマートフォンとDAWだけで曲を完成させたアーティストが、次にMV制作のために映像制作会社を探し、費用と時間を投じる——このギャップを埋めようとするのがNeural Framesのポジションだ。

Neural Framesは現在、三つのモードを提供している。

  • Autopilot:「2クリックで曲からMVを生成」をうたう自動モード
  • Frame-by-Frame Editor:より細かい制御を可能にするコマ単位の編集
  • Text-to-Video Editor:Kling、ByteDance の Seedance、Runway、Stable Diffusion など複数のAI動画モデルを切り替えて使えるモード

ARR $5mという数字は、この需要が実在することの証左でもある。


論点・異なる見方

「作る」の次の課題をAIが解決できるか

Neural Frames の成長は、AI音楽ツールの普及に伴う「第二の需要」が生まれていることを示している。音楽制作のコスト低下によって参入者が増えれば、その分「どう届けるか」の競争も激しくなる。ビジュアルはその一つの答えだ。

ただし、AIが生成するMVの「質」と「個性」をめぐる問いは残る。自動生成される映像が増えれば、差別化はより難しくなる。ユーザーレビューを見ると、Neural Framesを「これまでで最も驚くべきコラボレーション体験」と語るアーティストがいる一方、映像の独自性をどこで担保するかは各クリエイターの課題になる。

Hazel Savageの参加が示すもの

Musiioは2019年創業のAI音楽タグ付け・キュレーションスタートアップで、2022年にSoundCloudに買収された。Savageはその後、音楽テック投資家として活動している。Neural Framesへの参加は、業界内の識者が「次に来る」と判断したことの一つの証拠として読むこともできる。


今後どう展開しそうか

Neural Framesはすでに「Kling 3」を含む最新の動画生成モデルに対応しており、ARR成長と並行してモデルの品質向上も取り込んでいる。Savageの参画は、より組織的な事業拡大——おそらく資金調達やパートナーシップ——の準備段階である可能性がある。

AIミュージックビデオのカテゴリ自体は、まだ確立されたリーダーがいない領域だ。SunoやUdioがAI音楽生成で占めたポジションに相当するプレイヤーが、映像側にも現れるとすれば、Neural FramesはそのポジションをARR $5mで争い始めている。


作り手・聴き手への示唆

4万人という数字は、「AIでMVを作る」がごく一部のマニアの話ではなくなっていることを示している。自宅で楽曲を作り、プラットフォームに投稿し、ビジュアルまで含めて完結させる——そのフルセットが個人の手の届く場所に来つつある。

もちろん、ツールの存在が「何を表現したいか」という問いを代わりに答えてくれるわけではない。映像が音楽の意図を的確に体現できるかは、プロンプトを書く人間の感覚と言語化の力に委ねられている。ここでもやはり、AIはツールであり、選択するのは人間だ。


ソース