GoogleがMagenta RealTime 2を公開——「生成AIで曲を作る」ではなく「AIを楽器として演奏する」という選択
Google DeepMindのMagentaチームが、ライブ演奏用の音楽AIモデル「Magenta RealTime 2(MRT2)」を公開した。200ms以下のレイテンシでMIDIや音声・テキストに即応し、MacBookで動作するオープンウェイトモデル。SunoやUdioのような「プロンプトから曲を生成する」AIとは根本的に異なるアプローチが、AI音楽のもう一つの可能性を示している。
Suno vs アーティスト権利団体という構図が今週のAI音楽ニュースを占領するなか、Googleから静かに、しかし重要なリリースが届いた。
2026年6月4日、Google DeepMindのMagentaチームがMagenta RealTime 2(MRT2)を公開した。オープンウェイトのライブ音楽モデルで、MacBook上でリアルタイム動作する。
何が起きたか
MRT2は「プロンプトを入れて曲が出てくる」AIではない。MIDIコントローラーやオーディオ、テキストを入力として受け取り、40msのフレーム単位でリアルタイムに音楽を生成し続ける。つまり演奏者がMIDIを弾くと、モデルがそれに即座に応答して音楽を生み出す——楽器に近い使い方を想定している。
主な仕様は以下の通り。
| 項目 | Magenta RealTime 2 |
|---|---|
| モデルサイズ | 2.4B(Base)/ 230M(Small) |
| コントロールレイテンシ | 約200ms |
| 入力 | MIDI・オーディオ・テキスト |
| 動作環境(リアルタイム) | Base: M3 Pro / M2 Max 以上 / Small: Apple Siliconなら全機種 |
| ライセンス | コード: Apache 2.0 / ウェイト: CC BY 4.0 |
前バージョン(Magenta RealTime v1)と比べると、コントロールレイテンシは約3秒から200msへと15倍改善された。
公開されたのはモデルだけではない。
- Pythonライブラリ(
pip install magenta-rt、JAX/MLXバックエンド) - C++推論エンジン(AppleのMLXフレームワークを使用)
- DAWプラグイン(AU形式)
- スタンドアロンアプリ(Jam、Collider)
- Max/MSP・Pure Data・SuperCollider向け拡張
モデルウェイトはHugging Faceで、コードはGitHubで公開されている。いずれも無料。
なぜこれが重要か
Magentaチームは公式ページにこう記している。「AIはミュージシャンのツールであり、決して代替品ではない」という10年来のビジョンを体現するプロジェクトだ、と。
この言い方は、意図的にSunoやUdioとの差別化を意識している。「プロンプトから完成した曲を生み出す」ジェネレータとは異なり、MRT2は「演奏者がリアルタイムに操作できる楽器」としてデザインされている。
音楽AIを巡る論争の多くは「AIが音楽を作ってしまう」という問いを中心に展開してきた。MRT2が示しているのは、それとは異なる設計思想——AIが「代わりに作る」のではなく、「作ることを手伝う楽器になる」という方向性だ。
もう一つ注目したいのが、オープンウェイトである点だ。モデルはCC BY 4.0ライセンスで公開されており、誰でもダウンロードして手元で動かせる。著作権訴訟の渦中にあるSunoとは対照的に、学習データについての問いは引き続き残るが、少なくとも「自分のMacで閉じた環境で動かす」という使い方が可能だ。
論点・異なる見方
「楽器AI」は訴訟問題から自由なのか
MRT2のモデルも何らかのデータで学習されている。公式ページにはトレーニングデータの詳細が記載されておらず、この点は不明確だ。「プロンプトから曲を出す」と「リアルタイムで演奏に応答する」は使用体験が異なるが、モデルの学習に使われた素材という観点では、同じ問いが成立しうる。
実際に使えるのか
現時点ではApple Siliconが必須だ。Baseモデルをリアルタイムで動かすにはM3 ProやM2 Max以上が必要で、Smallモデルでも最新のMacBookが前提になる。Windowsやインテル系Macのユーザーには今のところ選択肢がない。
DAWにどう組み込まれるか
AU(Audio Units)プラグインとして提供されているため、Logic ProやAbleton Liveなど多くのDAWに差し込める。「MIDIトラックの上にMRT2を置いて演奏する」というワークフローは、作曲家・プロデューサーにとって直感的に理解しやすい。ただ現在はまだ「例示的なアプリ群」の段階で、実用レベルに達するかは今後の開発次第だろう。
今後どう展開しそうか
Magentaチームは今後の予定として以下を示している。
- ファインチューニング——自分のデータでモデルをカスタマイズ
- ボストンのMusic Technology Hackathon(今週)でのMRT2活用
- より低レイテンシの実現、リアルタイムオーディオ入力によるジャム演奏対応
ファインチューニングが実現すれば、自分のスタイルや音色を反映させた「自分専用のAI楽器」を作ることが可能になる。このアプローチが広がると、「AI音楽」の意味が問われるフェーズが来るかもしれない——それはモデルが作った音楽なのか、演奏者が表現した音楽なのか。
作り手・聴き手への示唆
SunoやUdioがプロンプトから曲を生み出すのに対し、MRT2はリアルタイムの演奏体験を前提としている。この違いは単なる技術的な差ではない。
MRT2を使って音楽を作る場合、そこには演奏の判断が存在する。どのMIDIを弾くか、どのテキストプロンプトで音色を変えるか、どのタイミングでモードを切り替えるか。AIが応答する相手として、人間がいる。
「AI音楽に意図や選択は存在するか」という問いに対して、MRT2は一つの実装的な答えを出している。ツールとしてどう使うかは、まだ誰も定型を持っていない段階だ。
Apple Silicon MacBookを持っているなら、試してみる価値はある。
ソース
- Google DeepMind / Magenta: "Magenta RealTime 2: Open & Local Live Music Models" (2026-06-04): https://magenta.withgoogle.com/magenta-realtime-2
- GitHub: magenta/magenta-realtime: https://github.com/magenta/magenta-realtime
- Hugging Face: google/magenta-realtime-2: https://huggingface.co/google/magenta-realtime-2