「何百万曲」は認める、でも「正確な数」は企業秘密——Sunoが学習データ件数の非公開を裁判所に求めた理由
UMGとSonyがSunoに対して起こした著作権訴訟で、Sunoが学習データの「正確な件数」を非公開にするよう連邦裁判所に申し立てた。理由は「競合他社に競争上の利益を与えるリスク」。数百万曲を使ったことは認めている。非公開にしたいのは、その正確な数字だけだ。
「何百万曲もの音源を学習に使った」——Suno自身がそう認めている。だが、その数が正確に何件なのかは、企業秘密だという。
何が起きたか
2026年5月29日、AI音楽生成サービスのSunoは、米マサチューセッツ州連邦地方裁判所に対して「封印申立(impoundment)」の書面を提出した。
封印を求めているのは一点だけだ。ユニバーサル ミュージック グループ(UMG)とソニー ミュージック エンタテインメント(Sony)が提出した裁判書類に含まれる、SunoがAIモデルの学習に使用した音声ファイルの「総件数」を示す数字。
Sunoの最高技術責任者(CTO)Georg Kucsko氏の申告書によれば、この数字は「公開されていないものであり、本訴訟外では開示されていない」という。
重要なのは、Sunoが封印を求めていない部分だ。書面は明確にこう述べている。
「Sunoは、学習データに含まれているとされる特定の音源の同一性について封印を求めるものではない。Sunoが封印を求めているのは、そのモデルの学習に使用されたとされる音声ファイルの総件数という、単一の競争上センシティブな情報についての、ごく少数の言及のみである」
ラベル側が裁判書類の中で「何百万もの」楽曲と記しているのはすでに公開情報だ。封印したいのは、「何百万」のうちの「何」という部分だけ、ということになる。
なぜこれが重要か
この訴訟はもともと2024年6月24日に始まった。RIAAの調整のもと、Sony Music Entertainment、UMG Recordings、Warner RecordsがSunoとUdioを著作権侵害で提訴したものだ。当初の訴状に列挙された作品数は560点だった。
それから約2年で、規模は大きく変わった。
2026年5月21日、UMGとSonyは訴状の修正動議を提出し、61,026点の音源を追加した。修正前の560点からおよそ109倍の拡大だ。ラベル側は音声フィンガープリント技術「Audible Magic」を使い、Sunoの学習データ内に自社の音源を特定したと主張している。
61,026点は「学習データに含まれていると特定した音源のほんの一部にすぎない」と書面は述べている。
Suno自身も、元々の訴状への回答の中でこう認めている。
「Sunoのモデルが学習した数千万件の音源には、原告が権利を持つ音源が含まれていると推測される」
件数の問題が核心に迫りつつあるのは、このためだ。「数千万件」という規模を認めていながら、正確な数字は「企業の戦略的判断を反映した機密情報」として非公開を求める。そこにある論理は何か。
論点・異なる見方
Sunoの論理:規模そのものが競争優位
Kucsko CTO は申告書の中でこう述べている。
「急速に進化する、競争が激しい生成AIの市場において、企業の学習コーパスのサイズは、モデル設計と性能に関する技術的開発判断と戦略的判断を反映している」
高品質なモデルを作るためにどの程度のデータが必要か——そのノウハウが数字に内包されているという主張だ。競合がその数字を知れば、自社のシステムと照合してベンチマークに使い、Sunoのアプローチを推定できる。それは「機密の事業情報を利用した不公正な競争」につながりうる、とSunoは言う。
裁判所はすでに同様の理由で、Sunoの学習データに関する情報を封印する動議を過去に認めている。Sunoはそれを引用しつつ、今回も同じ論理が適用されると主張している。
Inner City Pressの主張:公益と著作権侵害の核心
これに反論したのが、メディア報道監視団体Inner City Pressだ。同組織のMathew Russell Lee記者は5月22日付の書簡で「封印される情報はSunoのAIシステムが何の音楽を学習に使ったかに関するものであり、著作権侵害の申し立ての核心をなす」と述べ、裁判記録の公開を求めた。
これに対しSunoは、Lee記者の主張は「Sunoが封印を求めているものの現実から完全に乖離している」と反論している。学習した特定の音源の情報は封印していない。件数という単一の数字だけだ、と。
類似のAI著作権訴訟——The New York Times v. Microsoft、Kadrey v. Meta Platforms、Concord Music Group v. Anthropic——でも同様の学習データ関連情報の封印が認められているケースを引き合いに出し、前例があると主張している。
ラベル側:反対しないが、権利は留保
訴訟の相手方であるUMGとSonyは、今回の封印申立を支持も反対もしていない。ただし「後日その封印の適正さを争う権利を留保する」としている。
著作権訴訟の当事者として、封印を認めることで自らの主張が弱まりかねないリスクもある。それでも今の段階では正面から争わない、という慎重な立場だ。
今後どう展開しそうか
裁判所がSunoの封印申立を認めるかどうかは、現時点では不明だ。
ただし、より大きな争点はその先にある。
UMGとSonyが修正動議で追加を求めた61,026点の音源をめぐる判断だ。Sunoはこの修正動議に反対しており、裁判はさらに長期化する可能性がある。F・デニス・セイラー4世判事が修正を認めれば、訴訟の規模と複雑さは大きく増す。
また、Suno/Udioへの訴訟と並行して進むUdio側の裁判(ニューヨーク南部地区連邦地方裁判所)の動向も注視が必要だ。学習データの透明性をめぐる争いは、業界全体の慣行に影響を与えうる先例になりえる。
作り手・聴き手への示唆
「AIは大量の音楽を学習している」——それはほとんどの人がすでに知っていることだ。
今回の裁判がより具体的に浮かび上がらせているのは、その「大量」がどの程度の量なのかを、誰も正確に知らせようとしていないという現実だ。Sunoは「数千万件」と認めながら、正確な数字は開示しない。ラベル側は「数百万件」と言いながら、61,026点に絞って訴えている。
AI音楽を日常的に使っているクリエイターにとって、この数字が直接何かを変えるわけではない。だが、自分が使っているツールがどんな素材を、どれだけ使って作られているのかについて、現状では詳細を知るすべはない——という事実は変わらない。
学習データの透明性を求める声(TRAIN Actなど)がどこまで実効性を持つか。この訴訟はその試金石の一つになる。
ソース
- Music Business Worldwide: "Suno moves to keep size of its AI training data sealed in UMG and Sony's copyright case, citing 'competitive harm'" (2026-06-02): https://www.musicbusinessworldwide.com/suno-moves-to-keep-size-of-its-ai-training-data-sealed-in-umg-and-sonys-copyright-case-citing-competitive-harm/
- Music Business Worldwide: "UMG and Sony seek to add over 61k recordings to Suno lawsuit after discovery reveals AI trained on 'millions' of their recordings" (2026-05-21): https://www.musicbusinessworldwide.com/umg-and-sony-seek-to-add-61000-copyrighted-works-to-suno-lawsuit-after-discovery-reveals-suno-trained-on-millions-of-their-recordings/
- Music Business Worldwide: "Major record companies sue AI music generators Suno, Udio for 'mass infringement' of copyright" (2024-06-24): https://www.musicbusinessworldwide.com/major-record-companies-sue-ai-music-generators-suno-udio-for-mass-infringement-of-copyright/