PANews は 12 月 6 日、AI 分野で著名な機関である Grass、Ontocord、LAION が VALID (Video-Audio Large Interleaved Dataset) データセットの共同リリースを発表したと報じました。

このデータセットは Grass ビデオ ウェアハウス上に構築されており、画像とテキストがインターリーブされた 3,000 万個のオーディオ クリップが含まれており、業界初のビデオとオーディオがインターリーブされたデータセットとなっています。 VALID のリリースにより、マルチモーダル AI モデルのトレーニングのための新しいデータ サポートが提供されます。