PANews 12月6日消息,AI領域知名機構Grass、Ontocord和LAION宣布聯合發布VALID(Video-Audio Large Interleaved Dataset)資料集。

該資料集基於Grass視訊倉庫構建,包含3000萬個音訊片段,這些音訊片段與影像和文字進行了交錯配對,是業界首個視訊-音訊交錯資料集。 VALID的發布將為多模態AI模型的訓練提供新的資料支援。