PANews 12月6日消息,AI领域知名机构Grass、Ontocord和LAION宣布联合发布VALID(Video-Audio Large Interleaved Dataset)数据集。

该数据集基于Grass视频仓库构建,包含3000万条音频片段,这些音频片段与图像和文本进行了交错配对,是业内首个视频-音频交错数据集。VALID的发布将为多模态AI模型的训练提供新的数据支持。