资讯

南京大学的研究团队意识到,要让AI真正理解我们的3D世界,需要一个前所未有的"空间词典"。他们花费了巨大的精力,从浩如烟海的网络视频中精心挑选并标注了超过21000小时的原始素材,最终打造出了一个包含2.7万小时高质量动态场景的庞大数据集,并将其命名为SpatialVID。
The research team at CUHK Shenzhen recently discovered the real cause of this issue and proposed an innovative solution. They ...