新闻中心
-
03-11CEAI 2025专题论坛 | 机器人通用移动与通用操作 | 中国具身智能大会点击完成注册缴费》》点击了解展览详情》》
-
03-11Pika推出音画同步新功能一天后,翻车视频来了Pika的音效新功能「SoundEffects」,有大大的惊喜,也有小小的「惊吓」。Sora的出现让文生视频模型及应用火了起来。不过,此类模型生成的视频大多数都...
-
03-11零一万物自研全导航图向量数据库,横扫权威榜单6项第一3月11日,零一万物宣布推出基于全导航图的新型向量数据库「笛卡尔(Descartes)」,已包揽权威榜单ANN-Benchmarks6项数据集评测第一名。向量数...
-
03-11基于DiT,支持4K图像生成,华为诺亚0.6B文生图模型PixArt-Σ来了这个模型和Sora一样采用了DiT框架。众所周知,开发顶级的文生图(T2I)模型需要大量资源,因此资源有限的个人研究者基本都不可能承担得起,这也成为了AIGC(...
-
03-08CLRNet:一种用于自动驾驶车道检测的分层细化网络算法在视觉导航系统中,车道检测是一项至关重要的功能。它不仅对自动驾驶和高级驾驶员辅助系统(ADAS)等应用有着显著的影响,而且对于智能车辆的自我定位和安全驾驶起着关...
-
03-06ICLR 2025 | 为音视频分离提供新视角,清华大学胡晓林团队推出RTFS-Net视听语音分离(AVSS)技术的主要目的是在混合信号中识别并分离出目标说话者的声音,利用面部信息来实现这一目标。这项技术在多个领域都有广泛的应用,包括智能助手、远...

