新闻中心
-
01-23智能语音合成的核心原理统计参数语音合成方法因其灵活性而在语音合成领域引起广泛关注。近年来,深度神经网络模型在机器学习研究领域的应用取得显着优势,与传统方法相比。基于神经网络的建模方法...
-
01-19ICLR'24无图新思路!LaneSegNet:基于车道分段感知的地图学习写在前面&笔者的个人理解地图作为自动驾驶系统下游应用的关键信息,通常以车道或中心线表示。然而,现有的地图学习文献主要集中在检测基于几何的车道或感知中心线...
-
01-16释放绝佳的编程资源,巨型模型和智能体将引发更强劲的力量正如瑞斯福兹魔杖缔造了诸如邓布利多在内的历代非凡魔法师的传奇,具有巨大潜能的传统大型语言模型,在经过代码语料的预训练/精调后,掌握了更超出本源的执行力。具体来说...
-
01-15学会多模态命令:谷歌图像生成AI让您轻松跟着画现在有一种谷歌新设计的图像生成模型,可以用图2的风格来画图1的猫猫,并给它戴上一顶帽子。这个模型通过指令微调技术,可以根据文本指令和多张参考图像来准确生成新的图...
-
01-15iPhone实时渲染300平房间,达到厘米级精度!谷歌最新研究:NeRF尚未破产3D实时渲染大型场景,一台电脑,甚至一部手机就可以完成。从家里的客厅到主卧,储物间,厨房,卫生间各个死角,都能逼真在电脑中完成渲染,如同拍摄实物视频一般。而且,...
-
01-14CVPR 2025|美图&国科大联合提出DropKey正则化方法:用两行代码高效避免视觉Transformer过拟合问题近期,基于Transformer的算法被广泛应用于计算机视觉的各类任务中,但该类算法在训练数据量较小时容易产生过拟合问题。现有VisionTransformer...

