新闻中心
-
07-19LLama+Mistral+…+Yi=? 免训练异构大模型集成学习框架DeePEn来了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-15豆包大模型团队发布全新Detail Image Caption评估基准,提升VLM Caption评测可靠性AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-09支持合成一分钟高清视频,华科等提出人类跳舞视频生成新框架UniAnimateAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-05迈向『闭环』| PlanAgent:基于MLLM的自动驾驶闭环规划新SOTA!中科院自动化所深度强化学习团队联合理想汽车等提出了一种新的基于多模态大语言模型MLLM的自动驾驶闭环规划框架—PlanAgent。该方法以场景的鸟瞰图和基于图的...
-
05-23综述!全面概括基础模型对于推动自动驾驶的重要作用写在前面&笔者的个人理解最近来,随着深度学习技术的发展和突破,大规模的基础模型(FoundationModels)在自然语言处理和计算机视觉领域取得了显...
-
04-25加速扩散模型,最快1步生成SOTA级图片,字节Hyper-SD开源了最近,扩散模型(DiffusionModel)在图像生成领域取得了显著的进展,为图像生成和视频生成任务带来了前所未有的发展机遇。尽管取得了令人印象深刻的结果,扩...

