新闻中心
-
08-11混合专家更有主见了,能感知多模态分情况行事,Meta提出模态感知型专家混合混合专家,也得术业有专攻。对于目前的混合模态基础模型,常用的架构设计是融合特定模态的编码器或解码器,但这种方法存在局限:无法整合不同模态的信息,也难以输出包含多...
-
07-23神经网络也有空间意识!学会在Minecraft创建地图,登上Nature子刊这是人类首次证明神经网络可以创建自己的地图。想象一下,你身处一个陌生的小镇,即使一开始周围的环境并不熟悉,你也可以四处探索,并最终在大脑中绘制出一张环境地图,里...
-
05-29亮相CCIG2025,合合信息文档解析技术破解大模型语料“饥荒”难题2024年,中国图象图形大会在古都西安盛大开幕。本届大会由中国图象图形学学会主办,空军军医大学、西安交通大学、西北工业大学承办,通过二十多场论坛、百余项成果,集...
-
05-28AI 智能体的炒作与现实:GPT-4 都撑不起,现实任务成功率不到15%根据大语言模型的不断进化与自我革新,性能、准确度、稳定性都已经有了大幅的提升,这已经被各个基准问题集验证过了。但是,对于现有版本的LLM来说,它们的综合能力似乎...
-
05-28AI智能体的炒作与现实:GPT-4都撑不起,现实任务成功率不到15%按照大语言模型的持续进化和自我革新,性能、准确度、稳定性都有了大幅的提升,这已经被各个基准问题集验证过了。但是,对于现有版本的LLM来说,它们的综合能力似乎并不...
-
05-13Flash Attention稳定吗?Meta、哈佛发现其模型权重偏差呈现数量级波动MetaFAIR联合哈佛优化大规模机器学习时产生的数据偏差,提供了新的研究框架。据所周知,大语言模型的训练常常需要数月的时间,使用数百乃至上千个GPU。以LLa...

