新闻中心
-
01-25浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界AIxiv专栏:深度挖掘,突破知识边界——浙大通义OmniThink框架详解AIxiv专栏持续关注学术前沿,多年来已发表2000余篇高质量文章,涵盖全球顶尖实验...
-
01-24阿里云通义大模型新技术:MoE模型训练专家平衡的关键细节阿里云通义千问团队在最新论文中揭示了混合专家模型(MoE)训练中的一个关键问题,并提出了一种创新的解决方案。该问题在于现有MoE训练框架普遍采用局部负载均衡损失...
-
01-23用慢思考提升模型安全性,北交大、鹏城实验室提出系统2对齐AIxiv专栏:北京交通大学ADaM团队探索系统2对齐,提升大模型安全性北京交通大学ADaM团队长期关注AI安全领域,此前已开源o1复现项目o1-Coder(h...
-
01-22OS-Genesis来了,自动收集和标注Agent数据,高效且多样机智客AIxiv专栏持续发布前沿学术与技术内容。多年来,已报道2000余篇来自全球顶尖高校和企业实验室的成果,有力推动学术交流与传播。欢迎优秀研究者投稿或联系报...
-
01-21无直接数据可用,AI怎么学会「干活」?微软团队揭秘AI从语言到行动的进化之路微软团队突破性研究:从零构建大行动模型LAM,实现AI从被动语言生成到主动行动生成的飞跃!微软Data,Knowledge,andIntelligence(DK...
-
01-17阶跃公开了自家新型注意力机制:KV缓存消耗直降93.7%,性能不减反增AIxiv专栏长期致力于分享学术和技术前沿内容,已发表2000余篇来自全球顶尖高校和企业实验室的文章,为学术交流和传播做出了重要贡献。欢迎各位专家学者投稿或联系...

