新闻中心
-
09-05大模型走向物理世界,TeleAI 发布大模型驱动的具身智能综述,覆盖300篇文献AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-24击败GPT-4o的开源模型如何炼成?关于Llama 3.1 405B,Meta都写在这篇论文里了经历了提前两天的「意外泄露」之后,Llama3.1终于在昨夜由官方正式发布了。Llama3.1将上下文长度扩展到了128K,拥有8B、70B和405B三个版本,...
-
07-10单一作者论文,谷歌提出百万专家Mixture,超越密集前馈、稀疏MoE释放进一步扩展Transformer的潜力,同时还可以保持计算效率。标准Transformer架构中的前馈(FFW)层会随着隐藏层宽度的增加而导致计算成本和激活...
-
06-17高质量3D生成最有希望的一集?GaussianCube在三维生成中全面超越NeRF本网站AIxiv专栏是发布学术、技术内容的栏目。过去几年,本站AIxiv专栏接收报道逾2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与...
-
06-13打通智能体「自我进化」全流程!复旦推出通用智能体平台AgentGymAIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-12腾讯混元、北大发现Scaling law「浪涌现象」,解决学习率调参难题AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...

