新闻中心
-
10-14图灵奖得主Yoshua Bengio新作:Were RNNs All We Needed?自从Transformer模型问世以来,试图挑战其在自然语言处理地位的挑战者层出不穷。这次登场的选手,不仅要挑战Transformer的地位,还致敬了经典论文的...
-
10-12NeurIPS 2025 | Transformer长度外推,全新位置编码DAPE大幅提升模型性能AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
02-04击败OpenAI,权重、数据、代码全开源,能完美复现的嵌入模型Nomic Embed来了一周前,OpenAI给用户送出福利。他们解决了GPT-4变懒的问题,并推出了5个新模型,其中包括text-embedding-3-small嵌入模型,它更小巧高...
-
01-16突破信息障碍!震撼人心的大型3D可视化工具问世!近日,一位来自新西兰的小哥BrendanBycroft在技术圈掀起了一股热潮。他创作的一项名为大模型3D可视化的项目,不仅登上了HackerNews的榜首,而且...
-
01-04A800显著超越Llama2推理RTX3090与4090,表现优异的延迟和吞吐量大型语言模型(LLM)在学界和业界都取得了巨大的进展。但训练和部署LLM非常昂贵,需要大量的计算资源和内存,因此研究人员开发了许多用于加速LLM预训练、微调和推...
-
12-15英伟达打脸AMD:H100在软件加持下,AI性能比MI300X快47%!12月14日消息,AMD于本月初推出了其最强的AI芯片InstinctMI300X,其8-GPU服务器的AI性能比英伟达H1008-GPU高出了60%。对此,英...

