新闻中心
-
02-17AI无法攻克的235道谜题!让o1、Gemini 2.0 Flash Thinking集体挂零最新研究揭示大语言模型推理能力的局限性:ENIGMAEVAL基准测试结果ScaleAI、CenterforAISafety和MIT的研究人员联合发布了新的多模态...
-
09-11Scaling Law瓶颈,Cursor编程为什么这么强?团队参与新研究掏出秘密武器近段时间,AI编程工具Cursor的风头可说是一时无两,其表现卓越、性能强大。近日,Cursor一位重要研究者参与的一篇相关论文发布了,其中提出了一种方法,可通...
-
05-04终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名当前最火的大模型,竟然三分之二都存在过拟合问题?刚刚出炉的一项研究,让领域内的许多研究者有点意外。提升大型语言模型的推理能力是当前研究的最重要方向之一,在这类任...
-
共1页 3条

