新闻中心
-
08-05延迟交互模型,为什么是下一代RAG的标配?AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-05黎曼猜想显著突破!陶哲轩强推MIT、牛津新论文,37岁菲尔兹奖得主参与最近,被称为千禧年七大难题之一的黎曼猜想迎来了新突破。黎曼猜想是数学中一个非常重要的未解决问题,与素数分布的精确性质有关(素数是那些只能被1和自身整除的数字,它...
-
08-0570倍极致压缩!大模型的检查点再多也不怕AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
08-05苹果让大模型学会偷懒:更快吐出第一个token,准确度还保住了偷懒才能更好地工作。Llama3.1刚刚发布,你是否已经尝试了呢?就算你的个人计算机是最近的顶尖配置,运行其中最小的8B版本可能也依然会有明显延迟。为了提升模型...
-
08-05大模型微调非得依赖人类数据吗?DeepMind:用带反馈的自训练更好面对当前微调大模型主要依赖人类生成数据的普遍做法,谷歌DeepMind探索出了一种减少这种依赖的更高效方法。如你我所见,大语言模型(LLM)正在改变深度学习的格...
-
08-01arXiv论文可以发「弹幕」了,斯坦福alphaXiv讨论平台上线,LeCun点赞干杯!当论文讨论细致到词句,是什么体验?最近,斯坦福大学的学生针对arXiv论文创建了一个开放讨论论坛——alphaXiv,可以直接在任何arXiv论文之上发布...

