新闻中心
-
05-23替代MLP的KAN,被开源项目扩展到卷积了本月初,来自MIT等机构的研究者提出了一种非常有潜力的MLP替代方法——KAN。KAN在准确性和可解释性方面表现优于MLP。而且它能以非常少的参数量胜过以更大参...
-
05-07全球最强开源 MoE 模型来了,中文能力比肩 GPT-4,价格仅为 GPT-4-Turbo 的近百分之一想象一下,一个人工智能模型,不仅拥有超越传统计算的能力,还能以更低的成本实现更高效的性能。这不是科幻,DeepSeek-V2[1],全球最强开源MoE模型来了。...
-
05-0658行代码把Llama 3扩展到100万上下文,任何微调版都适用堂堂开源之王Llama3,原版上下文窗口居然只有……8k,让到嘴边的一句“真香”又咽回去了。在32k起步,100k寻常的今天,这是故意要给开源社区留做贡献的空间...
-
05-06ICLR 2025 Spotlight | 负标签挖掘助力基于CLIP的分布外检测任务在机器学习模型日益应用于开放世界场景中,如何有效识别和处理分布外(Out-of-Distribution,OOD)数据成为一个重要研究领域。分布外数据的存在可能...
-
05-06特斯拉机器人进厂打工,马斯克:手的自由度今年将达到22个!特斯拉机器人Optimus最新视频出炉,已经可以在厂子里打工了。正常速度下,它分拣电池(特斯拉的4680电池)是这样的:官方还放出了20倍速下的样子——在小小的...
-
05-06AI学会隐藏思维暗中推理!不依赖人类经验解决复杂任务,更黑箱了AI做数学题,真正的思考居然是暗中“心算”的?纽约大学团队新研究发现,即使不让AI写步骤,全用无意义的“……”代替,在一些复杂任务上的表现也能大幅提升!一作Ja...

