新闻中心
-
02-01将多模态大模型稀疏化,3B模型MoE-LLaVA媲美LLaVA-1.5-7B大型视觉语言模型(LVLM)可以通过扩展模型来提高性能。然而,扩大参数规模会增加训练和推理成本,因为每个token的计算都会激活所有模型参数。来自北京大学、中山...
-
02-01Mistral-Medium意外泄露?冲上榜单的这个神秘模型让AI社区讨论爆了「我现在100%确信Miqu与PerplexityLabs上的Mistral-Medium是同一个模型。」近日,一则关于「Mistral-Medium模型泄露」...
-
02-01伯克利开源高质量大型机器人操控基准,面对复杂自主操控任务不再犯难随着人工智能和机器人技术的迅速发展,功能操控(FunctionalManipulation)在机器人学中的重要性愈加突出。传统的基准测试已无法满足目前机器人对复...
-
01-31小扎官宣Code Llama重量级更新,新增70B版本,但还有能力限制功能更强大的CodeLlama70B模型来了。今天,Meta正式发布CodeLlama70B,这是CodeLlama系列有史以来最大、性能最好的型号。我们正在开...
-
01-31陶哲轩上新项目:Lean中证明素数定理,研究蓝图都建好了借助Lean,陶哲轩又开始了新的项目。「由AlexKontorovich和我领导的一个新的Lean形式化项目刚刚正式宣布,该项目旨在形式化素数定理(primen...
-
01-31这款国产免费编程工具火了!清华博士团队开发,响应延迟短、准确率高在过去一年中,随着大模型技术的广泛应用,我们已经见证了AI如何深刻地改变着我们的工作方式。在程序编写领域,AI的介入同样将为程序员们带来前所未有的便利。近日,非...

