新闻中心
-
09-29文档字越多,模型越兴奋!KOSMOS-2.5:阅读「文本密集图像」的多模态大语言模型目前的一个明显趋势是致力于构建更大更复杂的模型,这些模型拥有数百/数千亿个参数,能够生成令人印象深刻的语言输出然而,现有的大型语言模型主要集中在文本信息上,无法...
-
09-26新标题:TextDiffuser:无惧图像中的文字,提供更高质量的文本渲染在过去几年中,Text-to-Image领域取得了巨大的进展,特别是在人工智能生成内容(AIGC)的时代。随着DALL-E模型的兴起,学术界涌现出越来越多的Te...
-
09-22国内推出全新语音对话大模型:李开复领衔,零一万物参与,支持中英双语和多模态,开源并可商用首个中英双语的语音对话开源大模型来了!这几天,一篇关于语音-文本多模态大模型的论文出现在arXiv上,署名公司中出现了李开复旗下大模型公司01.ai——零一万物...
-
09-18训练大模型缺少高质量数据?我们找到了一种新的解决方案数据,作为决定机器学习模型性能的三大要素之一,正在成为制约大模型发展的瓶颈。正所谓「Garbagein,garbageout」[1],无论你的算法多么优秀,你的...
-
09-12LLaMA微调显存需求减半,清华提出4比特优化器大模型的训练和微调对显存要求很高,优化器状态是显存主要开销之一。近日,清华大学朱军、陈键飞团队提出了用于神经网络训练的4比特优化器,节省了模型训练的内存开销,同...
-
09-05上海交大发布大模型双语编程评估基准CodeApex,机器真的开始挑战人类写代码了吗?打造能自己写代码的机器,这是计算机科学和人工智能先锋者一直在追寻的目标。而随着GPT类大模型的快速发展,这样的目标正在从遥不可及开始变得近在咫尺。大语言模型(L...

