新闻中心
-
06-30田渊栋团队新研究:微调在大家不断升级迭代自家大模型的时候,LLM(大语言模型)对上下文窗口的处理能力,也成为一个重要评估指标。比如OpenAI的gpt-3.5-turbo提供16kt...
-
06-30谷歌AudioPaLM实现「文本+音频」双模态解决,说听两用大模型大型语言模型以其强大的性能及通用性,带动了一批多模态的大模型开发,如音频、视频等。语言模型的底层架构大多是基于Transformer,且以解码器为主,所以无需过...
-
06-27基于信息论的校准技术,CML让多模态机器学习更可靠多模态机器学习在各种场景下都取得了令人瞩目的进展。然而,多模态学习模型的可靠性尚缺乏深入研究。「信息是消除的不确定性」,多模态机器学习的初衷与这是一致的——增加...
-
06-20650亿参数,8块GPU就能全参数微调:邱锡鹏团队把大模型门槛打下来了在大模型方向上,科技巨头在训更大的模型,学界则在想办法搞优化。最近,优化算力的方法又上升到了新的高度。大型语言模型(LLM)彻底改变了自然语言处理(NLP)领域...

