新闻中心
-
01-18Lightning Attention-2:实现无限序列长度、恒定算力成本和更高建模精度的新一代注意力机制LightningAttention-2是一种新型的线性注意力机制,让长序列的训练和推理成本与1K序列长度的一致。大语言模型序列长度的限制,极大地制约了其在人工...
-
01-17蚂蚁集团发布新算法,可加快大型模型推理速度2-6倍近日,蚂蚁集团开源了一套新算法,可帮助大模型在推理时,提速2至6倍,引起业内关注。图:新算法在不同开源大模型上的提速表现。这套新算法名为Lookahead推理加...
-
01-17“智谱AI推出中国版GPTs新一代大型模型GLM-4,引发生态变革?”图片来源:智谱AI公众号智谱AI在首届技术开放日上展示了其新一代基座大模型GLM-4和文生图产品CogView3,作为追赶ChatGPT的实力展示。此外,智谱A...
-
01-16无条件免费商用的全球最长开源模型XVERSE-Long-256K元象发布了全球首个上下文窗口长度256K的开源大模型XVERSE-Long-256K。这个模型支持输入25万汉字,使得大模型应用能够进入“长文本时代”。该模型完...
-
01-16上交大发布推理引擎PowerInfer,其token生成速率仅比A100低18%,或将取代4090成为A100的替代品为了不改变原意而重写内容,需要将语言重写为中文,不需要出现原句本网站的编辑部PowerInfer的出现使得在消费级硬件上运行AI变得更加高效上海交大团队,刚刚推...
-
01-16云测数据荣获量子位「2025人工智能年度评选」称号最近,在北京举行了以“新起点再出发”为主题的量子位MEET2024智能未来大会。会上,量子位公布了围绕企业、人物、产品/解决方案三个方面的「2023人工智能年度...

