新闻中心
-
10-12连续发布两款万亿参数模型,蚂蚁 AI 来势汹汹刚刚过去的国庆,各行各业进入放假模式,但大模型行业却一刻也没闲着。过去的半个月,国内外大模型的头部团队有十余款重磅产品发布,但每个团队的产品侧重不同。其中,九月...
-
09-19DeepSeek GRPO或致模型崩溃,Qwen3新范式GSPO能否成新标准?大型语言模型的训练一般分为“预训练”和“后训练”两个阶段。“预训练”阶段,开发者借助大规模文本数据集对模型进行训练,使其学会预测句子中的下一个词;“后训练”阶段...
-
04-30Qwen3发布当天,寒武纪已完*系列支持4月29日,阿里Qwen团队发布了8款新模型,Qwen3系列正式上线并开源。同日,寒武纪已完成对Qwen3全系列的支持。用户可以在寒武纪®AIDC®大模型一体机...
-
共1页 3条

