新闻中心
-
04-11大模型做时序预测也很强!华人团队激活LLM新能力,超越一众传统模型实现SOTA大语言模型潜力被激发——无需训练大语言模型就能实现高精度时序预测,超越一切传统时序模型。蒙纳士大学、蚂蚁和IBM研究院联合开发了一种通用框架,成功推动了大语言模...
-
04-08为什么大型语言模型都在使用 SwiGLU 作为激活函数?如果你一直在关注大型语言模型的架构,你可能会在最新的模型和研究论文中看到“SwiGLU”这个词。SwiGLU可以说是在大语言模型中最常用到的激活函数,我们本篇文...
-
04-07超越GPT-4,斯坦福团队手机可跑的大模型火了,一夜下载量超2k在大模型落地应用的过程中,端侧AI是非常重要的一个方向。近日,斯坦福大学研究人员推出的Octopusv2火了,受到了开发者社区的极大关注,模型一夜下载量超2k。...
-
03-28量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!写在前面当前自动驾驶系统摆脱对高精度地图依赖的算法之一,是利用远距离范围下的感知表现依然较差的现实依然较差。为此,我们提出了P-MapNet,其中的“P”专注于...
-
03-27详解Latte:去年底上线的全球首个开源文生视频DiT随着Sora发布成功,视频DiT模型引起了广泛关注和讨论。设计稳定的超大规模神经网络一直是视觉生成领域研究的重点。DiT模型的成功为图像生成的规模化带来了新的可...
-
03-26CLIP-BEVFormer:显式监督BEVFormer结构,提升长尾检测性能写在前面&笔者的个人理解目前,在整个自动驾驶系统当中,感知模块扮演了其中至关重要的角色,行驶在道路上的自动驾驶车辆只有通过感知模块获得到准确的感知结果后...

