新闻中心
-
09-07用60%成本干80%的事,DeepSeek分享沉淀多年的高性能深度学习架构硬件发展速度跟不上AI需求,就需要精妙的架构和算法。根据摩尔定律,计算机的速度平均每两年就会翻一倍,但深度学习的发展速度还要更快,如图1和2所示。可以看到,AI...
-
07-31第二届「简约与学习会议 (CPAL)」将在斯坦福大学举办,征稿进行中CPAL会议简介CPAL是一年一度的研究型学术会议,专注于解决机器学习、信号处理、优化等领域中普遍存在的简约(Parsimonious)、低维结构(LowDim...
-
06-24涵盖文本、定位和分割任务,智源、港中文联合提出首个多功能3D医学多模态大模型作者|香港中文大学白帆编辑|ScienceAI近日,香港中文大学和智源联合提出的M3D系列工作,包括M3D-Data,M3D-LaMed和M3D-Bench,从...
-
04-16DeepMind升级Transformer,前向通过FLOPs最多可降一半引入混合深度,DeepMind新设计可大幅提升Transformer效率。Transformer的重要性无需多言,目前也有很多研究团队致力于改进这种变革性技术,...
-
03-28量产杀器!P-Mapnet:利用低精地图SDMap先验,建图性能暴力提升近20个点!写在前面当前自动驾驶系统摆脱对高精度地图依赖的算法之一,是利用远距离范围下的感知表现依然较差的现实依然较差。为此,我们提出了P-MapNet,其中的“P”专注于...
-
03-08田渊栋等人新作:突破内存瓶颈,让一块4090预训练7B大模型MetaFAIR田渊栋参与的研究项目在上个月获得了广泛好评。在他们的论文《MobileLLM:OptimizingSub-billionParameterLan...

