新闻中心
-
03-02VPR 2025 满分论文!Meta提出EfficientSAM:快速分割一切!EfficientSAM这篇工作以5/5/5满分收录于CVPR2024!作者在某社交媒体上分享了该结果,如下图所示:LeCun图灵奖得主也强烈推荐了该工作!在近...
-
03-01ControlNet作者新作:AI绘画能分图层了!项目未开源就斩获660 Star“绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用StableDiffusion可以直接生成单个或多个...
-
03-01陈丹琦团队新作:Llama-2上下文扩展至128k,10倍吞吐量仅需1/6内存陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法:它仅用8k大小的token文档进行训练,就能将Llama-2窗口扩展至128k。最重要的是,在这个过程中,...
-
03-01几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型:从质疑Scaling到成为Scaling在标准的UNet结构中,longskipconnection上的scaling系数一般为1。然而,在一些著名的扩散模型工作中,比如Imagen,Score-ba...
-
02-29微软6页论文爆火:三进制LLM,真香!这就是由微软和中国中科院大学在最新一项研究中所提出的结论——所有的LLM,都将是1.58bit的。具体而言,这项研究提出的方法叫做BitNetb1.58,可以说...
-
02-20GPT-4可能也在用的推测解码是什么?一文综述前世今生和应用情况众所周知,大型语言模型(LLM)的推理通常需要使用自回归采样,这个推理过程相当缓慢。为了解决这个问题,推测解码(SpeculativeDecoding)已经成为...

