训练_第12页_陕西然坤悦科技有限公司

400-5689-0921
客服咨询
- 在线咨询

新闻中心 NEWS CENTER

您当前位置：首页

03-02

VPR 2025 满分论文！Meta提出EfficientSAM：快速分割一切！

EfficientSAM这篇工作以5/5/5满分收录于CVPR2024！作者在某社交媒体上分享了该结果，如下图所示：LeCun图灵奖得主也强烈推荐了该工作！在近...
03-01

ControlNet作者新作：AI绘画能分图层了！项目未开源就斩获660 Star

“绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt，用StableDiffusion可以直接生成单个或多个...
03-01

陈丹琦团队新作：Llama-2上下文扩展至128k，10倍吞吐量仅需1/6内存

陈丹琦团队刚刚发布了一种新的LLM上下文窗口扩展方法：它仅用8k大小的token文档进行训练，就能将Llama-2窗口扩展至128k。最重要的是，在这个过程中，...
03-01

几行代码稳定UNet ! 中山大学等提出ScaleLong扩散模型：从质疑Scaling到成为Scaling

在标准的UNet结构中，longskipconnection上的scaling系数一般为1。然而，在一些著名的扩散模型工作中，比如Imagen，Score-ba...
02-29

微软6页论文爆火：三进制LLM，真香！

这就是由微软和中国中科院大学在最新一项研究中所提出的结论——所有的LLM，都将是1.58bit的。具体而言，这项研究提出的方法叫做BitNetb1.58，可以说...
02-20

GPT-4可能也在用的推测解码是什么？一文综述前世今生和应用情况

众所周知，大型语言模型（LLM）的推理通常需要使用自回归采样，这个推理过程相当缓慢。为了解决这个问题，推测解码（SpeculativeDecoding）已经成为...

: 电话

: 客服

: 地图

: 搜索