新闻中心
-
07-17无损加速最高5x,EAGLE-2让RTX 3060的生成速度超过A100AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
07-11大模型推理效率无损提升3倍,滑铁卢大学、北京大学等机构发布EAGLE大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一...
-
05-24百度推荐资源冷启动实践一、内容冷启动概念及挑战百度Feed推荐是一个月活数亿的综合信息流推荐平台。该平台涵盖了图文、视频、动态、小程序、问答等多种内容类型。它不仅提供类似于单列或双列...
-
05-113倍生成速度还降内存成本,超越Medusa2的高效解码框架终于来了高效解码n-token序列,CLLMs+Jacobi解码框架。传统上,大型语言模型(LLMs)被认为是顺序解码器,逐个解码每个token。来自上海交通大学、加利...
-
04-11用户画像算法:历史、现状与未来一、用户画像简介画像是一种人类可理解的、机器可读写的,对用户的结构化描述。它不仅可以提供个性化服务,还在企业的战略决策和商业分析中发挥了重要作用。1.画像的分类...
-
03-07画像标签体系构建与应用实践一、画像标签体系去哪儿在每个业务发展过程中构建了独立的画像标签体系。随着公司的不断壮大,需将各个业务的画像标签体系进行整合。从技术角度看,整合的过程相对简单,但...

