新闻中心
-
07-01亚马逊云创新「神经稀疏检索」:仅需要文本匹配就能实现语义搜索AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-28将图像自动文本化,图像描述质量更高、更准确了AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-24字节豆包全新图像Tokenizer:生成图像最低只需32个token,最高提速410倍AIxiv专栏是本站发布学术、技术内容的栏目。过去数年,本站AIxiv专栏接收报道了2000多篇内容,覆盖全球各大高校与企业的顶级实验室,有效促进了学术交流与传...
-
06-11用神经架构搜索给LLM瘦身,模型变小,准确度有时反而更高用神经架构搜索给LLM瘦身,同等准确度可让LLaMA2-7B模型大小降2倍。LLM(大型语言模型)的一个主要特点是“大”,也因此其训练和部署成本相当高,如何在保...
-
06-06首次证实白盒Transformer可扩展性!马毅教授CRATE-α:鲸吞14亿数据,性能稳步提升在过去的几年里,Transformer架构在自然语言处理(NLP)、图像处理和视觉计算领域的深度表征学习中取得了显著进展。这些成果使得AI领域的主导技术成为了深...
-
06-03不同数据集有不同的Scaling law?而你可用一个压缩算法来预测它一般而言,训练神经网络耗费的计算量越大,其性能就越好。在扩大计算规模时,必须要做个决定:是增多模型参数量还是提升数据集大小——必须在固定的计算预算下权衡这两项因...

