新闻中心
-
05-27港大字节提出多模态大模型新范式,模拟人类先感知后认知,精确定位图中物体当前,多模态大模型(MLLM)在多项视觉任务上展现出了强大的认知理解能力。然而大部分多模态大模型局限于单向的图像理解,难以将理解的内容映射回图像上。比如,模型能...
-
03-21CMU朱俊彦、Adobe新作:512x512图像推理,A100只用0.11秒简笔素描一键变身多风格画作,还能添加额外的描述,这在CMU、Adobe联合推出的一项研究中实现了。CMU助理教授朱俊彦是该研究的一位作者,他的团队在ICCV20...
-
01-29苹果公司采用自回归语言模型进行图像模型的预训练1、背景在GPT等大模型出现后,语言模型这种Transformer+自回归建模的方式,也就是预测nexttoken的预训练任务,取得了非常大的成功。那么,这种自...
-
01-10北大出品:纹理质量和多视角一致性的最新SOTA,在2分钟内实现1张图的3D转换只需两分钟,玩转图片转3D!还是高纹理质量、多视角高一致性的那种。不管是什么物种,输入时的单视图图像还是这样婶儿的:两分钟后,3D版大功告成:△上,Repain...
-
11-30LCM:大大加快生成高质量图像的新方法作者丨MikeYoung译文:重新创作内容而不改变原义的语言是中文,无需出现原句审校内容,无需改变原意,需要将语言改写为中文,不需要出现原句推荐|51CTO技术...
-
10-11Adobe新版AI绘画炸场,2k分辨率在线就能玩,网友:效果比DALL·E 3更强Firefly新版文生图工具,直接炸场Adobe春晚!在Adobe的年度MAX大会上,他们推出了一系列令人瞩目的新功能。其中最引人注目的是“文生图2.0”Fir...

