新闻中心
-
05-31MagicTryOn— 浙大联合vivo等机构推出的视频虚拟试穿框架MagicTryOn简介MagicTryOn是由浙江大学计算机科学与技术学院、vivo移动通信等单位共同研发的,采用视频扩散Transformer的视频虚拟试穿...
-
05-253DTown— 哥伦比亚联合Cybever AI等推出单视图生成3D城镇场景的框架3DTown是什么3DTown是哥伦比亚大学联合CybeverAI等机构推出的从单张俯视图生成3D城镇场景框架。框架基于区域化生成和空间感知的3D修复技术,将输...
-
05-16MT-Color— 上海交大联合哔哩哔哩推出的可控图像着色框架MT-Color是什么MT-Color是由上海交通大学与哔哩哔哩共同研发的一种基于扩散模型的可控图像着色系统,它允许用户借助实例导向的文本提示和掩码来实现精准的...
-
05-08D-DiT— 耶鲁大学联合字节Seed等机构推出的多模态扩散模型D-DiT(双重扩散变换器)是由卡内基梅隆大学、耶鲁大学和字节跳动Seed实验室共同开发的一种多模态扩散模型,能够统一处理图像生成和理解任务。该模型结合了连续图...
-
05-01RepText— Liblib AI联合Shakker Labs推出的多语言视觉文本渲染框架RepText是由ShakkerLabs和LiblibAI开发的多语言视觉文本渲染框架,通过复制字形而非理解文本内容来实现高质量的文本渲染。该框架利用预训练的单...
-
04-19万相首尾帧模型— 阿里通义开源的首尾帧生视频模型万相首尾帧模型(Wan2.1-FLF2V-14B)是一款开源的14B参数规模的首尾帧生成视频模型。该模型可以根据用户提供的首帧和尾帧图像,自动生成流畅的高清视频...

