新闻中心
-
03-08「AI透视眼」,三次马尔奖获得者Andrew带队解决任意物体遮挡补全难题遮挡是计算机视觉很基础但依旧未解决的问题之一,因为遮挡意味着视觉信息的缺失,而机器视觉系统却依靠着视觉信息进行感知和理解,并且在现实世界中,物体之间的相互遮挡无...
-
03-08OccFusion:一种简单有效的Occ多传感器融合框架(性能SOTA)对3D场景的全面理解在自动驾驶中至关重要,最近的3D语义占用预测模型已经成功地解决了描述具有不同形状和类别的真实世界物体的挑战。然而,现有的3D占用预测方法在很...
-
03-07全面超越ViT,美团、浙大等提出视觉任务统一架构VisionLLAMA半年多来,Meta开源的LLaMA架构在LLM中经受了考验并大获成功(训练稳定、容易做scaling)。沿袭ViT的研究思路,我们能否借助创新性的LLaMA架构...
-
03-06Stable Diffusion 3论文终于发布,架构细节大揭秘,对复现Sora有帮助?StableDiffusion3的论文终于来了!这个模型于两周前发布,采用了与Sora相同的DiT(DiffusionTransformer)架构,一经发布就引...
-
03-06Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?StabilityAI在发布了StableDiffusion3之后,今天公布了详细的技术报告。论文深入分析了StableDiffusion3的核心技术——改进版...
-
03-050.5秒,无需GPU,Stability AI与华人团队VAST开源单图生成3D模型TripoSR最近,文生视频模型Sora掀起了新一轮生成式AI模型浪潮,模型的多模态能力引起广泛关注。现在,AI模型在3D内容生成方面又有了新突破。在成功推出图片生成和视频生...

