新闻中心
-
12-15AAAI2025:Far3D - 创新的直接干到150m视觉3D目标检测思路最近在Arxiv上阅读到一篇关于纯视觉环视感知的最新研究,该研究基于PETR系列方法,并专注于解决远距离目标检测的纯视觉感知问题,将感知范围扩大到150米。这篇...
-
12-15更深层的理解视觉Transformer, 对视觉Transformer的剖析本文为经过自动驾驶之心公众号授权转载,请在转载时与出处联系写在前面&&笔者的个人理解目前,基于Transformer结构的算法模型已经在计算机视...
-
12-04来一趟未来之旅,首个多视图预测+规划自动驾驶世界模型抵达近期,世界模型的概念引发了火热浪潮,而自动驾驶领域岂能隔岸观「火」。来自中科院自动化所的团队,首次提出了一种名为Drive-WM的全新多视图世界模型,旨在增强端...
-
11-26用视觉来做Prompt!沈向洋展示IDEA研究院新模型,无需训练或微调,开箱即用用视觉来做Prompt,会带来怎样的体验?只需在图中随意勾画一下,即可立即标出相同的类别!即便是那种GPT-4V都难搞定的数米粒的环节。只需要你手动拉一下框,就...
-
11-06北大具身智能新成果:无需训练,听指令就能灵活走位北京大学董豪团队具身导航最新成果来了:无需额外建图和训练,只需说出导航指令,如:Walkforwardacrosstheroomandwalkthroughth...
-
10-16NeRF是什么?基于NeRF的三维重建是基于体素吗?1介绍神经辐射场(NeRF)是深度学习和计算机视觉领域的一个相当新的范式。ECCV2020论文《NeRF:将场景表示为视图合成的神经辐射场》(该论文获得了最佳论...

