新闻中心

LimSim++:多模态大模型在自动驾驶中的新舞台

2024-03-12
浏览次数:
返回列表

论文名称:limsim++: a closed-loop platform for deploying multimodal llms in autonomous driving

项目主页:https://pjlab-adg.github.io/limsim_plus/

LimSim++:多模态大模型在自动驾驶中的新舞台

*器简介

随着多模态大语言模型((M)LLM)在人工智能领域掀起研究热潮,其在自动驾驶技术中的应用逐渐成为关注的焦点。这些模型通过强大的广义理解和逻辑推理能力,为构建安全可靠的自动驾驶系统提供了有力支持。虽然已有闭环*平台如HighwayEnv、CARLA和NuPlan等,能够验证LLM在自动驾驶中的表现,但用户通常需要自行适配这些平台,这不仅提高了使用门槛,也限制了LLM能力的深入挖掘。

为了克服这一挑战,上海人工智能实验室的智能交通平台组推出了**LimSim++**,这是一款专为(M)LLM设计的自动驾驶闭环*平台。LimSim++的推出,旨在为自动驾驶领域的研究者提供一个更加适宜的环境,以全面探索LLM在自动驾驶技术中的潜力。该平台能够提取并处理来自SUMO和CARLA等*环境的场景信息,将其转化为LLM所需的多种输入形式,包括图像信息、场景认知和任务描述。此外,LimSim++还具备运动原语转换功能,能根据LLM的决策快速生成合适的行驶轨迹,实现闭环*。更重要的是,LimSim++为LLM创造了一个持续学习的环境,通过评估决策结果并提供反馈,帮助LLM不断优化驾驶策略,提高Driver Agent的驾驶性能。

LimSim++:多模态大模型在自动驾驶中的新舞台

*器特点

LimSim++在自动驾驶*领域具有显著特点,为(M)LLM驱动的Driver Agent提供了理想的闭环*和持续学习环境。

  • LimSim++支持多种驾驶场景的模拟,如十字路口、匝道和环岛等,确保Driver Agent能够在各种复杂路况下接受挑战。这种多样化的场景设置有助于LLM获取更丰富的驾驶经验,提高其在真实环境中的适应能力。
  • LimSim++支持多种模态输入的大语言模型。LimSim++不仅提供基于规则的场景信息生成,同时可以与CARLA联调,能够提供丰富的视觉输入,满足(M)LLM在自动驾驶中的视觉感知需求。
  • LimSim++注重持续学习能力。LimSim++集成了评估、反思和记忆等模块,帮助(M)LLM在*过程中不断积累经验,优化决策策略。

创建属于自己的Driver Agent

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜

LimSim++:多模态大模型在自动驾驶中的新舞台

思高网络商城CycooShop 思高网络商城CycooShop

主要模块:首页商品推荐 /顾客留言发布 /商品分类浏览 /按商品分类、关键字搜索商品 /商品购物车 人信息中心 /显示商品详细介绍以及多图片显示功能 /商品类别管理有分大类中类的类别设定商品搜索类别设定 /商品管理有临时关闭不在线功能 /订单管理 /支付类型管理模块 留言管理 /后台权限分级管理 /密码修改 /新闻管理 /网站配置管理 /滚动广告管理v1.58更新:1、增强支付接口设置。2、内置支

思高网络商城CycooShop 0 查看详情 思高网络商城CycooShop

LimSim++为用户提供了丰富的接口,可以满足Driver Agent的定制需求,提高了LimSim++开发的灵活性,并且降低了使用门槛。

  1. Prompt构建
  • LimSim++支持用户自定义prompt,从而改变输入给(M)LLM的文本信息,包括角色设置、任务要求、场景描述等信息。
  • LimSim++提供了基于json格式的场景描述模板,支持用户零代码进行prompt的修改,无需考虑信息提取的具体实现。
  1. 决策评估模块
  • LimSim++提供了对(M)LLM决策结果进行评估的baseline,用户可以通过改变权重参数来调节评价偏好。
  1. 框架的灵活性
  • LimSim++支持用户为(M)LLM添加自定义的工具库,例如感知工具、数值处理工具等等。

快速上手

  • Step 0:安装SUMO(Version≥v1.15.0,  ubuntu)
sudo add-apt-repository ppa:sumo/stablesudo apt-get updatesudo apt-get install sumo sumo-tools sumo-doc
  • Step 1:下载LimSim++源码压缩包,解压后切换到正确分支
git clone https://github.com/PJLab-ADG/LimSim.gitgit checkout -b LimSim_plus
  • Step 2:安装依赖 (要求装有conda)
cd LimSimconda env create -f environment.yml
  • Step 3: 运行*
  • 单独运行*
python ExampleModel.py
  • 使用LLM进行自动驾驶
export OPENAI_API_KEY='your openai key'python ExampleLLMAgentCloseLoop.py
  • 使用VLM进行自动驾驶
# Terminal 1cd path-to-carla/./CarlaUE4.sh# Termnial 2cd path-to-carla/cd PythonAPI/util/python3 config.py --map Town06# Termnial 2export OPENAI_API_KEY='your openai key'cd path-to-LimSim++/python ExampleVLMAgentCloseLoop.py

更多内容请查看LimSim++的github:https://github.com/PJLab-ADG/LimSim/tree/LimSim_plus,如有其他疑问请在GitHub的Issues中提出或直接邮件联系我们!

欢迎学术界和工业界小伙伴共同开发LimSim++,共建开源生态!

以上就是LimSim++:多模态大模型在自动驾驶中的新舞台的详细内容,更多请关注其它相关文章!


# 实拍  # 衡水关键词seo推广  # 宁夏银川网站优化步骤  # 商丘网站建设小程序  # 网站负面优化  # seo网站推广工资  # 很好的外贸网站建设  # 快播网站建设工作推荐  # 售后营销推广方案策划  # seo传动器  # 邢台网站建设网站优化  # 自己的  # 智能  # 商品分类  # 模态  # 可直接  # 新能源  # 自定义  # 日韩  # 多模  # 闭环  # fig  # 驾驶 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: 如何在命令行执行一个jar  单身聊天app有哪些软件 2025最靠谱的单身交友软件推荐  j*a怎么用json数组  一尺是多少厘米  j*a怎么求数组均值  win7如何打开命令行窗口  闪光灯power闪烁是什么意思  vue组件typescript怎么用  win7怎么取消360显示的壁纸  苹果ipad爱奇艺怎么投屏到电视  typescript属性只读如何修改  为什么用typescript  显示器power接口是什么意思  春运什么时候开始抢票  命令行如何运行j*a  typescript怎么判断单选按钮  面包车收音机power是什么意思  element ui是什么  a股等权平均市盈率是什么意思  怎么下载360桌面壁纸  建伍遥控器power是什么意思  单片机怎么控制内功率  如何在一串数字前面去掉四位数的命令  j*a数组求和怎么算  电动车power灯亮是什么意思  如何查看固态硬盘分区  折叠屏手机为什么没火  春运抢票失败怎么抢  360f4怎么取消百变壁纸  华为5g手机掉了怎么定位找回  春运抢票最多能抢几趟车  python 如何执行linux命令  手机拍电脑屏幕有条纹怎么解决  linux如何合并分区命令  丰田type-c接口是什么  学typescript要求什么  shell如何执行sql脚本命令行  一帧是多少秒  手机换电池要多少钱  typescript有哪些版本  空调power灯一直闪是什么意思  哪里要用typescript  命令指示符如何打开盘符  类似微信的聊天软件有哪些  为什么都做折叠屏手机呢  对象数组怎么用j*a  对应市盈率是30X是什么意思  春运抢票多久可以买到票  360n4怎么关闭锁屏壁纸  360桌面壁纸怎么弄掉 

搜索