新闻中心

国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题

2025-12-13
浏览次数:
返回列表

近日,杭州瞳行科技正式推出国内首台ai助盲眼镜,致力于以人工智能技术切实缓解视障人士在日常出行与生活场景中面临的现实困境。该产品已完*套化设计并上架销售,包含ai眼镜本体、专属配套手机、可穿戴遥控指环及一根智能适配盲杖,用户可一站式购齐、即开即用。

这款眼镜功能全面,覆盖出行避障、物品查找与文本识别、语音交互助手、一键紧急求助亲友等核心需求。在出行模式下,系统端到端延迟控制在约300毫秒以内,响应极为迅捷,能精准匹配人体自然步频——每迈出一步,即可同步获取实时路况语音提示。

硬件层面,设备搭载121度超广角双摄像头模组,协同手机端强大算力与指环式交互操作,构建起“感知—决策—反馈”的闭环式人机协作体系。技术实现上,并未采用单一模型架构。瞳行融合自研视觉理解模型与通义千问Qwen-VL多模态大模型、OCR识别系列模型,并针对不同使用情境进行精细化参数调优与任务分流。

例如,在避障类场景中,系统需在毫秒级内判断前方是否存在大型障碍物及其可通行性(如能否迈过台阶),此时模型输出高度精简、指令明确,如“正前方有三级台阶,左侧2米处有慢行行人”,信息被压缩为可立即执行的动作指引;而在找店点餐类场景中,系统需准确识别招牌文字、菜单段落排版、窗口价目表等多源异构信息,会对图像内容进行深度结构化解析与语义整合,再通过语音清晰复述关键要素,处理耗时略长但信息维度更完整、上下文更连贯。

研发团队在模型选型与硬件配置之间进行了大量权衡取舍。为保障避障响应的极致低延时,他们将大模型能力按场景解耦:对强时效性任务(如动态避让)优先启用轻量化本地推理逻辑,大模型仅作辅助校验;而对依赖深层语义解析与长文本理解的任务(如菜单解读、公告阅读),才激活高复杂度模型参与运算。

硬件选型亦围绕实用性展开:超宽视角双摄显著缩小视觉盲区;指环支持无感切换功能模式与触发SOS求助;手机承担主要计算负载与网络连接任务;传统盲杖则予以保留并做智能化适配,延续用户既有使用习惯。

出行难,长期是视障群体最突出的生活痛点。我国视力障碍人口逾1700万,日常通勤高度依赖电子导航与他人协助,却频繁遭遇“最后十米”导航失效问题——门牌模糊不清、出入口被临时占用、楼道标识缺失或位置隐蔽等情形屡见不鲜;加之公共服务响应存在不确定性,不少视障者被迫大幅减少外出频次,甚至长期居家。

本款AI助盲眼镜正是直击上述高频难点,重点强化复杂城市环境下的毫秒级环境感知能力与自然语言交互体验。从行业方法论看,瞳行采取“通用基座模型+垂直场景微调”的技术路径,提升模型复用效率与落地适配性。

市场与技术总监曾指出:“在大模型尚未普及的阶段,独立部署高性能AI算力的成本极高,中小创业公司往往难以承受。如今随着通义千问等高质量开源基础模型的成熟与算力基础设施成本持续下降,企业得以将资源重心转向场景工程打磨与用户体验优化,真正让这类软硬一体的助残硬件具备规模化落地与可持续运营的商业基础。”

拾贝 拾贝

一键同步微信读书所有笔记和划线,并在新标签页回顾

拾贝 186 查看详情 拾贝

该产品在多样化真实场景中展现出差异化性能表现:

  • 在人流密集街区,系统侧重对移动目标的轨迹预测与简洁化语音提示;
  • 行至公交站或地铁口时,自动识别线路指示牌与到站车次信息,优先播报与用户目的地强相关的关键字段;
  • 进入餐厅或需阅读纸质材料时,OCR模块将图像实时转为可读文本,大模型进一步提炼要点并逐句语音播报;
  • 若识别置信度不足或结果存疑,系统主动提示用户确认,或一键发起远程求助,即时向预设联系人发送当前位置与现场语音片段。

操作流程同样贴合用户实际:开机佩戴后,可通过语音或指环快捷选择“出行”或“阅读”主模式;指环支持多档位切换子功能;遇突发状况仅需单击指环,即可自动上传定位坐标与最近10秒音频至紧急联系人终端。

从企业发展策略来看,瞳行坚持“自研模型打底 + 大模型赋能”的双轨协同路线:自研模型专注高速响应与边缘端稳定执行,大模型负责高阶语义理解与复杂上下文推理,二者经由场景驱动的任务调度机制与联合微调,在速度与精度间取得动态平衡。

面向市场,整套“眼镜+手机+指环+盲杖”组合设计,既降低初次使用门槛,又尊重传统辅具使用惯性,是一种务实且具包容性的产品哲学。关于成本控制与长期可持续性,算力成本的实质性下降成为关键支点——过去同类项目常因算力投入过高导致资金链承压,如今依托成熟的基础模型生态,企业可聚焦于真实场景的问题定义、交互设计与服务闭环建设。

目前,该AI助盲眼镜已全面开放购买,用户可直接选购含眼镜主机、定制手机、遥控指环及智能盲杖在内的完整套装。

☞☞☞AI 智能聊天, 问答助手, AI 智能搜索, 免费无限量使用 DeepSeek R1 模型☜☜☜



以上就是国内首款AI助盲眼镜发布,通义千问驱动解决视障出行难题的详细内容,更多请关注其它相关文章!


# 首款  # 老域名seo优化  # 新网站如何做网站推广赚钱  # 优化一个网站推荐的软件  # 鄂州网站建设维护  # 德令哈网站推广优化  # 聊城网站建设优化公司  # 南宁seo付费推广  # 崂山网站建设运营  # 南岸靠谱的seo电话  # 关键词排名看哪个  # 逐句  # 两月  # 通义千问  # 国内  # 好用  # 下载地址  # 闭环  # 景中  # 一键  # 拾贝  # qwen  # 大模型  # ai  # 人工智能 


相关栏目: 【 行业资讯67740 】 【 技术百科0 】 【 网络运营39195


相关推荐: j*a怎么用json数组  征信不好如何快速恢复 征信不好快速恢复的方法  md5解密是什么意思  笔记本电脑多少钱  光刻机是干什么用的  如何使用ping命令  怎么在爱奇艺中投屏到电视最新方法  汽车的type-c接口是什么  显卡上面TYPE-C是什么接口  新的固态硬盘如何分区  怎么在typescript定义集合  固态硬盘如何4k对其  新固态硬盘如何装系统  为什么夸克书架书单没了  vue怎么连接typescript  春运抢票最好抢什么票啊  问一下市盈率是什么意思  固态硬盘2m如何修复  typescript能开发什么  linux如何安装yum命令  hive中datediff函数怎么用 Hive中DATEDIFF函数的使用指南  如何找出命令行  对象数组怎么用j*a  夸克是什么用途  ai文件在线打开工具有哪些  dos命令如何复制目录结构  J*a数组静态怎么打  分享一个稳定的ao3镜像网址  单片机怎么储存和显示  虽千万人吾往矣什么意思  夸克前缀后缀什么意思啊  vivo手机nfc功能是什么意思  市盈率百分位roe是什么意思  固态硬盘坏了如何换硬盘  位置控制单片机怎么用的  油电混动车仪表盘上的power是什么意思  冰柜power是什么意思这个黄灯怎么不亮  苹果16粉色还有哪些机型  如何查询固态硬盘序列  汽车中控导航机power线是什么意思  固态硬盘如何显示  壁挂炉power常亮是什么意思  为什么夸克下载不到  angluar如何命令删除dist  typescript需要学多久  命令指示符如何打开盘符  市盈率和市净率是什么意思  锤子手机怎么不出5g  固态硬盘如何备份  估值水平比较中市盈率E是什么意思 

搜索