国内首款AI助盲眼镜今日发布:通义千问赋能视障人士出行新突破
发布背景与核心产品
2025年12月3日,正值国际残疾人日,杭州瞳行科技公司在阿里云的支持下,正式发布了国内首款AI助盲眼镜。这款产品专为解决我国超1700万视力障碍人士的出行难题而设计,基于阿里云通义千问Qwen-VL、OCR等系列模型打造,集出行避障、找物读物、语音助手和一键求助亲友等多项核心功能于一体。产品由眼镜主体、手机、遥控指环、盲杖四部分组成,目前已正式面向市场销售。
视障人士出行痛点与市场需求
出行问题是视障人士面临的首要挑战。当前,我国视障人群主要依赖导航软件和人工帮助,但在实际使用中存在诸多不便:
- “最后十米”困境:导航软件常无法精准定位到目的地最后阶段,导致视障人士难以找到具体入口。
- 响应延迟:服务人员无法及时响应求助请求,增加了出行风险。
- 工具单一:除传统盲杖外,国内缺乏普及的现代化助盲出行工具,导致许多视障人士选择“少出行”或“不出行”,严重影响生活质量。
产品核心技术与创新亮点
1. 超低延迟避障能力
瞳行AI助盲眼镜的核心优势在于其300ms超低延迟的避障功能。成年人正常步行一步约37厘米,300ms的响应速度意味着用户每迈出一步,眼镜即可完成一次环境分析并给出实时道路提示。这种极速响应有效解决了传统辅助工具的延迟问题,提升了出行安全性。
2. 多场景智能适配
- 避障场景:大模型通过121度超广角双摄像头实时捕捉环境,简单概括周边情况,重点识别公交车牌、路牌、行人、车辆等关键障碍物,并以简洁语音提示用户(如“前方3米有行人,请绕行”)。
- 找店点餐场景:在复杂环境中,大模型会对文本和环境进行详细总结播报。例如,帮助用户识别店铺招牌、菜单内容、商品标签等,实现“看到”文字并“听到”解读,极大提升生活自主性。
3. 硬件与软件协同设计
- 硬件配置:121度超广角双摄像头确保视野覆盖范围广,配合自研视觉模型,实现精准环境感知。
- 多部件联动:眼镜主体负责数据采集与处理,手机作为运算中枢运行通义千问模型,遥控指环方便盲人用户触摸操作,盲杖则提供传统物理支撑,形成“智能+传统”的双重保障。
技术突破与行业影响
1. 大模型时代的成本与效率革命
杭州瞳行科技市场及技术总监陈刚指出,大模型的出现彻底改变了AI助盲产品的研发格局:
- 算力成本骤降:相比大模型出现前,算力成本降低了约十倍,使AI初创企业能够以较低门槛投入研发。
- 基模复用+微调优化:借助通义千问的基础模型能力,瞳行科技无需从零构建复杂系统,只需通过针对性微调即可快速实现所需功能,大幅缩短了产品研发周期。
2. 解决“最后十米”难题
针对视障人士普遍困扰的“最后十米”导航失效问题,该眼镜通过高精度定位(双频GPS与北斗模块)和实时环境分析,能够精准引导用户到达目的地门口,并识别门牌号、电梯按钮等细节信息,真正实现“门到门”的无障碍出行。
社会意义与未来展望
瞳行AI助盲眼镜的发布,不仅是技术上的创新,更是对视障群体权益的有力保障。它通过AI技术为视障人士提供了“第二视觉”,帮助他们克服出行障碍,提升独立生活能力和社会参与度。
未来,随着技术的不断迭代,该产品有望在以下方面进一步优化:
- 识别精度提升:结合更多训练数据和算法优化,提高对复杂环境(如室内障碍物、动态人流)的识别准确性。
- 功能拓展:增加人脸识别、情绪感知等功能,让视障人士能更好地与他人互动。
- 价格亲民化:通过规模化生产和技术成熟化,降低产品成本,让更多视障人士负担得起。
总之,这款AI助盲眼镜的问世,标志着我国在无障碍科技领域迈出了重要一步。在通义千问等大模型技术的赋能下,科技正以更温暖的方式融入社会公益,为视障群体点亮前行之路。