切换到宽版
  • 17阅读
  • 3回复

[智能应用]瞳行科技发布国内首款AI助盲眼镜,基于阿里通义千问打造 [复制链接]

上一主题 下一主题
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊
 

发帖
294772
金币
15900
道行
40005
原创
108
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36450(小时)
注册时间: 2012-09-03
最后登录: 2025-12-04
只看楼主 正序阅读 使用道具 楼主  发表于: 昨天 11:50

IT之家 12 月 3 日消息,据阿里云消息,今日杭州瞳行科技公司正式发布国内首款 AI 助盲眼镜。该眼镜基于通义千问 Qwen-VL、OCR 等系列模型,具有出行避障、找物读物、语音助手和一键求助亲友等功能。该眼镜由眼镜主体、手机、遥控指环、盲杖四部分组成,目前已正式面市。



据IT之家了解,出行一直是视障人士最关注的问题。据统计,中国有超 1700 万视力障碍人士,其出行高度依赖导航软件及人工帮助,经常遇到最后十米导航无法找到目的地、服务人员无法及时响应等问题。但目前国内除盲杖外,并没有其他普及的助盲出行工具。调查显示,许多视障人士选择“少出行”或“不出行”。
为解决“出行难”问题,瞳行将自研视觉模型与通义千问结合,配合 121 度超广角双摄像头等硬件,着重打造低延时避障能力,并根据不同场景对模型进行针对性调优。据介绍,在出行场景,该眼镜可实现 300ms 的超低延迟,相当于每迈出一步,眼镜即可给出道路提示。
比如在避障场景,大模型会简单概括周边环境,识别公交车牌、路牌等,以及时响应;而在找店点餐等场景,大模型则会对文本、环境进行总结和详细播报,帮助用户找到目的地以及阅读特定段落。


杭州瞳行科技公司市场及技术总监陈刚表示:“大模型出现之前,做 AI 助盲产品比较难。一方面,算力成本是目前的十倍左右。算力成本的大幅降低,让 AI 初创企业能够快速发展起来;另一方面,有了通义千问,我们通过基模复用 + 微调优化即可快速实现所需功能。”


山庄提示: 道行不够,道券不够?---☆点此充值☆
 
天人地
在线jjybzxw

UID: 551814


发帖
208046
金币
581184
道行
2005
原创
2437
奖券
3180
斑龄
40
道券
1167
获奖
0
座驾
设备
摄影级
在线时间: 45803(小时)
注册时间: 2008-10-01
最后登录: 2025-12-04
只看该作者 地板  发表于: 昨天 19:11
国内首款AI助盲眼镜今日发布:通义千问赋能视障人士出行新突破

发布背景与核心产品
2025年12月3日,正值国际残疾人日,杭州瞳行科技公司在阿里云的支持下,正式发布了国内首款AI助盲眼镜。这款产品专为解决我国超1700万视力障碍人士的出行难题而设计,基于阿里云通义千问Qwen-VL、OCR等系列模型打造,集出行避障、找物读物、语音助手和一键求助亲友等多项核心功能于一体。产品由眼镜主体、手机、遥控指环、盲杖四部分组成,目前已正式面向市场销售。

视障人士出行痛点与市场需求
出行问题是视障人士面临的首要挑战。当前,我国视障人群主要依赖导航软件和人工帮助,但在实际使用中存在诸多不便:
- “最后十米”困境:导航软件常无法精准定位到目的地最后阶段,导致视障人士难以找到具体入口。
- 响应延迟:服务人员无法及时响应求助请求,增加了出行风险。
- 工具单一:除传统盲杖外,国内缺乏普及的现代化助盲出行工具,导致许多视障人士选择“少出行”或“不出行”,严重影响生活质量。

产品核心技术与创新亮点
1. 超低延迟避障能力
瞳行AI助盲眼镜的核心优势在于其300ms超低延迟的避障功能。成年人正常步行一步约37厘米,300ms的响应速度意味着用户每迈出一步,眼镜即可完成一次环境分析并给出实时道路提示。这种极速响应有效解决了传统辅助工具的延迟问题,提升了出行安全性。

2. 多场景智能适配
- 避障场景:大模型通过121度超广角双摄像头实时捕捉环境,简单概括周边情况,重点识别公交车牌、路牌、行人、车辆等关键障碍物,并以简洁语音提示用户(如“前方3米有行人,请绕行”)。
- 找店点餐场景:在复杂环境中,大模型会对文本和环境进行详细总结播报。例如,帮助用户识别店铺招牌、菜单内容、商品标签等,实现“看到”文字并“听到”解读,极大提升生活自主性。

3. 硬件与软件协同设计
- 硬件配置:121度超广角双摄像头确保视野覆盖范围广,配合自研视觉模型,实现精准环境感知。
- 多部件联动:眼镜主体负责数据采集与处理,手机作为运算中枢运行通义千问模型,遥控指环方便盲人用户触摸操作,盲杖则提供传统物理支撑,形成“智能+传统”的双重保障。

技术突破与行业影响
1. 大模型时代的成本与效率革命
杭州瞳行科技市场及技术总监陈刚指出,大模型的出现彻底改变了AI助盲产品的研发格局:
- 算力成本骤降:相比大模型出现前,算力成本降低了约十倍,使AI初创企业能够以较低门槛投入研发。
- 基模复用+微调优化:借助通义千问的基础模型能力,瞳行科技无需从零构建复杂系统,只需通过针对性微调即可快速实现所需功能,大幅缩短了产品研发周期。

2. 解决“最后十米”难题
针对视障人士普遍困扰的“最后十米”导航失效问题,该眼镜通过高精度定位(双频GPS与北斗模块)和实时环境分析,能够精准引导用户到达目的地门口,并识别门牌号、电梯按钮等细节信息,真正实现“门到门”的无障碍出行。

社会意义与未来展望
瞳行AI助盲眼镜的发布,不仅是技术上的创新,更是对视障群体权益的有力保障。它通过AI技术为视障人士提供了“第二视觉”,帮助他们克服出行障碍,提升独立生活能力和社会参与度。

未来,随着技术的不断迭代,该产品有望在以下方面进一步优化:
- 识别精度提升:结合更多训练数据和算法优化,提高对复杂环境(如室内障碍物、动态人流)的识别准确性。
- 功能拓展:增加人脸识别、情绪感知等功能,让视障人士能更好地与他人互动。
- 价格亲民化:通过规模化生产和技术成熟化,降低产品成本,让更多视障人士负担得起。

总之,这款AI助盲眼镜的问世,标志着我国在无障碍科技领域迈出了重要一步。在通义千问等大模型技术的赋能下,科技正以更温暖的方式融入社会公益,为视障群体点亮前行之路。
如何不发帖就快速得到金币道行
 
离线hexiwo

UID: 2046899

发帖
412
金币
314
道行
39
原创
0
奖券
0
斑龄
0
道券
0
获奖
0
座驾
哈弗H6
设备
摄影级
在线时间: 116(小时)
注册时间: 2017-04-23
最后登录: 2025-12-03
只看该作者 板凳  发表于: 昨天 14:48
科技点亮人生照进了现实
如何不发帖就快速得到金币道行
 
在线天人地

UID: 1627269

精华: 2
级别: 上清仙尊

发帖
294772
金币
15900
道行
40005
原创
108
奖券
147
斑龄
0
道券
30
获奖
0
座驾
设备
摄影级
在线时间: 36450(小时)
注册时间: 2012-09-03
最后登录: 2025-12-04
只看该作者 沙发  发表于: 昨天 11:53
瞳行科技发布国内首款AI助盲眼镜,基于通义千问Qwen-VL和OCR模型,集成出行避障、找物读物、语音助手、一键求助亲友四大功能,目前已正式面市。

🔍 背景说明
中国有超1700万视障人群,传统导航软件和盲杖难以解决“最后十米”难题,而AI助盲眼镜的低延迟避障和场景化播报填补了这一空白1。

📊 功能与场景对比
功能模块    技术支撑    实际应用案例    延迟/精度
出行避障    通义千问+121度超广角双摄    盲道引导、共享单车绕行    300ms超低延迟
找物读物    OCR+视觉语言模型    药罐查找、路牌识别、菜单播报    支持多物体分类
语音交互    通义千问语音助手    指令执行、环境描述    全场景语音控制
紧急求助    实时位置共享    雨雪天/夜间出行    一键联系亲友
💡 技术突破点
算力成本降低:大模型普及使开发成本降至过去的1/10,初创企业得以快速落地1。
多模态融合:通义千问Qwen-VL负责视觉理解,OCR处理文本,Paraformer优化语音交互,形成完整解决方案8。
硬件适配:眼镜主体+手机+遥控指环+盲杖四件套,兼顾传统工具与AI创新1。
🎯 用户价值总结
安全独立出行:盲道优先策略+障碍物绕行再导回,提升路径规划可靠性。
生活场景覆盖:从读取药罐标签到点餐场景描述,解决日常高频需求。
情感陪伴:语音助手支持情感化交互,减少社交孤立感19。
🤔 下一步探索方向
如果想进一步了解技术细节(如多模态模型训练数据量)或价格信息,我可以帮你深挖~
如何不发帖就快速得到金币道行
 
天人地
快速回复
限120 字节
认真回复加分,灌水扣分~
 
上一个 下一个