Google通过其名为StreetViewAI的新研究,正让盲人和视障人士以对话形式探索街景世界成为现实。这项技术旨在打破传统街景服务对视觉的依赖,用AI对话开启一个虚拟探索的新时代,是科技向善迈出的坚实一步。
下面的表格整理了Google近年来推出的几项主要AI无障碍技术,你可以快速了解其核心功能。
| 技术/项目名称 | 核心功能 | 应用场景 |
|---|---|---|
| StreetViewAI | 通过对话式AI,将街景图像转换为实时语音描述和导览 | 虚拟环境探索、路线预览、无障碍导航 |
| Project Guideline | 利用设备端机器学习和计算机视觉,在户外沿标记线引导用户 | 视障人士独立户外行走或跑步 |
| Lookout | 通过手机摄像头识别周围物体,并提供语音描述和查找功能 | 帮助识别日常物品、查找座位/桌子等 |
StreetViewAI:如何实现“听见”街景
StreetViewAI 是一个为解决视障者探索街景难题而设计的系统。它不再依赖视觉,而是通过自然语言对话进行交互。
交互方式与效果:在实测中,语音对话是主要的交互方式(占比超九成),参与者与AI对话代理的互动远高于基础描述功能,证明了对话模式的巨大潜力。该系统对问题的正确回复率达到了86.3%,能提供远超传统导航“带到目的地附近”的精确指引,甚至能描述“门的外观与可通行性”。

Project Guideline与Lookout:从虚拟到现实的辅助
除了虚拟探索,Google也推出了帮助应对现实世界挑战的技术。
Project Guideline:户外独立行动的伙伴
这项开源技术旨在帮助视障人士在没有导盲犬或领跑员的情况下,独立在户外跑步或行走。它仅需一部Google Pixel手机和耳机,通过设备端的机器学习模型来识别预设的路径标记线。系统能构建出路径的虚拟地图,并通过空间音频信号(如左右耳不同频率的嗡鸣声)引导用户保持在路线上,同时还能检测并提醒前方的障碍物。Lookout:身边的视觉助手
Lookout是一款Android应用,它像一位随时在线的助手,通过手机摄像头帮助你了解周围环境。它的“查找模式”可以帮你定位特定的物品,如座位、桌子或浴室,并告知你物品的方向和距离。同时,它也能为照片生成AI描述,帮你了解无法直接看到的图像内容。
科技向善的深远意义
这些技术突破的意义远不止于功能本身:
拓展应用前景:这类技术所代表的对话式、多模态AI交互,其应用潜力可以轻松拓展至教育、旅游和智慧城市导览等更广泛的领域,惠及更多人群。
发表评论 取消回复