Google通过其名为StreetViewAI的新研究,正让盲人和视障人士以对话形式探索街景世界成为现实。这项技术旨在打破传统街景服务对视觉的依赖,用AI对话开启一个虚拟探索的新时代,是科技向善迈出的坚实一步。

下面的表格整理了Google近年来推出的几项主要AI无障碍技术,你可以快速了解其核心功能。

技术/项目名称核心功能应用场景
StreetViewAI通过对话式AI,将街景图像转换为实时语音描述和导览虚拟环境探索、路线预览、无障碍导航
Project Guideline利用设备端机器学习和计算机视觉,在户外沿标记线引导用户视障人士独立户外行走或跑步
Lookout通过手机摄像头识别周围物体,并提供语音描述和查找功能帮助识别日常物品、查找座位/桌子等

StreetViewAI:如何实现“听见”街景

StreetViewAI 是一个为解决视障者探索街景难题而设计的系统。它不再依赖视觉,而是通过自然语言对话进行交互。

  • 核心技术:该系统集成了三大AI子系统

    • AI Describer(描述器):自动将画面中的物体、空间关系和导航线索转化为简明的语音描述,例如“前方10米有公交车站”

    • AI Chat Agent(对话代理):允许用户自由提问,如“这条人行道有遮荫吗?”或“咖啡厅入口是否方便轮椅通行?”,AI能结合对话上下文进行回答

    • AI Tour Guide(导游):在探索时,提供地点背后的历史、文化或建筑风格等深度导览信息

  • 交互方式与效果:在实测中,语音对话是主要的交互方式(占比超九成),参与者与AI对话代理的互动远高于基础描述功能,证明了对话模式的巨大潜力。该系统对问题的正确回复率达到了86.3%,能提供远超传统导航“带到目的地附近”的精确指引,甚至能描述“门的外观与可通行性”。


Project Guideline与Lookout:从虚拟到现实的辅助

除了虚拟探索,Google也推出了帮助应对现实世界挑战的技术。

  • Project Guideline:户外独立行动的伙伴
    这项开源技术旨在帮助视障人士在没有导盲犬或领跑员的情况下,独立在户外跑步或行走。它仅需一部Google Pixel手机和耳机,通过设备端的机器学习模型来识别预设的路径标记线。系统能构建出路径的虚拟地图,并通过空间音频信号(如左右耳不同频率的嗡鸣声)引导用户保持在路线上,同时还能检测并提醒前方的障碍物

  • Lookout:身边的视觉助手
    Lookout是一款Android应用,它像一位随时在线的助手,通过手机摄像头帮助你了解周围环境。它的“查找模式”可以帮你定位特定的物品,如座位、桌子或浴室,并告知你物品的方向和距离。同时,它也能为照片生成AI描述,帮你了解无法直接看到的图像内容

科技向善的深远意义

这些技术突破的意义远不止于功能本身:

  • 促进社会包容:它们从“数字可及性”入手,致力于缩小视障群体与信息世界之间的鸿沟,为他们带来更平等的数字体验

  • 拓展应用前景:这类技术所代表的对话式、多模态AI交互,其应用潜力可以轻松拓展至教育、旅游和智慧城市导览等更广泛的领域,惠及更多人群

点赞(0)

评论列表 共有 0 条评论

暂无评论
立即
投稿
发表
评论
返回
顶部