2021年01月01日
第11版:11

日新月异的科技力量正为盲人“重见光明”带来希望——

AI做眼睛 盲人可奔跑

2020年11月底,谷歌表示,其研发的一款人工智能系统,能够帮助视障人士独立参加跑步比赛。

据悉,依靠该系统,视障人士不需要依靠人类向导或导盲犬便可以跑完全程。

这款人工智能系统如何让视障人士参加跑步比赛?近年来在帮助视障人士恢复视力等方面,人工智能有哪些阶段性成果?目前这些产品距离应用还有多远?

A

/

用声音信号为盲人引路

一位公益组织人员介绍,盲人参与跑完“半马”或“全马”,需陪跑者的帮助。即,盲人和陪跑者之间有1条牵引绳,分别套在各自的手腕上,如同牵手跑步。为了确保盲人在跑步中万无一失,有时需要两位陪跑者。但是,盲人平时训练时,随时找个陪跑者似乎不太现实。

最近,不少城市开始允许导盲犬进入地铁、公交车。然而,导盲犬的数量十分有限,且每训练一只导盲犬需要耗费12万元至15万元。

“谷歌开发的这套系统,不需要让视障人士依靠人类向导或导盲犬即可自己跑完全程。”远望智库AI事业部部长、图灵机器人首席战略官谭茗洲说。

据介绍,这个应用程序使用人工智能模型来识别道路上的一条画线,并推断出跑步者与这条线的关系。如果跑步者离线太远,该应用程序就会向他们佩戴的骨导耳机发送信号,播放令人不快的噪音。声音是哪只耳机发出的、音量有多大,都能让跑步者知道他们需要移动的方向及其离终点有多远。

谭茗洲解释,这有点像汽车上使用的接近警报,当汽车离可能发生碰撞的地方越近时,警报的声音就会越大,频率也会越快。使用谷歌的这个系统,跑步者需要把一部安卓手机用专门的腰带绑在腰上。这款应用程序不需要连接互联网即可工作,而且还可考虑多种光照和天气条件。

B

/

“智能”描述 所感如所见

如今,许多互联网公司都通过各种方式成功让视障人士与他们提供的服务实现互动,主要方法就是将文本转变成由屏幕阅读器发出的语音。

例如,对于一张风景照片,含有人工智能技术的屏幕阅读器会如此描述:这张照片含有自然、户外、云朵、草地、地平线、植物或树木;一对夫妇带着孩子站在加州丹麦城著名风车前面的照片,屏幕阅读器诠释:这张照片包括了3个人,微笑,户外。

“显然,这些解释不能对照片进行全面描述,但在没有人工帮助的前提下确实能填补某些空白,视障人士仅需点击阅读器来描述,而无须他人来做解释。”谭茗洲说。

去年在拉斯维加斯举办的世界最大消费类电子产品展会上,一款智能手机可以通过语音讲述周围的世界,赋予视障人士和弱视用户更丰富的视觉体验。该应用还可适配智能眼镜,可将用户的智能手机摄像头变成用户的眼睛。

据介绍,该应用利用人工智能识别摄像头指向的视觉信息,包括食品包装、海报和显示屏,比如超市的商品信息、车站的显示投屏、街边的海报。此外,还可以识别记录亲朋好友的面孔,用户可以用其扫描和寻找周围的人和事。

C

三方发力 释放科技“温度”

/

目前,很多专为视障人士设计的解决方案,正凸显着人工智能应用的多样化和人性化。那么,如何加速人工智能产品的突破性运用,让冰冷科技释放出人文关怀?

谭茗洲指出,这需要三方面发力。首先要培育创新生态。“在2017年德勤全国创新精英挑战赛总决赛上,一支四川大学在校学生团队研发的一款视障人士Kindle阅读器获奖。”谭茗洲说,我们应该激励更多像这样为视障人士创新的技术成果,尽早转化成真正让视障人士受益的产品,这就需要构建一个良好的创新生态。

其次,要解决算力和成本之间的矛盾。谭茗洲介绍,机器学习训练往往要消耗大量的算力,操作中会出现时间上的延迟与信息隐私的安全隐患,这就要将AI算法中的数据上传到云端完成。而要满足终端AI推理运算的实时、可用性需求,就要在本地处理大量的数据,但若在终端本身部署高性能的AI芯片,从成本控制上来看不大现实,在实体场景中部署足够多的边缘AI更具一定可行性。

最后,还需要等待产业环境的全面成熟:基础设施的完善,软硬件基本到位,这样可在终端设备上更好运行深度学习算法。“加强5G智能网络建设,保障云计算及边缘计算的每一个节点高效可靠利用。”谭茗洲指出。

据《科技日报》

2021-01-01 日新月异的科技力量正为盲人“重见光明”带来希望—— 2 2 沧州晚报 content_9995.html 1 AI做眼睛 盲人可奔跑 /enpproperty-->