返回列表 回复 发帖

应用程序帮助视障人士看世界

第一次打开Aipoly Vision应用的瞬间,从小双目失明的马克·爱德华兹不禁热泪盈眶。面对着这款宣称能够帮助视障者“看到”周遭世界的软件,现年56岁的他在第一时间完成了注册,成为了一名早期测试员。他谈到:“听到该应用迅速报读出周围物体名称的那一刻,喜悦的泪水瞬间不可抑制的将我包围。对于一位人到中年的男人而言,这种情况并不常见。”

    Aipoly Vision的其他早期用户将其称之为一款“改变游戏规则”的产品,并且从改变视障者生活模式的角度出发,它与无人驾驶汽车拥有着相仿的发展前景。本款应用由加利福尼亚州的奇点大学开发,这是一所于2008年设立在国家航空航天局研究园区内的科研机构,目的旨在“研发指数级的技术,已应对人类面临的巨大挑战”。Aipoly Vision将苹果手机上原有的基本技术与近年来日新月异的人工智能技术加以有机结合。为了实现相应的功能,应用内部所涉及到的神经网络以及深度学习算法可能十分复杂,然而,用户的操作却极其简便:只需将手机的摄像头对准身边的任意方向,应用便会报读出其所见到的物体名称。

    本软件的合作开发者之一玛丽塔·成谈到:“首次提出这一设计思路的时候,我们就与88位视障者进行了交流,了解他们的愿望。结果,我们发现,令视障者们感到最为沮丧的问题就是,他们必须向他人询问,才能了解身边究竟有些什么。”在Aipoly Vision问世之前,视障者独自出门在外之际,除了向身边的路人求助外,唯一的办法就是借助某些软件,请求志愿者通过视频通话,帮助他们识别身边的事物。然而,此种方式往往要耗费大量的时间。

    玛丽塔表示:“我们这款应用的一大特点在于,所有的识别工作都能够时时完成。目前,其他类似软件所使用的方法都需借助网络连接,这一连接过程一般需要两分钟左右。利用我们的系统,用户每一秒钟都能对三件物品加以识别。”另一方面,对于许多较为注重个人隐私的用家而言,如同某些与志愿者连线的软件那样,有外人参与的识别过程并不是一个完美的解决方案。不过,Aipoly却完美地克服了这一障碍,正如成女士所说,借助Aipoly,“没有人知道你正在看些什么”。

    目前,爱德华兹正在测试的本版软件能够识别近1000种物品以及任意颜色。据悉,本月末,软件就会迎来一次更新,届时,其所能识别的物品数量将增致5000种左右。在本版中,应用不仅能够对不同的品牌标志作出分辨,还能够为用家解释印刷品或是屏幕上的图像内容。更有甚者,用家还可以“教会”应用掌握其原本并不认识的物品名称,这一做法除了能够让他们自己在未来的使用过程中获得更好的识别效果外,还可以令其他用户从中受益。

    尽管在一款名为KNFB阅读器的应用推出之后,文字识别的问题已经在很大程度上得到了缓解,然而,这仍是视障者在日常生活中所面临的一大挑战。该阅读器由美国国家盲人联盟(NFB)与奇点大学的创始人之一雷·科兹维尔共同开发,能够将印刷品上的文字信息转译为可供用家听读的音频。尽管有人对其99美元的高昂售价颇有非议,然而,对于视障者而言,无论是想要阅读饭店内的菜单,还是需要了解印刷品上的说明文字,KNFB阅读器都有着无与伦比的巨大价值。而Aipoly Vision则希望能够将此向前推进一大步,提供完全免费的服务。

    国家盲人联盟的发言人克里斯·丹尼尔森从小双目失明,他告诉新闻周刊的记者,对于视障者而言,只要能够用手触摸,物品的识别一般并不会存在什么障碍。他谈到:“但凡你想要了解某样物品的颜色,或是搞不清包装盒里究竟装了些什么的时候,该应用所推崇的功能就有了其用武之地。此外,如果你来到了某些陌生的地方,该应用也同样会成为视障者的助手,它不仅能够识别当地的路标,还能够在用家学习的过程中,描述课本上的图表以及不带文字解释的图片信息。”

    尽管Aipoly现有的人工智能技术目前尚未达到足以具体描述图表内信息的水平,不过,其仍可以理解某些特定的图像,并对其中的内容进行解释。例如,一旦屏幕上开始播放卡通片《超人》,软件就能够知道,剧中的主人公是来自克利普顿星的超级英雄,但是,它却无法告诉你,那位超人正在做些什么。不过,这却并非是该应用唯一的不尽如人意之处。该软件宣称,自己有着区分各种不同品牌标志的能力,但凡用户面对着许多外表相似的罐装或盒装的食品和饮料,该功能就无疑会显得十分便利。不过,遗憾的是,当笔者拿出一罐可口可乐之际,应用却将其误认为了库尔斯牌啤酒,要知道,在真实的生活环境中,此种错误很有可能会令用家陷入危险之地。

    尽管尚存诸多不足,尽管没有任何广告和市场营销方面的投入,然而,该软件已经在苹果公司的应用市场内斩获了3.5万次下载。从各种比赛中获得的有限资金全都被用在了技术的革新以及新功能的开发方面,人们希望,该应用能够在其未来版本中加入诸如人脸识别等新功能。

    令开发者感到惊诧莫名的是,该应用居然在日本得到了用户的广泛欢迎,仅2016年一月至今,就获得了超过8000次下载。经过调查,他们发现,在日本,许多非视障用户竟将该软件作为了一种英语学习的工具。Aipoly的开发者之一西蒙·爱德华森谈到:“软件内部采用的是标准的英音语音库,因而,用家可以了解到相应单词的正确读音。这也是我们可以在未来详加探索的领域。”

    开发者们还试图通过各种技术手段,扩大该软件的取景范围,令其拥有更为完整的视野,只有这样,应用才能够在分辨出物体具体名称的同时,提供周围环境中的相关信息。尽管如今的Aipoly Vision尚不甚完善,然而,对于爱德华兹而言,该应用已经成为了日常生活中一个不可缺少的组成部分。该软件彻底改变了他感知周遭世界的方法,“独自出行之际,我总是用该软件了解自己前方的事物,那可能是一个交通灯、一个路标甚至一个邮箱。这款应用改变了我的生活。我知道,这种说法似乎有些夸张,不过,事实的确如此。”他如是说。


    译者的话:参与踏浪杂志的翻译工作已有数年,但是从未写过译后记,今天,针对Aipoly,我觉得有必要说上几句。读完了这篇文章以后,我心中狂喜,在第一时间下载了该软件,识别结果令人多少有些失望。的确,他的识别速度非常快,虽然不一定有每秒钟三次的水平,但是,基本上做到了随时对焦,随时反映。然而,他的识别精确度就不敢恭维了。两扇差不多的房门,有一扇他一定说是墙壁,原因是我在门把手上面挂了两个塑料袋,呵呵。颜色识别是我比较满意的方面,速度快,准确率也还可以,只是他号称能够识别任意颜色,所以,有些颜色的名字我也听大不懂,自然没办法判断是对是错。最后,有一点失望的是,这款软件目前还没有支持中文,想要练习英语听力的盲友们可以积极尝试哦。他的语音有三种选择,即标准、可能和趣味。后两种所用的描述语言更为人性化,听来比较有意思,同时,其人工智能化程度之高也可见一斑。如果您使用了该软件之后有什么体验,也欢迎来信与我们分享哦。
微信 xsfh550597973   QQ 550597973
谢谢分享,希望更加人性化更正确
返回列表