共计 1374 个字符,预计需要花费 4 分钟才能阅读完成。
7 月 18 日,视障人士 Peter Lim 通过 AI 语音助手在家中预订了 Grab 乘车服务,前往附近商场。这一功能自 6 月在 Grab 应用程序中推出以来,显著提升了他的出行体验。
作为一位 59 岁的呼叫中心操作员,Lim 对这一进展表示欢迎,因为这意味着他只需通过语音即可预订乘车服务。然而,他提到,预订前往某些地点的服务仍然存在挑战,例如 Kalidasa Avenue 和 Lim Ah Pin Road。
语音助手有时难以理解新加坡的语音模式,因此 Lim 有时仅提供目的地的邮政编码。意识到这一问题后,Grab 于 6 月底发起了一项公开征集用户语音样本的活动,以优化其 AI 模型。该模型基于 OpenAI 的 GPT-4.1 大型语言模型,并通过 Grab 员工提供的 80,000 个语音样本进行了微调,目前对新加坡口音和地名的理解准确率已达到 89%。
尽管如此,为了应对新加坡各地地名的多种发音方式,仍需进一步改进。例如,Hougang 可以带或不带字母“h”发音,而 Clementi 可以发音为“Kle-man-tee”或“Klair-men-tee”。
Grab 发言人向《星期日时报》表示,虽然 Grab 并未设定在 12 月 31 日前收集多少语音样本的目标,但其目标是将准确率提升至 95%。“这需要更多种类和数量的语音样本,以不同音调、语气、口音和风格表达感兴趣的地点。”发言人表示。
新加坡最常选择的 85% 的地点被选为用户受邀提供语音样本的范围。“参与者将看到从该列表中随机选择的兴趣地点,并根据要求发音。”发言人补充道。该公司已收到近 10,000 条用户语音录音。
Lim 表示,语音助手非常有用,尤其是与应用程序在不同时间段为用户建议可能前往地点的功能相结合时。“它会问我是否想回家,或者是否想在周日早上去教堂。如果我说不,我可以告诉它我想去的地方。”他补充道。“到目前为止,它在理解我的语音方面大约有 90% 的准确率。”
AI 语音助手适用于在手机上启用了 talkback 功能的用户。新加坡视障人士协会(SAVH)的成员参与了焦点小组讨论,并在该功能推出前参与了测试。
SAVH 无障碍服务部门负责人 Lyn Loh 表示,在测试阶段,语音助手最初对语音命令的反应不太灵敏,需要多次尝试才能理解她的意思。“但现在,它的表现好多了。”Loh 表示。她还表示,如果该功能还能用于通过应用程序订购外卖,将会非常有用,并补充说她已向 Grab 反馈了这一建议。
在新冠疫情期间,她不得不学习如何订购食物,因为她无法看到贴在地板和座位上的标记,这些标记指示了人们排队和就座的位置。“我们永远不知道下一次疫情何时会发生。”Loh 表示。
Grab 在开发阶段通过将其与 Meralion——一种能够理解至少八种区域语言的 AI 模型——以及由 A *Star 信息通信研究所开发的 Singlish 进行基准测试,评估了该功能的性能。“虽然这两种模型都是为讲 Singlish 的用户设计的,但 Meralion 专注于自然语言理解,而 Grab 的语音助手则专门用于帮助用户识别新加坡的地点和兴趣点。”Grab 发言人表示。
收集的录音将被加密并存储在安全服务器中一年,且不会与任何个人标识符(如用户姓名或手机号码)关联。Lim 和 Loh 希望这款语音助手不仅能帮助视障人士,还能帮助老年人和身体残疾人士。“如果它得到改进,它可以帮助许多其他只想通过语音而非打字操作的人。”Lim 表示。