共计 615 个字符,预计需要花费 2 分钟才能阅读完成。
近日,谷歌与非洲多家顶尖研究机构合作,正式推出了名为 WAXAL 的大规模开放语音数据集。这一重要举措旨在推动人工智能在非洲的普及与应用,为撒哈拉以南非洲地区超过 1 亿人口提供更广泛的人工智能技术接入途径。
经过三年的精心筹备,在谷歌的技术支持下,WAXAL 数据集收录了 1,250 小时经过转录的自然语音,以及超过 20 小时录音棚品质的录音资料。这些高质量的语音数据将用于构建更精准的语音识别系统与合成语音工具,尤其专注于服务不足的非洲本地语言。
目前,全球语音技术虽发展迅速,但大多数非洲语言因缺乏高质量语音数据,仍处于数字服务的边缘地带。这导致数以百万计的使用者难以用自己的母语使用各类数字工具。WAXAL 语音数据集项目覆盖了包括豪萨语、约鲁巴语、卢干达语和阿乔利语在内的 21 种非洲语言,试图填补这一关键的数字鸿沟。
谷歌非洲研究负责人艾莎·沃尔科特 - 布莱恩特表示,该计划旨在赋能非洲的学生、研究人员和创业者,使他们能够运用本地语言开发技术,从而在整个非洲大陆释放经济潜力。
值得关注的是,数据收集工作完全由非洲本地机构主导,参与方包括乌干达的马凯雷雷大学、加纳大学以及卢旺达的 Digital Umuganda。这些机构拥有该数据集的全部所有权,为公平、由社区主导的人工智能发展模式树立了新标杆。
预计 WAXAL 语音数据集将通过支持相关研究、教育和创新,加速语音技术在教育、医疗、金融服务及农业等领域的应用,帮助数百万人更便捷地获得必要的数字服务。