最新軟體應用文章

Image credit: AntonioGuillem via Getty Images

Android 的实时声音转录文字工具可以辨识低语或是狗吠

让听障人士也可以从文字中感受到环境转变。

Eric Chan
2019 年 5 月 17 日, 中午 11:30
AntonioGuillem via Getty Images

在等待 Android Q 的实时字幕功能之前,其实 Google 也有在测试一个实时的声音转录文字的 Live Transcribe 工具,用途是针对协助听障人士获得外界的信息。今天 Google 宣布要为这 app 加入辨识环境声音事件的功能,同时也加强了复制和储存内容的能力。


就如上面示意图所描述,当这 app 收录到低语或是狗吠,就会在画面下方显示相关的图标,让使用者可以得知那是由人或是环境音所来的声音。同时,因应这声音转录文字工具也可以给学生或记者来作记录之用,所以也加入了更方便的文字选取和复制方式。

Google 表示他们为了让全球 18 亿台合资格的 Android 设备使用这功能,是主要通过云端的机器学习和语音辨识功能驱动这 app,无需因为机器的硬件规格受限。

科技巨擘都在积极开发更强大的语音辨识和转换工具,为的自然是给日后人类与机器之间有更好的交互体验,尤其是让 AI 能有更接近真人的自然交流能力。

article