康奈尔大学的研究人员开发了一款新型人工智能戒指,可以实时追踪美国手语 (ASL) 的手指拼写。这款名为 SpellRing 的设备使用微型声纳技术,该技术安装在一个不超过 25 美分硬币大小的 3D 打印戒指中,用于捕捉手部和手指的运动。

Hyunchul Lim 佩戴着 SpellRing。(图片来源:Louis DiPietro)
该戒指包含麦克风、扬声器和微型陀螺仪,用于跟踪手部动作并通过深度学习算法进行处理。对 20 名 ASL 用户的测试表明,在跟踪长度不一的 20,000 多个单词时,准确率在 82% 到 92% 之间。
康奈尔大学信息科学博士生、这项研究的主要作者 Hyunchul Lim 表示:“许多其他识别 ASL 手指拼写的技术尚未被聋人和听力障碍者采用,因为硬件体积庞大且不实用。”这项研究将于 4 月 26 日至 5 月 1 日在日本横滨举行的计算机协会计算机系统人为因素会议上发表。
开发团队在训练 AI 系统识别与字母对应的 26 种手势时面临巨大挑战,因为手语者经常修改字母形式以提高效率和流畅度。SpellRing 的当前版本可用于通过手指拼写将文本输入计算机或智能手机,主要用于 ASL 中的专有名词、名称和技术术语。
研究团队承认,手指拼写仅代表 ASL 交流的一部分。“手指拼写虽然从技术角度来看很微妙且难以追踪,但它只占 ASL 的一小部分,不能代表 ASL 作为一种语言,”语言学博士生、研究合著者 Jane Lu 指出。未来的开发计划包括将微声纳系统集成到眼镜中,以捕捉上身运动和面部表情。
该项目由美国国家科学基金会资助,由康奈尔大学安·S·鲍尔斯计算机与信息科学学院未来交互智能计算机界面实验室的研究人员开发。在整个开发过程中,该团队与经验丰富的和新手 ASL 手语使用者密切合作,以确保实用功能。
来源:news.cornell.edu