综合新闻

我校在大数据时代的说话人声纹识别研究取得新进展

稿件来源:中山大学-卡内基梅隆大学联合工程学院 作者:中山大学-卡内基梅隆大学联合工程学院 编辑:金凤 发布日期:2014-09-24 阅读量:

最近,中山大学-卡内基梅隆大学联合工程学院(SYSU-CMU Joint Institute of Engineering,简称JIE)教师李明博士提出了一种无需说话人标注的无监督说话人识别算法,对于大数据时代的海量语音数据信息提取具有重要的意义。

语音作为人类获取信息的主要来源之一,是人与外界交流中使用最方便、最有效、最自然的交际工具和信息载体。随着人类社会全面步入信息化,特别是通讯、多媒体和互联网技术的迅猛发展,智能语音技术也被越来越多地应用于人们的日常生活,如何更全面、更准确的识别出语音信号所包含的说话人信息,是该领域的一个研究热点。

李明博士课题组提出了一种利用无监督学习进行说话人识别任务的框架。他们面对的是一系列没有任何标记的数据,在训练数据中,利用affinity propagation聚类算法对未标记语音数据进行聚类,可生成若干聚类,每一个聚类可认为代表一个说话人,课题组为每一类别做一个临时的标签。在此时,未标记数据变成了已标记数据。利用此已标记数据训练出的Probabilistic Linear Discriminant Analysis模型可以有效进行说话人识别任务。经过若干次迭代,等错误率相比于原先无监督离散余弦打分方法相对下降了超过20%,有效架起了无监督与有监督说话人识别算法之间的鸿沟。

近期,在新加坡举办的第九届中文口语语言处理国际会议(ISCSLP 2014)及第十五届国际语音通信年会(INTERSPEECH 2014)上,李明博士课题组宣讲了三篇与说话人声纹识别相关的论文。其中,李明博士与由他担任导师并指导的JIE双学位博士研究生刘文博、卡内基梅隆大学博士研究生禹之鼎三人共同撰写的论文“An Iterative Framework for Unsupervised Learning in the PLDA based Speaker Verification”,获得了ISCSLP的最佳学生论文奖。

JIE的博士研究生项目致力于培养对电子与计算机工程领域理论、方法、技术和工具进行深入探索的研究型人才,为充实和完善电子与计算机工程领域的知识体系作出贡献。其中的双学位博士研究生将于在读期间在美国卡内基梅隆大学学习两年。满足中山大学和卡内基梅隆大学相关专业学位要求的学生,可获得两校的博士学位。

中大新闻
新闻投稿