联系我们

  • 地址:安徽省合肥市高新区5089号
  • 邮编:230000
  • 传真:0551-65708002
  • 网址:https://iat.ustc.edu.cn/
  • 邮箱:zhb@iat.ustc.edu.cn

校内导师

凌震华

文章来源:本站原创

发布时间:2021-12-09 12:38:41

文章作者:本站编辑

姓名

凌震华

性别

image.png 

职称/职务

教授

出生年月

1979.8

最高学历

博士研究生

固定电话

0551-63603140

工作单位

(至院、系、所

 中国科学技术大学信息科学技术学院电子工程与信息科学系

联系地址

安徽省合肥市中国科学技术大学西区科技实验楼西楼503

邮箱

zhling@ustc.edu.cn

教育背景

2005/9 - 2008/6  中国科学技术大学,信号与信息处理,博士

2002/9 - 2005/6  中国科学技术大学,信号与信息处理,硕士

1996/9 - 2002/6  中国科学技术大学,电子信息工程,学士

研究方向

语音信号处理、自然语言处理

任职经历

2020/6 – 至今 中国科学技术大学,信息科学技术学院,教授

2011/1 – 2020/6 中国科学技术大学,信息科学技术学院,副教授

2008/7 - 2010/12 中国科学技术大学/科大讯飞股份有限公司,博士后

2012/8 - 2013/8 美国华盛顿大学,电子工程系,访问学者

2007/10 - 2008/4 英国爱丁堡大学,语音技术研究中心,访问学者

主持、参与

项目

多语种语音合成关键技术 2020.01-2022.12 中科院战略性先导科技专项C课题 主持

面向冬奥场景的多语种语音处理关键技术 2019.10-2022.06 国家重点研发计划课题 主持

面向语音合成的神经网络声码器研究 2019.01-2022.12 国家自然科学基金委面上项目 主持

机器人拟人化技术重点攻关 2017.09-2020.09 国家重点研发计划子课题 主持

类脑语音处理模型 2015.07-2017.06 中科院 战略性先导科技专项B子课题 主持

 

荣誉、奖项

《智能语音交互关键技术及应用开发平台》,国家科技进步奖二等奖2011

IEEE信号处理学会最佳青年作者论文奖,2010

《智能语音交互关键技术及应用平台》,安徽省科技进步奖一等奖2008

《面向口语学习的中英文智能语音评测与学习技术》,中国电子学会电子信息科学技术奖二等奖2008

科研成果

(论文著作、

专利等

已发表论文200余篇,GoogleScholar累计被引5900余次(H-index=40),近期代表性论文如下。

[1]  Xiao Zhou, Zhen-Hua Ling, and Li-Rong Dai, "UnitNet: A Sequence-to-Sequence Acoustic Model for Concatenative Speech Synthesis", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 29, pp. 2643-2655, 2021.

[2]  Jia-Chen Gu, Tianda Li, Zhen-Hua Ling, Quan Liu, Zhiming Su, Yu-Ping Ruan, and Xiaodan Zhu, "Deep Contextualized Utterance Representations for Response Selection and Dialogue Analysis", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 29, pp. 2443-2455, 2021.

[3]  Ya-Jie Zhang, and Zhen-Hua Ling, "Extracting and Predicting Word-Level Style Variations for Speech Synthesis", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 29, pp. 1582-1593, 2021.

[4]  Run-Ze Wang, Zhen-Hua Ling, Jing-Bo Zhou, and Yu Hu, "A Multiple-Integration Encoder for Multi-Turn Text-to-SQL Semantic Parsing", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 29, pp. 1503-1513, 2021.

[5]  Yu-Ping Ruan, Zhen-Hua Ling, and Xiaodan Zhu, "Condition-Transforming Variational Autoencoder for Generating Diverse Short Text Conversations", ACM Transactions on Asian and Low-Resource Language Information Processing, vol. 19, no. 6, 2020.

[6]  Yang Ai, and Zhen-Hua Ling, "A Neural Vocoder with Hierarchical Generation of Amplitude and Phase Spectra for Statistical Parametric Speech Synthesis", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 839-851, 2020.

[7]  Jing-Xuan Zhang, Zhen-Hua Ling, and Li-Rong Dai, "Non-Parallel Sequence-to-Sequence Voice Conversion with Disentangled Linguistic and Speaker Representations", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 540-552, 2020.

[8]  Jing-Xuan Zhang, Zhen-Hua Ling, and Li-Rong Dai, "Non-Parallel Sequence-to-Sequence Voice Conversion with Disentangled Linguistic and Speaker Representations", IEEE/ACM Transactions on Audio, Speech, and Language Processing, vol. 28, pp. 540-552, 2020.

[9]  Xiao Zhou, Zhen-Hua Ling , and Li-Rong Dai, "Learning and Modeling Unit Embeddings Using Deep Neural Networks for Unit Selection Based Mandarin Speech Synthesis", ACM Transactions on Asian and Low-Resource Language Information Processing, vol. 19, no. 3, 2020.

[10]  Jia-Chen Gu, Chongyang Tao, Zhen-Hua Ling, Can Xu, Xiubo Geng and Daxin Jiang, "MPC-BERT: A Pre-Trained Language Model for Multi-Party Conversation Understanding", in Proc. ACL, pp. 3682-3692, 2021.

[11]  Jia-Chen Gu, Hui Liu, Zhen-Hua Ling, Quan Liu, Zhigang Chen and Xiaodan Zhu, "Partner Matters! An Empirical Study on Fusing Personas for Personalized Response Selection in Retrieval-Based Chatbots", in Proc. SIGIR, pp. 565–574, 2021.

[12]  Jing-Xuan Zhang, Korin Richmond, Zhen-Hua Ling, and Li-Rong Dai, "TaLNet: Voice Reconstruction from Tongue and Lip Articulation with Transfer Learning from Text-to-Speech Synthesis," in Proc. AAAI, pp. 14402-14410, 2021.

[13]  Run-Ze Wang, Zhen-Hua Ling, Jing-Bo Zhou, and Yu Hu, "Tracking Interaction States for Multi-Turn Text-to-SQL Semantic Parsing," in Proc. AAAI, pp. 13979-13987, 2021.

 

 已申请发明专利10余项,部分获授权专利如下。

1.一种基于受限玻尔兹曼机的语音合成方法 201310099895.4 发明 2015-06-17

2.一种基于受限玻尔兹曼机的联合频谱建模的声音转换方法 201310360234.2 发明 2016-02-03

3.基于动态剪枝束宽预测的语音识别效率优化方法 201610214520.1 发明 2020-01-03

4.一种融合单词语义知识的神经网络自然语言推理方法 201710842371.8 发明 2020-03-24