English

国际交流动态

计算机学院第七期@World“触感学术前沿”国际化交流活动顺利举办

2024年05月09日 14:08  点击:[]

2024年5月7日,在春末夏初的校园里,计算机学院第七期@World“触感学术前沿”国际化交流活动顺利落下帷幕。本次活动有幸邀请到了四位在各自研究领域取得突出成绩的学生代表,他们不仅分享了自己在科学探索中的宝贵的研究经验,也带来了各自领域内科学探索的最前沿成果。

穆秉甡的报告聚焦于CHiME-7竞赛远场语音识别任务和面向多种阵列拓扑的多通道语音识别模型。首先,他介绍了在CHiME-7远场语音识别挑战赛中的参赛系统报告,参赛系统成功应对了包含背景噪声、混响和说话者声音重叠等复杂场景的挑战,该系统的设计论文已被INTERSPEECH2023会议接收。此外,穆秉甡同学还展示了自动通道选择和空间特征融合的面向多种阵列拓扑的多通道语音识别模型。通过他们提出的多通道语音识别模型在给定说话人信息的CHiME-7语料库上进行了相关实验,该模型在Eval集上比基线模型的DA-WER(Diarization Attributed WER)相对降低了40.1%。该论文被国际声学、语音与信号处理会议ICASSP(International Conference on Acoustics, Speech and Signal Processing,简称ICASSP)2024录用,这是一场全世界最大、最全面的信号处理及其应用方面的顶级会议。

朱新发带来了他在ICASSP 2023上的所见所闻,他介绍了基于多因素解耦的表现力语音合成(Expressive Speech Synthesis)的方法,这种方法将语音分解为多种表征,包括内容、说话人、情感、风格,实现说话人、情感、风格的多因素重组,获得富有表现力的合成语音。这一技术的应用前景广阔,我们的生活中经常能感受到其潜在的影响力。

魏坤分享在ICASSP2023上的感受,并介绍了端到端语音到语音翻译的最新研究。语音到语音翻译(Speech-to-speech Translation, S2ST)是指将一种语言的语音转换成另一种语言的语音的一类技术。这项技术在全球化趋势下越来越重要,尤其是在跨境交流、旅游、商务等领域提供更为直接的便利。语音到语音翻译是西工大音频语音与语言处理研究组(ASLP@NPU)的重要研究方向之一。

最后,薛希哲展示了她在开放世界实例分割领域的研究成果,面对开放场景下的实例分割面临的挑战提出的一种基于一致性的开放环境实例分割方法TOIS (Transformer-based Open world Instance Segmentation)。这种方法不仅在性能上取得了显著提升,提出的跨任务一致性约束还可以扩展到半监督学习的设定中,更有效地协同利用有标签和无标签数据,改进了开放场景实例分割性能。

本次活动不仅为学生提供了一个展示自己研究成果的平台,也深化了学术交流的深度,为学生提供更多接触和探讨国际学术前沿的机会。通过@World“触感学术前沿”国际化交流系列活动的持续举办,学院将继续致力于激发学生的创新精神,培养他们成为未来科技领域的领军人物,期待他们在全球计算机科学领域展现更加卓越和引人注目的成就!

上一条:计算机学院第八期@World“触感学术前沿”国际化交流活动顺利举办 下一条:计算机学院成功举办国际IT教育发展论坛暨一流合作伙伴项目推介会

关闭