近日,计算机学院在二楼转角会议室顺利举办了第九期@World“触感学术前沿”国际化交流活动。本次活动分两场,分别在5月28日和6月18日举行,共邀请了六位优秀学生,
他们分别向我们展示了各自领域的尖端议题和所面临的挑战,并分享了他们参加国际学术会议的宝贵体会以及在国际伙伴高校中接受联合培养的经历和见解。这种直接的学术交流不仅增强了学生们对不同研究领域的洞察力,也点燃了他们对科研探索的热情与兴趣。
刘建富同学分享了他在多伦多大学联合培养的经历。他介绍了多伦多大学的综合实力和现代计算机技术,并从科研工作、大学人文和海外生活等方面分享了他的经历。
宁子谦同学分享了参加ICASSP2024的经历,并简要介绍了他的会议论文《Dynamic Masked Convolution For Unified Streaming And Non-Streaming Voice Conversion》。他通过动态掩码卷积实现了统一的流式和非流式语音转换系统,兼顾实时性和高精度,适应不同应用场景的需求。
张子晗分享了会议论文《BS-PLCNets: Band-spilt Packet Loss Concealments Network with Multi-task Learning Framework and Multi-discriminators》 。 他提出了一种将语音划分成宽带和高频带的方法,并采用不同的处理措施。这种方法下的并行处理兼顾 了 准确率和效率 。
吴婵玥做了题为《基于扩散模型的高光谱超分辨方法研究》的报告。她提出一种基于扩散模型的高光谱图像超分辨方法,该方法采用了一种条件降噪transformer用于高光谱图像的降噪,同时使用了一种渐进式学习策略用于学习高光谱的全局统计信息。最终在测试集的运行中取得了良好的效果。
张成的报告题为《All-in-one Multi-degradation Restoration Network via Hierarchical Degradation Representation》。他提出了一种基于层次降解表示的一体化多降解恢复网络,这一网络采用分级从属和树形结构的划分的方法兼顾表征提取与减小梯度冲突,并通过子网络提取退化特征,然后通过进一步计算得出结果。在数据集上的运行结果显示,这一方法在模糊、噪声、低光和散焦等方面都 优于其他 方法。
王贺同学的报告题为《MLCA-AVSR: Multi-Layer Cross Attention Fusion based Audio-Visual Speech Recognition》。 他 提出了一种基于多层交叉注意力融合的音视频语音识别方法 , 该 方法通过在音频和视频编码器的不同层中植入交叉注意力模块,在建模音视频信息的同时进行音视频模态融合。
作为提升同学们国际化视野与专业素养能力的途径之一,计算机学院将持续开展@World“触感学术前沿”系列国际化交流活动,为同学们提供一个宝贵的平台,我们期待每位参与者能从中获得宝贵的经验,使他们紧跟计算机科学领域的最新发展,并通过与优秀学生的互动激发学术灵感与创新思维,助力知识交流的同时促进个人发展。
(审稿:郭斌)