< 返回

西北工业大学 - 计算机学院

陕西省语音与图像处理重点实验室

Shaanxi Province Key Laboratory of speech and image processing

简介

team introduction

西北工业大学音频、语音与语言处理研究组(ASLP@NPU)隶属于陕西省语音与图像信息处理重点实验室。研究组成立于1995年,经过近20多年的快速发展,已形成了人机语音交互、语音与音频信号处理、音视频多模态信息处理、多媒体内容分析等主要研究方向。核心成员包括三位教授、一位副教授、九位海外兼职教授和50余名硕博士研究生。研究组与比利时、英国、美国、新加坡、香港、日本、台湾等多所高校与研究机构建立了长期合作关系,与比利时布鲁塞尔自由大学建有中(中国)比(比利时)听视觉信号处理联合实验室,与香港城市大学建有创意媒体联合实验室,与英国东英吉利大学(UEA)签署有合作协议,并成为中欧LIAMA研究联盟的核心成员之一,海外合作伙伴包括新加坡资讯通讯研究院、新加坡南洋理工大学、新加坡国立大学、美国约翰霍普金斯大学等。同时,实验室与工业界联系密切,目前已经与百度、搜狗、微软、IBM、三星、华为、中兴、小米、云知声、出门问问、地平线机器人、哈曼等著名IT公司和多家初创公司开展了广泛深入的科研合作,与腾讯建有“西北工业大学-腾讯媒体信息技术联合实验室”。多年来,承担了多项国家和省部级科研项目、国际合作项目以及企业合作项目,发表学术论文200余篇,在多个重要会议上获得多篇优秀论文奖,参加多个国际评测获得第一名,取得了丰硕的研究成果。

最新新闻

hot news

智能语音交互技术学术论坛召开

2017-10-31

2017年10月10日,由西北工业大学—云知声智能语音交互联合实验室举办的“智能语音交互技术学术论坛”在计算机学院新报告厅召开。此次盛会是西工大-云知声联合实验室的一次重要学术活动。

计算机学院“小拾带你跨新年”主题游园会成功举行

2017-01-04

计算机学院主办的“小拾带你跨新年”主题游园会在翱翔体院馆福馆下顺利举行。区别于其他学院,计算机学院采用研究生与本科生联合举办的形式,丰富活动的内容,增强活动的参与度。游园会由趣味有奖问答、许愿树合影和AR/VR体验三个环节构成。

计算机学院-电子信息学院研究生联合学术年会隆重开幕

2016-11-30

2016年11月22日,“凝心聚智,共创未来”电子信息学院-计算机学院研究生联合学术年会开幕式在长安校区八九院学术报告厅隆重举行。电子信息学院院长周德云教授、党委书记孙明亮老师、电子信息学院副院长冯晓毅教授、计算机学院副院长尚学群教授、电子信息院党委副书记马俊、计算机学院党委副书记刘小军、电子信息学院研究生教导员陈曦、计算机学院研究生教导员周颖出席了本届开幕式,电子信息学院和计算机学院近200名研究生代表参加了开幕式。

感恩回馈----老师,您辛苦了!

2016-11-08

金秋送爽,硕果累累,九月是一个收获的季节,也是一个希望的季节!九月更是一个祝福的季节,她赋予伟大的老师一个专属于他们的节日。

研究人员

research worker

研究环境

research environment

专业录音、测听静音实验环境,拥有多通道数采、便携式数采、数字录音机、多种不同特性专业麦克风、麦克风阵列、调音台、同轴扬声器、人工头、功放、高分辨率相机、双目相机、高保真耳机、Dialogic语音卡等专业设备。

研究成果

Research results

Dongmei Jiang, Yulu Cui, Xiaojing Zhang, Ping Fan, Isabel Ganzalez, Hichem Sahli, "Audio Visual Emotion Recognition Based on Triple-Stream Dynamic Bayesian Network Models", S. D´Mello et al. (Eds.): ACII 2011, Part I, LNCS 6974, pp. 609–618, 2011.

Peng Wu, Dongmei Jiang, He Zhang, Hichem Sahli, "Photo-Realistic Visual Speech Synthesis Based on AAM Features and an Articulatory DBN Model with Constrained Asynchrony", Proc. Int. Conf. on Audio-Visual Speech Processing, pp.61-66, 2011.

He Zhang, Dongmei Jiang, Peng Wu, Hichem Sahli, "Photo-Realistic Mouth Animation Based on an Asynchronous Articulatory DBN Model for Continuous Speech", APSIPA Annual Summit and Conference (APSIPA ASC 2011), Xi'an, China, 2011.

教学课程

Teaching course

  • 英文译名:Digital Signal Processing

    内容简介:

    数字信号处理是利用数值计算的方法对各种信号进行采集、变换、综合、估值与识别的理论、方法及实现,是一门内容及其丰 富的技术理论课程。课程面向本科三年级学生,内容包括经典信号处理和离散随进信号处理两大部分,重点以离散时间信号/系统、Z变换 、DFT及快速算法、数字滤波器设计、抽取差值、平稳随机信号等。授课全部采用中文,重点是建立起清晰的概念,旨在探究问题的实质, 并辅以matlab实践验证。

    主要参考书:

    (1)《数字信号处理---理论、算法与实现》(第二版), 胡广书 编著, 清华大学电子与信息技术系列教材, 清华大学出版社;

  • 英文译名:Digital Signal Processing

    内容简介:

    数字信号处理是利用数值计算的方法对各种信号进行采集、变换、综合、估值与识别的理论、方法及实现,是一门内容及其丰 富的技术理论课程。课程面向本科三年级学生,内容包括经典信号处理和离散随进信号处理两大部分,重点以离散时间信号/系统、Z变换 、DFT及快速算法、数字滤波器设计、抽取差值、平稳随机信号等。授课全部采用中文,重点是建立起清晰的概念,旨在探究问题的实质, 并辅以matlab实践验证。

    主要参考书:

    (1)《数字信号处理---理论、算法与实现》(第二版), 胡广书 编著, 清华大学电子与信息技术系列教材, 清华大学出版社;