4月22日下午,计算机学院组织召开了第十八期“01学术沙龙”活动,牛凯副教授做了题为“Find the Person You Describe: Person Search by Language in Smart Video Surveillance”的主题报告,参加活动的师生围绕这一主题进行了交流讨论。活动由杨佳琪副教授主持,共计15名师生参与。
在主题报告中,牛凯老师首先从更少的人力、更高的精度、更高的效率三个方面介绍了智能视频监控系统的优势,并进一步引入了团队基于此背景下的具体研究内容:基于自然语言的行人搜索,即通过语言描述来搜索感兴趣的行人,其在例如黑暗、遮挡、摄像头死角等复杂监控场景中具备非常重要的应用价值。基于自然语言的行人搜索任务是计算机视觉与自然语言处理两大研究领域交叉融合产生的新兴研究问题,,针对该任务细粒度、跨模态匹配的困难,需要研究更好的特征向量表达,更好的跨模态语义对齐以及从实验室走向实际应用时更好的模型适应性。最后,介绍了未来可能的研究方向:①视频中寻找语言描述的特定人物,②自动无监督的学习算法。分享的最后牛凯老师向大家提出了问题探讨:①大数据时代,如何进行核心数据选择、压缩、存储;②深度学习在现实中的应用:先训练后测试的逻辑?连续变化、无法获得完备标注的情形,如何实现分布式、在线轻量级的算法?③人工智能自主进化?
讨论交流环节,与会师生积极讨论并发表自己的观点,深入交流有关行人搜索的问题,大家围绕动态神经网络改进、文本描述中复杂情形对准确率的影响、局部信息的获得等问题开展了深入的交流。
审稿:邓磊