中国计算机学会多媒体专委会走进河海大学系列学术报告

发布日期：

2020-10-16

浏览次数：

1603

主题：未来媒体技术前沿进展之领域多媒体应用

时间：2020年10月18日上午9:00-12:00

地点：江宁校区致用楼118

摘要（一）：

视觉大数据在现代信息中占据主导地位。然而，传统的信息处理技术不考虑目的需求，无法统筹考虑、全局优化整个信息采集、传播和处理过程，面对大数据洪流已显得越来越无能为力。为此，我们从用户认知需求出发，以主观感知视觉信息特性为指导，研究认知目的导向下对视觉信息量的需求：首先，探索大脑感知视觉信息过程，完成对视觉信息需求的描述与刻画；接着，根据图像内容质量衰减情况完成视觉信息量的度量；最终，借助视觉信息量定量反馈来优化系统，从而提出需求导向的信息供给策略。进一步地，模仿视网膜成像特性，研制新一代事件驱动的仿生成像相机，从信息采集端开始优化，有效降低视觉数据量并满足认知需求。

报告人简介：

吴金建，男，现为西安电子科技大学教授、博导，国家优秀青年基金获得者。分别于2008年、2014年获得西安电子科技大学学士、博士学位，2019年破格晋升教授。2011年9月至2014年8月，赴新加坡南洋理工大学从事助理研究员、博士后研究员工作。获国家自然科学奖二等、陕西省青年拔尖人才、教育部霍英东青年基金、陕西省青年科技新星等。面向人工智能国家战略及重大需求，长期从事仿生成像、智能信号处理等方面的理论和应用研究。主持军科委国防创新项目、国家自然基金面上、教育部与装备发展部联合基金青年人才项目等多项国家课题，协同主持国家自然基金重点项目、“十三五”航天预研项目、高等学校博士学科点专项科研基金等项目，开发出多套智能信息处理系统并交付使用。已发表相关学术论文70余篇，其中SCI源一区高水平论文20余篇，三篇入选ESI高被引论文，获IEEE电路与系统旗舰会议ISCAS2013“最佳学生论文奖”。

摘要（二）：

视觉场景的全面理解与可靠描述是多媒体分析的重要组成部分，也是实现多模态智能服务的重要基础。视觉场景中的信息涉及不同层次、不同粒度和不同角度，其数据来源除了可见光外也有其他传感器。对场景进行理解需要考虑多种信息的关联关系，对场景进行描述也涉及到视觉和语言的内在关联。近期视觉场景理解与描述发展较快，涉及的研究点也较多，但并未充分考虑不同模态间的关联。本报告将讨论视觉场景理解与描述的研究现状，分析RGB-D的模态关联、物体关系关联、视觉与语言关联等对视觉场景理解与描述的作用，介绍与此相关的最新研究工作，并对发展趋势和应用场景进行展望。

报告人简介：

蒋树强，中科院计算所研究员，博士生导师，中科院智能信息处理重点实验室副主任，IEEE和CCF高级会员，国际期刊ACM ToMM、IEEE Multimedia、Multimedia Tools and Applications的Associate Editor，任ACM SIGMM中国分会副主席、CCF专委工委委员、CCF多媒体专委会秘书长、IEEE CASS北京分会副主席，研究方向为图像/视频等多媒体信息的分析、理解与检索技术，先后主持承担科技创新2030-“新一代人工智能”重大项目、国家自然科学基金重点、优青等项目20余项，共在IEEE/ACM汇刊和CCF-A类会议上发表论文60余篇，获授权专利10余项，获得2008年度北京市科技新星计划支持，2012年度中国科学院卢嘉锡青年人才奖，2012年度中国计算机学会科学技术奖，2013年度中国科学院青年科学家国际合作奖，入选2014年度国家重要人才计划。

摘要（三）：

Recent advances in deep learning underpin a collection of algorithms with an impressive ability for image analysis. We will discuss its application in image captioning, such as attention on attention for image captioning and also adaptively aligned image captioning via adaptive attention time. In addition, we also introduce a large-scale Breast tumor Cell Dataset (BCData) for cell detection and counting. We conduct several cell detection and counting methods on this dataset to set the first benchmark. Our dataset is available at https://sites.google.com/view/bcdataset.

报告人简介：

Jie Chen received the MSc and PhD degrees from the Harbin Institute of Technology, China, in 2002 and 2007, respectively. He joined the faculty with the Graduate School in Shenzhen, Peking University, in 2019, where he is currently an associate professor with the School of Electronic and Computer Engineering, Peking University. Since 2018, he has been working with the Peng Cheng Laboratory, China. From 2007 to 2018, he worked as a senior researcher with the Center for Machine Vision and Signal Analysis, University of Oulu, Finland. In 2012 and 2015, he visited the Computer Vision Laboratory, University of Maryland and School of Electrical and Computer Engineering, Duke University respectively. He was a cochair of International Workshops at ACCV, CVPR, ICCV and ECCV. He was a guest editor of special issues for IEEE TPAMI, IJCV and Neurocomputing. His research interests include deep learning, computer vision, and medical image analysis. He is an Associate Editor of the Visual Computer. He is a member of the IEEE.