講座編號:jz-yjsb-2021-y024
講座題目:跨媒體智能:檢索、生成與推理
主 講 人:彭宇新 教授 北京大學
講座時間:2021年06月06日(星期日)上午09:00
講座地點:紫玉飯店
參加對象:教師、研究生
主辦單位:計算機學院、研究生院
主講人簡介:
彭宇新,北京大學二級教授、博雅特聘教授、博士生導師、國家杰出青年科學基金獲得者、國家萬人計劃科技創新領軍人才、科技部中青年科技創新領軍人才、中國人工智能產業創新聯盟專家委員會主任委員、中國工程院“人工智能2.0”規劃專家委員會專家、中國圖象圖形學學會副秘書長。主要研究方向為跨媒體分析與推理、圖像視頻識別與理解、計算機視覺。以第一完成人獲2016年北京市技術發明一等獎和2020年中國電子學會科技進步一等獎。主持了863、國家自然科學基金等20多個項目,發表論文160多篇,包括ACM/IEEE Trans和CCF A類論文70多篇。多次參加由美國國家標準技術局NIST舉辦的國際評測TRECVID視頻樣例搜索比賽,均獲第一名。主持研發的跨媒體互聯網內容分析與識別系統已經應用于公安部、工信部、國家廣播電視總局等單位。擔任IEEE TCSVT等期刊編委。
主講內容:
隨著多媒體和互聯網技術的迅猛發展,圖像、視頻、文本、音頻等多媒體大數據快速增長。它們多源異構且相互關聯,使得信息檢索、數據生成、推理決策面臨跨源、跨域、跨媒體等重要挑戰。如何借鑒人腦的跨媒體處理特性,跨越視覺、語言等不同感官信息來感知和認知外部世界,對于提高計算機的智能水平至關重要。本報告將介紹我們的近期研究工作,包括跨媒體檢索、視覺-語言相互生成、視覺常識推理等,并進行相關系統展示。