2024年信息工程学院学术报告之二十四

作者:时间:2024-11-21 浏览:127

题目:基础模型驱动的多模态行人检索与可控生成

报告人:叶茫

时间:20241129(周五)1530-1630

会议地点:31-904

报告摘要:

多模态行人检索在智慧城市等领域有重要应用,现有方法通常独立的去研究单一的跨模态检索任务,极大的限制了实际不确定场景的灵活性,本次报告将介绍如何利用多模态预训练模型,构建不确定多模态场景下的行人检索基础模型等相关工作,同时分享文本引导的可控人像生成相关研究进展及应用。

报告人简介:

叶茫,武汉大学教授,国家级高层次青年人才、中国科协青年托举人才。主要研究方向多媒体检索、多模态理解、联邦学习等,发表国际期刊会议论文 100 余篇,其中第一/通讯作者发表 CCF-A 类论文60余篇,谷歌学术引用近万次。担任CCF-A类期刊IEEE TIFSSCI期刊编委,多次担任CVPRICLRACM MMECCV等学术会议领域主席。主持国自科-香港联合基金、湖北省重点研发计划等10余项科研项目。获谷歌优秀奖学金、ICCV2021 无人机特定行人检索赛道冠军、2021-2024斯坦福排行榜 全球前2%顶尖科学家2022年度百度AI华人青年学者等荣誉。


打印: