題目:基礎(chǔ)模型驅(qū)動(dòng)的多模態(tài)行人檢索與可控生成
報(bào)告人:葉茫
時(shí)間:2024年11月29日(周五),,15:30-16:30
會(huì)議地點(diǎn):31-904
報(bào)告摘要:
多模態(tài)行人檢索在智慧城市等領(lǐng)域有重要應(yīng)用,,現(xiàn)有方法通常獨(dú)立的去研究單一的跨模態(tài)檢索任務(wù),極大的限制了實(shí)際不確定場(chǎng)景的靈活性,,本次報(bào)告將介紹如何利用多模態(tài)預(yù)訓(xùn)練模型,,構(gòu)建不確定多模態(tài)場(chǎng)景下的行人檢索基礎(chǔ)模型等相關(guān)工作,同時(shí)分享文本引導(dǎo)的可控人像生成相關(guān)研究進(jìn)展及應(yīng)用,。
報(bào)告人簡(jiǎn)介:
葉茫,,武漢大學(xué)教授,國(guó)家級(jí)高層次青年人才,、中國(guó)科協(xié)青年托舉人才,。主要研究方向多媒體檢索、多模態(tài)理解,、聯(lián)邦學(xué)習(xí)等,,發(fā)表國(guó)際期刊會(huì)議論文 100 余篇,其中第一/通訊作者發(fā)表 CCF-A 類論文60余篇,,谷歌學(xué)術(shù)引用近萬(wàn)次,。擔(dān)任CCF-A類期刊IEEE TIFS等SCI期刊編委,多次擔(dān)任CVPR,、ICLR,、ACM MM、ECCV等學(xué)術(shù)會(huì)議領(lǐng)域主席,。主持國(guó)自科-香港聯(lián)合基金,、湖北省重點(diǎn)研發(fā)計(jì)劃等10余項(xiàng)科研項(xiàng)目。獲谷歌優(yōu)秀獎(jiǎng)學(xué)金,、ICCV2021 無(wú)人機(jī)特定行人檢索賽道冠軍,、2021-2024斯坦福排行榜 “全球前2%頂尖科學(xué)家”,、2022年度百度AI華人青年學(xué)者等榮譽(yù)。
中國(guó)·浙江 湖州市二環(huán)東路759號(hào)(313000) 浙ICP備10025412號(hào) 浙公網(wǎng)安備 33050202000195號(hào) 版權(quán)所有:黨委宣傳部