題目:基于強化學習的離散時間均值-方差策略
報告人: 李迅
時間:2024年11月22日(周五),,上午10:00-11:00
報告地點: 理學院1-301會議室(騰訊會議:609-272-073)
報告摘要:本報告研究了一種基于強化學習的離散時間均值-方差模型,。與Wang-Zhou (2020)的連續(xù)時間模型相比,離散時間模型對資產(chǎn)收益分布的假設(shè)更為廣泛,。通過使用熵來衡量探索成本,,推導出最優(yōu)投資策略,其密度函數(shù)同樣為高斯類型,。此外,,設(shè)計了相應(yīng)的強化學習算法,。模擬實驗和實證分析表明,離散時間模型在分析實際數(shù)據(jù)時,,相較于連續(xù)時間模型具有更好的適用性,。
報告人簡介:
李迅,于1992年獲上??萍即髮W數(shù)學系學士學位,,1995年獲上海大學數(shù)學系碩士學位。2000年在香港中文大學系統(tǒng)工程與工程管理學系獲得博士學位,,并于2001年在該系擔任博士后研究員,。從2001年至2003年,他在卡爾加里大學數(shù)學與計算金融實驗室擔任博士后研究員,。2003年至2007年,,他是新加坡國立大學數(shù)學系的訪問學者。2007年起,,他加入香港理工大學應(yīng)用數(shù)學系,,擔任助理教授,2013年晉升為副教授,,目前為教授,。其主要研究領(lǐng)域為隨機控制與金融應(yīng)用中的應(yīng)用概率,已在SIAM Journal on Control and Optimization,、Annals of Applied Probability,、IEEE Transactions on Automatic Control、Automatica,、Journal of Differential Equations,、Mathematical Finance、Finance and Stochastics以及Quantitative等期刊發(fā)表論文,。
中國·浙江 湖州市二環(huán)東路759號(313000) 浙ICP備10025412號 浙公網(wǎng)安備 33050202000195號 版權(quán)所有:黨委宣傳部