2003网站太阳集团

首頁 -> 學院新聞 -> 正文

我院舉辦2022年大數據統計學與計量經濟學研讨會

時間:2022-07-05


2022年73日,2003网站太阳集团辦了2022年大數據統計學與計量經濟學研讨會會議開幕式由2003网站太阳集团副院長李海奇教授主持。李海奇副院長在緻辭中代表2003网站太阳集团對莅會嘉賓表示熱烈歡迎,向各位參會嘉賓介紹了學校、學院和學科的曆史和發展情況以及本次會議的議程情況。


 


本次會議邀請到華東師範大學統計學院研究員谌自奇、首都經貿大學國際經濟管理學院副教授陳烨、廈門大學數學科學學院副教授胡傑、東北财經大學高等經濟研究院助理教授呂耀廉、北京大學光華管理學院副教授塗雲東、中國人民大學經濟學院副教授王霞、北京師範大學統計與數據科學中心副研究員謝傳龍、上海交通大學生物信息學與生物統計學系副研究員張嶽、2003网站太阳集团副教授譚發龍和助理教授陳漢帶來了精彩報告。

 

谌自奇研究員的報告題目是mFI-PSO: A Flexible and Effective Method in Adversarial Image Generation for Deep Neural Networks。在深度神經網絡圖像分類任務中,通常若對圖片添加微小的擾動,深度神經網絡會喪失分類能力。因此,為了提高深度神經網絡的穩健性,谌自奇研究員提出了一種mFI-PSO的方法。該方法根據定制化需求識别出圖像數據集中的敏感圖像,然後對這些圖像進行攻擊生成對抗樣本,最後将這些樣本加入原始數據集重新訓練模型,最終可以得到穩健性更好的模型。實驗表明,其提出的方法在對深度神經網絡生成定制化的對抗樣本具有非常好的表現,優于目前大部分的研究方法。


 

 

随後,謝傳龍副研究員報告了他最新的研究工作《Exploting model zoo for out of distribution generalizationOut of distribution generalizationOOD問題是指測試樣本與訓練樣本分布的不同而引起的模型泛化問題,大多數學者通過預訓練來提高OOD泛化能力。在常用的深度學習的框架下,通常能找到很多針對數據集的訓練好的預模型。謝傳龍副研究員在其報告中提出一種方法,能夠衡量模型在不同數據間的遷移效率,包括correlation shiftdiscriminability對備選模型進行打分和排名,能針對特定數據集衡量衆多預訓練模型的泛化能力,以便快速地找到适用于該數據集的最優預訓練模型。


 

  張嶽副研究員報告的題目是區間删失Cox模型中時變系數的估計與檢驗。在估計區間删失Cox模型中時變系數時,生存函數裡會出現很難處理的積分項,給理論證明和計算都帶來了很大的困難。為此,張嶽副研究員提出使用了sieve方法,利用B樣條函數逼近未知的時變系數。基于sieve方法,他們提出了時變系數Cox模型的似然估計,證明了估計量的相合性,建立了最優收斂速度和漸近正态性。最後利用CHLHS關于中國老年人的調查數據,該方法具有良好的效果。


 

  譚發龍副教授的報告題目是Weighted residual empirical processes, martingale transformations, and model checking for regressions。由于傳統模型檢驗方法會遭受維數禍根問題,譚發龍副教授提出了一種基于加權殘差經驗過程及其鞅變換的新方法。該方法基于殘差的示性函數來避免維數禍根問題,并且鞅變換使得該方法是漸近分布自由的,從而避免了維數禍根問題;進一步研究可以發現基于鞅變換的方法隻能檢測n^-1/4速度趨于原假設的局部備擇假設,這一發現完全不同于現有文獻中的結論。最後通過數值模拟和實際數據的來說明新的檢驗統計量的有效性。

  

 

胡傑副教授報告的題目是Beyesian statistical analysis of stochastic phenotypic plasticity model of cancer cells。胡傑副教授首先介紹了癌細胞表型可塑性的背景,雖然相關的模型在數學性質方面已經得到了廣泛的研究,但對參數估計和模型選擇的統計分析仍然非常缺乏,因此胡傑副教授提出了一種蘊含連續時間信息的貝葉斯方法,用于處理癌症幹細胞(CSCs)轉化概率的均值和方差信息的數據集,并用大量的模拟實驗證明了該模型和算法的有效性;最後将該方法應用于SW620結腸癌細胞的數據,研究發現相對于傳統的癌細胞分級模型,模型選擇更傾向于表型可塑性模型。


 

呂耀廉助理教授報告的題目是“Robust Inference for Predictive Regression under Persistent Errors呂耀廉助理教授首先指出,當預測回歸模型中随機擾動項含有高持續性時,現有的顯著性檢驗統計量會産生嚴重的尺寸扭曲問題。他們發現當随機擾動項服從近單位根特征過程或中等偏離過程時,Bonferroni置信區間法、基于柯西估計量的檢驗統計量和基于自輔助工具變量法的Wald檢驗統計量無法提供有效的漸近推斷。為了解決高持續性随機擾動産生的過度拒絕問題,他們提出了基于序列自相關Cochrane-Orcutt修正的穩健推斷方法。由此産生的檢驗統計量具有漸近卡方分布,并且在近單位根和中等偏離的随機擾動情形下,均具有優良的統計性質。最後,他指出穩健性檢驗方法可運用于對房價的實證研究。

 

    

    塗雲東副教授報告了他們最新的研究成果Shrinkage estimation of multiple factor model。他們将門限效應引入因子模型,将 Group Fused Lasso 方法應用于對門限因子模型多個門限的識别和估計,并證明了門限值、門限個數及因子個數的估計量的大樣本性質。塗雲東副教授介紹到,通過對數據的重新排序,門限因子模型的估計可以轉化成多結構變點因子模型的估計,使用 Group Fused Lasso 方法對變點個數和變點值進行壓縮估計,可以得到對應的門限個數和門限值的估計。進一步,塗雲東副教授提出了兩步估計方法,使用信息準則對為對門限個數進行篩選,這一篩選過程使用 Backward Elimination Algorithm 實現。

 

 

 

   王霞副教授報告的題目是Specification tests for time varying coefficient models。王霞副教授從經濟學的應用出發,引出時變系數模型設定,同時介紹了目前主流的三種對時變系數的設定。對于應用哪一種時變系數設定提出了分析和檢驗。她指出,在現有的金融數據研究方面,通常會假設模型系數是時變的,而且一般有三種時變系數的設定:随機平穩過程、随機非平穩過程、時間t的函數。在應用這三種時變系數的設定時,通常會被問到選取其中一種設定的理由。為了區分這三種設定的應用場景,她以随機平穩過程作為原假設提出了一系列假設,通過OLS獲取殘差項構造檢驗統計量來檢驗是否拒絕原假設;若拒絕原假設,則進一步通過非參數估計方法獲取殘差項構造檢驗統計量來檢驗時變系數是随機非平穩過程還是時間t的函數。王霞副教授将該方法應用到多個場景中,驗證了方法的有效性,為時變系數設定的應用起到了指示性的作用。

 

 

 

 

陳烨副教授報告的題目是“Mixed Dynamic Factor Modeling applied to Explosive House Prices”。陳烨副教授從全球各地的房價上升現象出發,從計量經濟學的角度,對房價上升的原因進行了分析和總結。她指出,一方面,随着經濟的發展,人們對美好生活的不斷追求,在城市中買房帶來了需求量的上升;另一方面,買房需求會随着各種政策的變化而變化,尤其是利率的變化。接下來,她構建了關于房價的混合動态因子模型,其中包含三類因子:驅動房價迅速上升的因子、服從單位根過程的因子、平穩過程的因子。她利用信息準則與主成分分析分别估計出因子個數與因子載荷。在給定一系列假設後,得出了因子的漸近結果。陳烨老師将這個方法應用到我國與澳洲的房價數據分析中,從數據分析的角度分别得出了引起房價迅速上升的原因。這個方法對分析房價迅速上升的原因分析做出了貢獻。

 

 

陳漢助理教授報告的題目是“Multivariate Stochastic Volatility Models based on Generalized Fisher Transformation”。陳漢助理教授研究的問題是對收益率序列建立多元波動率模型。他們指出在單變量模型中,一個常見的做法是對數據作對數變換确保時變波動率的符号為正。但是對于多元波動率模型,如何保證時變協方差矩陣是正定的是一個重要的研究問題。他們提出了基于廣義費雪變換的多元随機波動率模型。與文獻中的方法對比,該模型具有易解釋、對于相關系數的估計不受數值限制等特點。他們提出使用Particle Gibbs Ancestor Sampling方法來做統計推斷。進一步地, 他們展示了大量數值模拟結果,結果表明新提出的方法具有良好的有限樣本表現。最後,通過考慮多個彙率序列的來說明所提方法的應用。