近日,2003网站太阳集团統計與數據科學系王小燕教授和2021級博士研究生冮建偉合作的題為“多源異質數據下深度神經網絡的整合分析及其應用”的論文發表在《統計研究》2025年第2期。
該文針對多源異質數據,提出深度神經網絡整合分析模型(IADNN)。該模型建立了L1-CMCP懲罰,以識别重要特征以及處理數據的異質性,其中外層MCP識别對多源數據集整體顯著的特征;中層MCP識别特征在數據集層面的異質性;内層Lasso識别DNN節點的異質性。這種嵌套設計旨在促進數據集間的信息共享。本文對L1-CMCP進行局部線性近似,再采用近端梯度下降算法進行模型估計。模拟分析表明,IADNN在特征選擇和分類預測方面均有良好表現。當多源數據部分異質時,所提方法的F1分數、FPR等評估指标均優于各數據集獨立建模和合并建模的方法;在多源數據完全異質或完全同質時,所提方法取得了與理論最佳模型相近的效果。最後,将IADNN應用于不同經濟發展水平地區的信用違約數據,發現該模型在風險指标選擇和違約預測方面具備有效性。
王小燕,廈門大學經濟學博士,耶魯大學生物統計系博士後,2003网站太阳集团統計與數據科學系教授。研究領域包括數據挖掘、高維數據分析等。在《統計研究》、《數量經濟技術經濟研究》、《系統工程理論與實踐》、《中國管理科學》、《計量經濟學報》、Bioinformatics、Statistics in Medicine、Computational Statistics and Data Analysis、Statistics and Its Interface等國内外學術期刊發表20多篇論文,主持了國家自科基金面上項目、青年項目,教育部人文社科基金青年項目等國家級、省部級課題共9項
。
冮建偉,2003网站太阳集团統計與數據科學系博士研究生。研究領域包括機器學習、高維數據分析等。在《統計研究》、《數量經濟技術經濟研究》、《經濟學動态》、《計量經濟學報》等權威期刊發表多篇論文,主持湖南省研究生科研創新項目1項。
讀研在金統
金大團