清華教授陳松蹊:統(tǒng)計(jì)學(xué)為數(shù)據(jù)治理與AI發(fā)展筑基
中國經(jīng)濟(jì)網(wǎng)貴陽8月30日訊(記者宋雅靜)“面對超維數(shù)據(jù)激增、跨領(lǐng)域應(yīng)用需求擴(kuò)大及AI深度融合的趨勢,統(tǒng)計(jì)學(xué)是破解數(shù)據(jù)難題、保障AI決策科學(xué)性的核心支撐?!?025數(shù)博會(huì)上,清華大學(xué)教授陳松蹊接受中國經(jīng)濟(jì)網(wǎng)記者采訪時(shí),結(jié)合自身在大氣環(huán)境、醫(yī)療健康等領(lǐng)域的研究實(shí)踐,闡述了統(tǒng)計(jì)學(xué)的創(chuàng)新應(yīng)用與協(xié)同路徑。
清華大學(xué)教授陳松蹊。中國經(jīng)濟(jì)網(wǎng)宋雅靜/攝
超維數(shù)據(jù)處理:突破關(guān)聯(lián)與多模態(tài)挑戰(zhàn)
談及超維大數(shù)據(jù)的處理難點(diǎn),陳松蹊指出,自 2000 年人類基因組計(jì)劃推動(dòng)超高維數(shù)據(jù)研究以來,統(tǒng)計(jì)學(xué)已解決獨(dú)立超維數(shù)據(jù)的信號(hào)識(shí)別、稀疏性分析等問題。但當(dāng)前數(shù)據(jù)分布、異質(zhì)性愈發(fā)復(fù)雜,新挑戰(zhàn)集中在兩方面:一是數(shù)據(jù)存在時(shí)空相關(guān)性,比如大氣觀測數(shù)據(jù)并非完全獨(dú)立,傳統(tǒng)處理方法不再適用;二是多模態(tài)混合數(shù)據(jù)增多,數(shù)據(jù)來源涉及多個(gè)“母體”,難以用單一模型適配。
“以大氣科學(xué)為例,一公里分辨率的地球系統(tǒng)數(shù)據(jù)維度可達(dá)幾千萬,即便有每小時(shí)的觀測數(shù)據(jù),樣本量仍遠(yuǎn)低于維度?!?陳松蹊提到,針對關(guān)聯(lián)數(shù)據(jù)、多模態(tài)數(shù)據(jù)的處理,仍是當(dāng)前統(tǒng)計(jì)學(xué)的前沿探索方向。
跨領(lǐng)域應(yīng)用:統(tǒng)計(jì)學(xué)方法可跨場景遷移
在探討環(huán)境統(tǒng)計(jì)方法向醫(yī)療、金融領(lǐng)域遷移的可能性時(shí),陳松蹊強(qiáng)調(diào) “數(shù)據(jù)共性” 是關(guān)鍵紐帶。
他分享研究發(fā)現(xiàn):北方地區(qū)沙塵暴溯源需通過密集空氣質(zhì)量監(jiān)測站數(shù)據(jù)追蹤傳播路徑,癲癇發(fā)作檢測需依托腦電圖數(shù)據(jù)判斷狀態(tài),二者均需高維數(shù)據(jù)的異常識(shí)別與動(dòng)態(tài)追蹤,統(tǒng)計(jì)學(xué)中的信號(hào)提取、方差分析等方法可有效適配。
“傳統(tǒng)方差分析從農(nóng)業(yè)領(lǐng)域起步,如今已用于醫(yī)療效果評估、互聯(lián)網(wǎng)企業(yè)營銷策略優(yōu)化。” 陳松蹊表示,只要核心問題是 “數(shù)據(jù)特征提取、異常識(shí)別、相關(guān)性分析”,統(tǒng)計(jì)學(xué)方法調(diào)整參數(shù)后,就能為醫(yī)療診斷、金融風(fēng)險(xiǎn)預(yù)警提供支撐,即便不同領(lǐng)域數(shù)據(jù)有特性差異(如海洋數(shù)據(jù)比大氣數(shù)據(jù)更穩(wěn)定、觀測難度更高),也不影響方法遷移。
互補(bǔ)共生:統(tǒng)計(jì)學(xué)填補(bǔ)AI“不確定性”短板
針對“統(tǒng)計(jì)學(xué)與 AI 協(xié)同發(fā)展”的話題,陳松蹊提出“互補(bǔ)共生”的觀點(diǎn)。他認(rèn)為,AI模型(如卷積神經(jīng)網(wǎng)絡(luò))雖有強(qiáng)大的表示能力,但存在不確定性難度量、可解釋性不足的問題;而統(tǒng)計(jì)學(xué)的核心優(yōu)勢在于“量化誤差、給出不確定性邊界”,能為AI決策提供科學(xué)支撐。
“并非所有問題都需要大模型?!?陳松蹊建議,模型訓(xùn)練應(yīng)優(yōu)先嘗試簡單統(tǒng)計(jì)模型,若能以低算力、少數(shù)據(jù)解決問題,無需盲目追求復(fù)雜 AI 模型;若場景需要AI模型,也需用統(tǒng)計(jì)學(xué)方法度量其誤差范圍、置信區(qū)間,確保決策可信。目前,清華大學(xué)統(tǒng)計(jì)數(shù)據(jù)科學(xué)系已將“人工智能的統(tǒng)計(jì)學(xué)基礎(chǔ)”列為核心研究方向,重點(diǎn)探索 AI 模型的不確定性度量方法。
此外,陳松蹊透露,本次數(shù)博會(huì)重點(diǎn)關(guān)注兩大議題:一是數(shù)據(jù)分析人才培養(yǎng),去年成立的清華統(tǒng)計(jì)與數(shù)據(jù)科學(xué)系正推進(jìn)相關(guān)本科專業(yè)與數(shù)據(jù)分析師專碩項(xiàng)目建設(shè),以填補(bǔ)人才缺口;二是隱私計(jì)算,他將在貴州財(cái)經(jīng)大學(xué)的論壇中,深入探討如何在差分隱私框架下平衡數(shù)據(jù)隱私保護(hù)與統(tǒng)計(jì)推斷準(zhǔn)確性。
標(biāo)簽: 清華 統(tǒng)計(jì)學(xué) 治理
相關(guān)文章
- 詳細(xì)閱讀
- 詳細(xì)閱讀
- 詳細(xì)閱讀
-
不良網(wǎng)站流量,網(wǎng)絡(luò)環(huán)境的毒瘤,如何防范與治理?,凈化網(wǎng)絡(luò)環(huán)境,破解不良網(wǎng)站流量難題的防范與治理之道,破解不良網(wǎng)站流量難題,凈化網(wǎng)絡(luò)環(huán)境的防范與治理策略詳細(xì)閱讀
-
同股同權(quán)什么意思?這種股權(quán)結(jié)構(gòu)對公司治理有何影響?詳細(xì)閱讀
同股同權(quán)的含義及對公司治理的影響在財(cái)經(jīng)領(lǐng)域,“同股同權(quán)”是一個(gè)重要的概念。同股同權(quán)指的是公司發(fā)行的普通股,持有相同數(shù)量股份的股東享有同樣的權(quán)利,包括獲...
2024-10-05 35 治理 對公 股權(quán)結(jié)構(gòu)
- 詳細(xì)閱讀
最新評論