自2022年底的初代ChatGPT發(fā)布以來(lái),人工智能迅速成為推動(dòng)社會(huì)生產(chǎn)和學(xué)術(shù)創(chuàng)新的重要力量。DeepSeek等國(guó)產(chǎn)人工智能產(chǎn)品于2025年初涌現(xiàn),其功能強(qiáng)大,受到廣泛關(guān)注。響應(yīng)黨和國(guó)家關(guān)于發(fā)展新文科、新質(zhì)生產(chǎn)力和人工智能的號(hào)召,歷史學(xué)家也積極探索其在歷史研究和教學(xué)中的應(yīng)用?;趯?duì)生成型人工智能與史學(xué)研究關(guān)系的充分實(shí)踐和思考,筆者認(rèn)為,這項(xiàng)革命性的技術(shù)既非“潘多拉的盒子”,也不是萬(wàn)能寶箱。人工智能在史學(xué)研究中的應(yīng)用存在不可避免的局限性,需要靠學(xué)者克服并化劍為犁。
首先,人工智能并非無(wú)中生有,“思考”歷史難免有局限和偏狹。無(wú)論是ChatGPT還是DeepSeek,它們的強(qiáng)大的“智能”都基于算法和訓(xùn)練數(shù)據(jù)。這兩者都是人類勞動(dòng)創(chuàng)造的產(chǎn)物,因而也不可避免地受到社會(huì)和文化因素的制約。馬克·馬利諾等西方學(xué)者探索了時(shí)代局限性以及各種社會(huì)偏見(jiàn)對(duì)代碼的影響,并強(qiáng)調(diào)缺乏有效的治理和批判,算法難免誤入歧途。同時(shí),訓(xùn)練數(shù)據(jù)在塑造人工智能所生成的信息中起著至關(guān)重要的作用。無(wú)論數(shù)據(jù)來(lái)自網(wǎng)絡(luò)還是其他渠道,它們本身都承載著人類社會(huì)中的各種矛盾和偏見(jiàn)。拙文《黑箱中的小丑:教育(美國(guó))大學(xué)生批判性地使用ChatGPT》中曾分析過(guò)這一現(xiàn)象:在回答關(guān)于如何評(píng)價(jià)宋慶齡和鄧穎超等女性革命家的問(wèn)題時(shí),西方的人工智能產(chǎn)品往往強(qiáng)調(diào)她們作為孫中山先生和周恩來(lái)總理的夫人身份,而忽視了她們?cè)谥袊?guó)革命,尤其是在婦女解放事業(yè)中的重要貢獻(xiàn)。顯然,這種片面的觀點(diǎn)并非源自機(jī)器的“主見(jiàn)”,而是源于訓(xùn)練數(shù)據(jù)本身的局限性——即英文文獻(xiàn)對(duì)中國(guó)近現(xiàn)代史的敘述趨于片面;同時(shí)算法也未能有效規(guī)避數(shù)據(jù)中的性別偏見(jiàn)。面對(duì)這些局限,歷史學(xué)家的作用難以取代:在課堂上,我們可以糾正學(xué)生無(wú)條件信任人工智能的誤區(qū),培養(yǎng)他們的批判性思維能力;在研究中,面對(duì)人工智能生成的信息,我們需要充分運(yùn)用史料批判的方法。因此,我們不僅需要批判的武器,還需要對(duì)武器本身進(jìn)行批判。
其次,人工智能所使用的主要史料——開(kāi)源的數(shù)字化史料——存在結(jié)構(gòu)性的不足。在美國(guó)史領(lǐng)域,這些資料主要以各類出版物為載體。從美國(guó)國(guó)務(wù)院歷史學(xué)家辦公室的GitHub頁(yè)面上保存的解密外交文件,到國(guó)會(huì)圖書(shū)館的“記錄美國(guó)”計(jì)劃所展示的歷史報(bào)紙,以及明尼蘇達(dá)大學(xué)的“綜合公共使用微觀數(shù)據(jù)系列”數(shù)據(jù)庫(kù)所收集的歷史統(tǒng)計(jì)數(shù)據(jù),莫不如此。相較于書(shū)寫(xiě)潦草的日記和書(shū)信等私人材料,這些史料便于識(shí)讀,天然適于機(jī)器輔助研究。各類數(shù)字化或數(shù)字生成的數(shù)據(jù)構(gòu)成了人工智能分析的基礎(chǔ),并塑造了其所產(chǎn)生的信息。其實(shí),早在ChatGPT出現(xiàn)之前,這些資料就被歷史學(xué)家廣泛使用。不同于機(jī)器,我們將數(shù)字材料與其他實(shí)體資料相互印證并分析,從而得到更為客觀和公允的結(jié)論。更重要的是,計(jì)算機(jī)難以像人類一樣“上窮碧落下黃泉,動(dòng)手動(dòng)腳找東西”。通過(guò)田野調(diào)查,歷史學(xué)家可以主動(dòng)地收集大量口述材料和民間文獻(xiàn)。就史料的豐富程度而言,現(xiàn)階段的人工智能還無(wú)法與作為整體的歷史學(xué)界相匹敵。
盡管人工智能存在許多局限,我們也不能否認(rèn)其對(duì)歷史研究帶來(lái)的巨大挑戰(zhàn)。面對(duì)電腦的強(qiáng)大算力,人類孜孜不倦也難以匹敵。因此,歷史學(xué)家的工作是否會(huì)被人工智能部分取代呢?辯證地看待這一挑戰(zhàn),我們則會(huì)發(fā)現(xiàn)人工智能的普及將賦能以編程為核心的數(shù)字人文的新形態(tài)——計(jì)算人文。必須指出的是,北美的數(shù)字人文曾長(zhǎng)期存在過(guò)分強(qiáng)調(diào)歷史“表現(xiàn)”的傾向。除了國(guó)內(nèi)學(xué)者熟悉的哈佛大學(xué)所主導(dǎo)的中國(guó)歷代人物傳記資料庫(kù)(China Biographical Database Project)以及李中清教授始于密歇根大學(xué)的社會(huì)史數(shù)據(jù)庫(kù)外,美國(guó)數(shù)字人文學(xué)者重視如何利用數(shù)字工具讓研究走出象牙塔。從ArcGIS等地理信息工具實(shí)現(xiàn)用地圖講故事,到voyant等可視化工具做文化分析,再到用鏈接數(shù)據(jù)展現(xiàn)概念間的聯(lián)系,這些在北美曾經(jīng)流行的數(shù)字人文方法,無(wú)不指向如何更好地在非專業(yè)讀者面前“表現(xiàn)”歷史。不過(guò),這種趨勢(shì)正在得到修正:無(wú)論歷史學(xué)家喬·古爾迪將文本挖掘用于政治史研究,還是計(jì)算科學(xué)家本杰明·李用機(jī)器學(xué)習(xí)分析歷史報(bào)紙,這些數(shù)字史學(xué)的新熱點(diǎn)都側(cè)重于更好地服務(wù)“研究”而非“表現(xiàn)”。
對(duì)于計(jì)算人文進(jìn)入課堂,筆者曾困擾于社會(huì)科學(xué)常用的統(tǒng)計(jì)工具(如各類回歸分析和因果推斷)和編程工具(如主題建模、數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí))納入歷史教學(xué)。為了實(shí)現(xiàn)這個(gè)目標(biāo),需要指導(dǎo)學(xué)生用Python或R等編程語(yǔ)言,并學(xué)習(xí)常用的資料庫(kù)和工具包。在ChatGPT出現(xiàn)之前,在有限課時(shí)內(nèi),文科學(xué)生視編程為畏途。借助人工智能所生成的代碼以及相關(guān)指導(dǎo),他們可以迅速掌握相關(guān)技能。因此,我們可以主動(dòng)地將人工智能引入課堂,促進(jìn)新時(shí)代“新文科”后備軍的培養(yǎng)工作。
總之,面對(duì)人工智能所帶來(lái)的挑戰(zhàn),歷史學(xué)家應(yīng)當(dāng)發(fā)揮史料批判的長(zhǎng)處和皓首窮經(jīng)的精神,用主觀能動(dòng)性駕馭這只“猛虎”,并賦能數(shù)字史學(xué)的發(fā)展。
來(lái)源:光明網(wǎng) 作者:萬(wàn)澍