注:本平臺為第三方資訊平臺,不是院校官方,網站內所有信息只做參考,并不代表院校官方,招生信息以官方最新信息為準,如果不知怎么找官方,可以咨詢在線客服尋求幫助。
紀要|【傅璇琮學術講座08】王宏甦:網絡基礎設施中的中國歷代人物傳記資料庫
2018年6月22日上午,“傅璇琮學術講座”第八講在清華大學新齋304室舉行。應清華大學中文系邀請,中國歷代人物傳記資料庫項目經理王宏甦老師作了主題為“網絡基礎設施中的中國歷代人物傳記資料庫”的精彩報告。講座由中文系李飛躍副教授主持,劉穎教授、馬銀琴教授和中國古典文獻研究中心張力偉研究員等數十名校內外師生參加了此次講座。
報告開始前,李飛躍老師對此次講座的背景和主題作了簡要介紹。李老師指出,數字人文研究在國外起步較早,近年國內高校也紛紛成立各種研究中心和項目組,采用大數據及其相應技術研治古代文史方興未艾,已對不同學科的知識體系、學術觀念和研究方法產生了深刻影響,正在成為改變學術生態的一種力量。此講將不僅有助于我們了解與數字人文有關的最新知識和信息,也將有助于我們自覺更新研究觀念與方法。
王宏甦老師首先介紹了中國歷代人物傳記資料庫的情況。該數據庫收集了自唐代至清代近41萬條人物信息,是一個關系型數據庫。利用資料庫來研究一個社會群體的特征或變化,可以獲得新的研究視角。王老師還對資料庫中數據資料的年代分布作了簡要說明。資料庫中的數據主要集中于唐代至清代,原因是唐以前的官僚機構以及可量化的地理信息資料相對不系統,不利于批量收集和分析。另一方面,由于中國近現代社會與古代社會結構不同,如果強行加入后世數據,同樣會有諸多不適,因此數據庫選擇截至清代。
接下來,王老師向同學們講解了數字人文常用的三種研究方法。首先是群體傳記學的研究方法。地方志中有諸多重復資料,省志和縣志也常見互相抄襲現象。通過比對分析可以發現有些地方在地理上并無關聯,但仍有官員信息重疊,由此可以推斷地方官吏的互任情況。此類人物通常為低級官吏,使用傳統的文獻研究方法很難發現,但利用群體傳記學的研究方法可以快速發現這一信息。其次是地理信息系統分析的研究方法。以CBDB 與KVisionLab 合作的唐代墓志所見的社會流動可視化為例,使用唐代方志所載人物的籍貫、出生地、死亡地、葬地等信息并做可視化分析,可清晰呈現了墓志中所呈現不同時代的唐人社會遷徙狀況。其三是社會網絡分析的研究方法,這一方法主要利用了唐五代人物交往詩資料。社會網絡分析為流派研究提供了新視角,以往傳統的流派研究依靠詩論開展,而數據資料根據交往關系進行分組,從中可發現傳統上并非同一流派的人物聚集。
合作可以帶來高效的數據制作,減少重復開發,并提供新的研究視角,對原始問題提出新的見解,對于數字人文研究至關重要。針對網絡基礎設施(cyberinfrastructure)建設,王宏甦老師引用了ACLS對網絡基礎設施的倡議,指出其作用是連接對學科有用的電腦軟件、數據集、人才、研究方法、標準和合作模式等,有利于不同項目利用一些共通的科技。因此,每一位論文撰寫者都是潛在的內容分享者。
王宏甦老師以中國歷史研究的網絡基礎設施國際研討會為例,介紹了會議目標、召集對象及相關議程,并介紹了不同機構對網絡基礎設施的不同理解,包括上海圖書館提出的數字人文基礎設施模型、德國馬普研究所提出的Asia Network模型以及臺灣大學提出的DocuSky系統。王老師提出的網絡基礎設施是一套倡議和標準,包括API、標準、歷史版本和永續存儲以及社區。其中API可理解為可被機器讀取的數據結構,把原始史料變為文本,然后把文本標準化,可讓程序快速調用或使用。針對如何去做數據的標準化這一問題,他以國際圖像互操作框架Mirador項目為例介紹了由德龍(Donald Sturgeon)開發的API標準實踐——Textref.org和Biogref.org 項目。王老師指出,歷史版本和永續存儲對于發表和分享數據十分重要,目前Dataverse、Github等軟件已可以實現歷史版本再現和永續存儲。
王宏甦老師還介紹了目前國內數字人文社區的幾種形式,包括數字人文會議與論壇、數字人文媒體等。他認為,未來數字人文社區的發展目標,一是建立面向中文世界和英文世界的數字人文社區;二是建立主題明確,可以永久保存的數字人文交流平臺;三是面向公眾分享會議論文集和幻燈片;最后是要建立數字人文圖書館。最后,他再次引用ACLS對網絡基礎設施的倡議,強調實踐這一倡議背后所執行的標準,即去中心化、標準化、開放互聯合作。
在提問環節,王宏甦老師與在座師生就唐以前人物傳記資料的數據化以及數據庫所收唐代墓志資料狀況等問題作了深入交流。講座在熱烈的掌聲中落下帷幕。
免責聲明:本站所提供的內容均來源于網友提供或網絡搜集,由本站編輯整理,僅供個人研究、交流學習使用,不涉及商業盈利目的。如涉及版權問題,請聯系本站管理員予以更改或刪除。
想咨詢的同學請掃描二維碼添加好友