生成式AI走進人文研究 陳志銘解析RAG與多模態技術在數位人文的應用突破
【人工智慧跨域研究中心訊】
在生成式人工智慧(Generative AI)日益普及的今天,人文與社會科學領域也正悄然翻開嶄新篇章。中心所辦理的AI跨域系列講座第三場邀請到本校圖書資訊與檔案學研究所所長、在職專班執行長暨華人文化元宇宙研究中心主任陳志銘特聘教授,以「生成式AI於提升人文社科領域研究應用」為題,深入淺出地介紹其在數位人文與生成式AI融合應用上的實踐經驗與研究觀察,聚焦於如何以基於大型語言模型(LLM)的「多模態檢索增強生成(MRAG)」技術協助文本、圖像與語音等多元資料進行分析與轉譯,並延伸至AI虛擬角色在數位策展與元宇宙中的應用,吸引校內外師生踴躍參與。
陳志銘特聘教授指出,導入生成式AI技術,並非為了取代人文學者的研究角色,而是作為強化資料處理與研究探索效率的輔助工具。陳志銘特聘教授進一步闡明:「人文學者的詮釋能力是無可取代的,但AI可以在資料整理與觀點建構的初步階段,發揮極大的加速效果,讓學者得以將更多心力投入在概念整合與理論深化上」。
陳志銘特聘教授以具體案例分享,透過RAG(Retrieval-Augmented Generation)技術,打造《倚天屠龍記》知識提取問答系統,此系統不僅能從大量文本中萃取概念,還能透過模型的摘要與重組能力,提供接近學術詮釋的回應。此外,他也分享與中央研究院合作的道教圖像分析計畫,介紹如何透過AI分析七八百幅道教卷軸掛圖,以文本尋圖、圖像自動分析與概念串連等方式,大幅提升研究效率。
在技術層面上,陳志銘特聘教授介紹了RAG的運作邏輯:先將研究者上傳的文本切割片段,再透過文字向量化(Text Embedding)技術存入向量資料庫,當研究者提出自然語言問題時,系統將進行語意比對,擷取相關文本段落,最後交由大型語言模型生成流暢且具邏輯性的回答,文本來自使用者,也是他認為研究最需要的部分。
除了理論和技術探討之外,陳志銘特聘教授也展示數位策展與虛擬角色建構的應用實例。陳志銘特聘教授說明,在3D互動平台結合虛擬導覽員的應用中,富有知識的角色能偵測觀眾語氣情緒,進一步以對話引導情境推演。陳志銘特聘教授補充:「導覽員不只回應觀眾提問,還能根據缺漏主動引導提問,達到真正的人機互動」。
在互動問答環節中,有學生提出了AI導覽員是否能進行「個人化訓練」並實際應用在教學或研究助理角色上。陳志銘特聘教授回應,目前已能透過微調(Fine-Tuning)與檢索增強生成(RAG)兩種方式建構具特定風格與專業知識的虛擬角色。陳志銘特聘教授更分享其團隊已設計出一套系統,能將教師過往的影音教材轉譯成語音文字,再整理進AI知識庫中。未來學生只要提出問題,就能得到對應解答,還能跳回到影片原始時間點。
陳志銘特聘教授坦言,儘管AI功能日新月異,但在課程設計會盡量避免使用容易被AI處理的題型,轉而使用較為複雜的資料圖表題型,確保學生是自己真正理解後解題。陳志銘特聘教授語重心長地說道:「AI是一個很強大的助手,但請不要讓它取代你自己」。
陳志銘特聘教授最後也鼓勵學生勇於參與國科會推動的「生成式AI導入人文社會科學研究推動計畫」,透過工作坊與實作訓練深入掌握RAG、向量資料庫、多模態整合等關鍵技術。陳志銘特聘教授也提醒大家,「與其害怕AI奪走人文位置,不如思考如何讓人文價值藉由AI被看見。」數位人文的核心不在於炫技,而是在於如何用科技重新理解與詮釋文化、歷史與人類社會。
AI中心吳致勳助理教授開場引言。 (照片來源:AI中心)
陳志銘特聘教授介紹AI導入人文社科領域研究推動計畫。(照片來源:AI中心)
陳志銘特聘教授講解AI導入數位人文研究目的。(照片來源:AI中心)
陳志銘特聘教授演講後與學生互動交流。(照片來源:AI中心)