數位聯展

RAG應用:知識庫檢索 QA Bot 與核保負面新聞比對

湯O、洪O傑

第一個專案核心目標為打造企業內部文件向量資料庫,並整合RAG架構建構具備知識檢索能力的問答機器人。我們以企業KM知識庫為基礎,解析多樣化的PDF檔案內容,包括一般文字與表格。實作中面臨解析表格與合併儲存格錯誤的挑戰,導致資料錯誤進而影響回覆品質。最終透過專門表格解析套件,成功處理表格還原問題。RAG流程設計結合metadata關鍵字設計,提升資料檢索效率與精準度;進一步引入Reranker模型,對初步搜尋結果進行語意重新排序,有效排除與問題無關的段落。整體專案不僅提升企業內部知識檢索效能與準確性,更展現生成式AI應用於企業知識管理中的實用性與實務導入所需克服的挑戰與解方。 第二個專案針對核保負面新聞比對系統,則是建構一個比對工具,從負面新聞內擷取關鍵特徵,並可進一步與判決書系統查詢相關案件且擷取資訊後,使用 LLM、爬蟲等技術提取案件相關被告人之資訊以做整合,由相似度比較判讀其保戶與新聞、案件類別之被告人姓名與背景是否相似,並生成 AI 分析報告,決定是否與以警告之資訊。