訊息公告

從工具到隊友:AI 角色的典範移轉——政大商學院、資訊學院與人工智慧跨域研究中心共同邀請國際奠基者,深析人機協作的溝通哲學與技術瓶頸

【人工智慧跨域研究中心訊】文字/顏菁瑩,校稿/方志浩,蕭爵非

國立政治大學商學院、資訊學院與人工智慧跨域研究中心於2026年5月6日上午,於商學院六樓寶來科技廳舉辦「Symposium on Human-Agent Teaming」研討會,邀請美國卡內基美隆大學電腦科學學院 Katia Sycara 教授,以及匹茲堡大學計算與資訊學院 Michael Lewis 教授擔任主講,由本校資訊管理學系簡士鎰教授主持。

隨著生成式 AI 與自主代理人技術的快速演進,人類與機器之間的協作關係已從工具使用層次,邁向更為複雜的「團隊合作」(teaming)型態。本次研討會即聚焦於此一前沿議題,探討人類如何與自主代理人建立有效溝通、信任機制與協同分工。Sycara 教授為《Autonomous Agents and Multi-Agent Systems》期刊創始主編,是多自主代理人系統研究領域的奠基者之一;Lewis 教授則為人因工程(Human Factors)與自動化控制領域的權威學者,長期關注人類在複雜技術系統中的認知負荷與決策表現。兩位學者在學術理論與實際應用層面皆具國際影響力,並長期合作開發供跨國搜救研究使用的機器人模擬平台,下載次數已逾七萬五千次。

Sycara 教授:當基礎模型遇上邏輯規劃

Sycara 教授的首場演講以「複雜世界中的人機團隊合作」(Human-Agent Teamwork in a Complex World)為題,從多自主代理人系統的學術發展史切入,提醒在場聽眾,雖然「自主代理人」(Agents)此一概念近期因生成式 AI 而再度成為熱門詞彙,相關研究實際上早於1995年的首屆國際多自主代理人系統會議便已啟動,至今累積近三十年的方法論基礎。

當前以大型語言模型為核心的 AI 助手,在 Sycara 教授看來存在許多基本限制,包括:經常是被動回應、容易因提示詞改寫而動搖原有目標、無法提供推理依據,以及無從判斷自身計畫於何時不可行。更值得警惕的是,由於模型被訓練得「樂於助人」,當被問及超出知識範圍的問題時,未必會誠實承認無知,反而可能虛構答案。在高風險、時間壓力大的決策情境中,此一特性尤其危險。

針對這些問題,Sycara 教授團隊開發了名為 CASTOR 的協作式自主代理人系統,其應用場景取材自美國海事管理局(MARAD)的緊急應變指南。颶風等災難過後,沿岸水道往往堆積擱淺、翻覆、燃燒乃至沉沒的船隻殘骸,阻斷航運與救援通行。應變決策者必須在時間壓力下辨識殘骸類型、查核法規許可、調度具備相應能力的清除資源,並隨情勢變化即時修訂計畫。CASTOR 的設計策略相當特別,將大型語言模型的角色限縮為人類與計算環境之間的「翻譯者」,而真正的規劃工作則交由具有形式化保證的邏輯式規劃器執行。如此一來,系統既能保有自然語言互動的便利性,又能避免幻覺與不可預測的行為。

在電腦視覺領域,由於受損船隻的訓練資料極為稀缺,傳統影像分類方法難以處理「擱淺船」、「翻覆船」、「燃燒船」與「沉沒船」等細粒度類別,Sycara 教授團隊因此提出於 NeurIPS 2024 發表的雙原型演化(Dual Prototype Evolving)方法,能在測試階段動態調整分類能力,無需重新訓練整個模型。為進一步抑制視覺語言模型在描述場景時的幻覺問題,團隊另提出一套生成式自我回饋機制(ICLR 2025),讓模型先產生描述,再透過文字轉圖像模型(Stable Diffusion)依該描述反向合成輔助影像,與原圖在 token 層級比對;一旦兩者在某些特徵上產生顯著歧異,系統便能據此修正下一個 token 的預測。她最後總結,當前的基礎模型在真實世界規劃任務中仍有所不足,未來研究方向應在於整合形式方法與學習式系統,使 AI 夥伴既能與人類自然溝通,亦能提供可驗證的安全保證。

Lewis 教授:無人機群與情境感知的兩難

Lewis 教授接續以「無人機團隊野火監測中的情境感知」(Situation Awareness for Wildfire Surveillance by UAV Teams)為題進行分享,從問題的迫切性切入。2025年全球因野火燒毀的土地面積高達3.9億公頃,相當於歐盟面積的92%,單是洛杉磯野火造成的損失就超過530億美元。隨著氣候變遷,預估至2030年野火頻率與強度將上升14%,至本世紀末更可能增加30%。

當前的監測技術各有侷限,衛星雖覆蓋廣但易受雲層遮蔽,地面攝影機則受限於建設成本與覆蓋範圍,遠端遙控的單機無人機亦須來回飛行,搜索效率有限。較具潛力的解方是部署無人機群,但隨之而來的挑戰是,當人類監督者面對來自多架無人機的影像串流時,如何整合這些資訊並建立對整體情勢的理解,便成為人因工程上的關鍵問題。

Lewis 教授團隊以美國加州克里夫蘭國家森林為實驗場域,採用 Anduril 公司的 Altius UAS 平台進行中等保真度模擬。研究設計的核心在於對比四種介面條件,包括同步觀看影像(即時影像)與非同步存取(事後重播)、完整介面與簡化介面,並進一步將人類受試者的表現與 GPT-4o 進行比較。本研究共招募 400 名受試者參與,屬於相當大規模的人機互動實驗。

研究結果相當具有啟發性。傳統上普遍認為「即時影像越多越好」,然而本研究的實證資料卻顛覆了這項直覺。在提供同步串流影像的條件下,受試者於整體情境感知(situational awareness)上的表現反而明顯下降,顯示持續性的即時影像可能成為認知負擔與注意力干擾的來源。相較之下,表現最佳的條件並非資訊最豐富的介面,而是「僅提供地圖資訊、影像可於事後重播」的非同步介面設計。當研究團隊將同樣的任務交由 GPT-4o 執行時,發現大型語言模型在即時的目標判斷上不如人類精確;然而在需要整合空間與時間資訊的全域性情境感知上,其表現反而超越人類受試者。研究團隊推測,原因可能與人類的記憶限制及多任務處理瓶頸有關。基於上述發現,Lewis 教授主張,若要充分發揮無人機群的潛力,未來的系統設計必須將導航、目標偵測、即時威脅評估,乃至於部分情境感知任務交由自動化處理,讓人類監督者能聚焦於真正需要判斷與決策的環節。

綜合對話與啟示

兩場演講後的綜合討論時段由簡士鎰教授主持,與會師生就自主代理人記憶機制、信念—欲望—意圖(BDI)架構、人機混合主動式互動,以及心智理論在機器中的實作可能等議題踴躍提問。Sycara 教授特別指出,記憶體的組織、檢索與「遺忘」策略仍是開放性的研究問題,而從每次互動中萃取「經驗教訓」的反思機制,已被證實能提升系統在後續任務上的表現。Lewis 教授則補充,現有 AI 在「情境變化偵測」上仍受限於框架問題,研究者必須在「聚焦」與「完整」之間做出取捨。

針對在場學生關心的研究入門問題,Sycara 教授鼓勵同學親手實作既有方法的程式碼,而非將其當作黑盒子使用,方能真正掌握其運作邏輯與潛在錯誤。另一方面,Lewis 教授則強調,當下正是投入此領域的絕佳時機。隨著相關工具越來越容易取得,研究門檻已大幅降低,同時跨領域合作的機會也比過去更加廣泛,為學生與研究者帶來更多可能性。

本次研討會不僅讓政大師生有機會直接與兩位國際頂尖學者對話,更勾勒出人機協作研究的當代圖景。當 AI 從工具演進為夥伴,研究者所面對的不再只是技術上的最佳化問題,更涉及人類與機器如何在共享目標、互相理解的基礎上完成複雜任務的協作哲學。

研討會尾聲,主辦單位致贈紀念禮予兩位主講人 Lewis 教授(左二)與 Sycara 教授(右二)。(照片來源:AI 中心)

Sycara 教授於現場分享其對複雜情境下人機協作的研究觀點。(照片來源:AI 中心)

Lewis 教授就無人機團隊野火監測中的情境感知議題進行說明。(照片來源:AI 中心)

主講人與與會師生於研討會結束後合影留。(照片來源:AI 中心)