從工具到隊友：AI 角色的典範移轉——政大商學院、資訊學院與人工智慧跨域研究中心共同邀請國際奠基者，深析人機協作的溝通哲學與技術瓶頸

發佈日期2026-05-21

【人工智慧跨域研究中心訊】文字／顏菁瑩，校稿／方志浩，蕭爵非

國立政治大學商學院、資訊學院與人工智慧跨域研究中心於2026年5月6日上午，於商學院六樓寶來科技廳舉辦「Symposium on Human-Agent Teaming」研討會，邀請美國卡內基美隆大學電腦科學學院 Katia Sycara 教授，以及匹茲堡大學計算與資訊學院 Michael Lewis 教授擔任主講，由本校資訊管理學系簡士鎰教授主持。

隨著生成式 AI 與自主代理人技術的快速演進，人類與機器之間的協作關係已從工具使用層次，邁向更為複雜的「團隊合作」（teaming）型態。本次研討會即聚焦於此一前沿議題，探討人類如何與自主代理人建立有效溝通、信任機制與協同分工。Sycara 教授為《Autonomous Agents and Multi-Agent Systems》期刊創始主編，是多自主代理人系統研究領域的奠基者之一；Lewis 教授則為人因工程（Human Factors）與自動化控制領域的權威學者，長期關注人類在複雜技術系統中的認知負荷與決策表現。兩位學者在學術理論與實際應用層面皆具國際影響力，並長期合作開發供跨國搜救研究使用的機器人模擬平台，下載次數已逾七萬五千次。

Sycara 教授：當基礎模型遇上邏輯規劃

Sycara 教授的首場演講以「複雜世界中的人機團隊合作」（Human-Agent Teamwork in a Complex World）為題，從多自主代理人系統的學術發展史切入，提醒在場聽眾，雖然「自主代理人」（Agents）此一概念近期因生成式 AI 而再度成為熱門詞彙，相關研究實際上早於1995年的首屆國際多自主代理人系統會議便已啟動，至今累積近三十年的方法論基礎。

當前以大型語言模型為核心的 AI 助手，在 Sycara 教授看來存在許多基本限制，包括：經常是被動回應、容易因提示詞改寫而動搖原有目標、無法提供推理依據，以及無從判斷自身計畫於何時不可行。更值得警惕的是，由於模型被訓練得「樂於助人」，當被問及超出知識範圍的問題時，未必會誠實承認無知，反而可能虛構答案。在高風險、時間壓力大的決策情境中，此一特性尤其危險。

針對這些問題，Sycara 教授團隊開發了名為 CASTOR 的協作式自主代理人系統，其應用場景取材自美國海事管理局（MARAD）的緊急應變指南。颶風等災難過後，沿岸水道往往堆積擱淺、翻覆、燃燒乃至沉沒的船隻殘骸，阻斷航運與救援通行。應變決策者必須在時間壓力下辨識殘骸類型、查核法規許可、調度具備相應能力的清除資源，並隨情勢變化即時修訂計畫。CASTOR 的設計策略相當特別，將大型語言模型的角色限縮為人類與計算環境之間的「翻譯者」，而真正的規劃工作則交由具有形式化保證的邏輯式規劃器執行。如此一來，系統既能保有自然語言互動的便利性，又能避免幻覺與不可預測的行為。

在電腦視覺領域，由於受損船隻的訓練資料極為稀缺，傳統影像分類方法難以處理「擱淺船」、「翻覆船」、「燃燒船」與「沉沒船」等細粒度類別，Sycara 教授團隊因此提出於 NeurIPS 2024 發表的雙原型演化（Dual Prototype Evolving）方法，能在測試階段動態調整分類能力，無需重新訓練整個模型。為進一步抑制視覺語言模型在描述場景時的幻覺問題，團隊另提出一套生成式自我回饋機制（ICLR 2025），讓模型先產生描述，再透過文字轉圖像模型（Stable Diffusion）依該描述反向合成輔助影像，與原圖在 token 層級比對；一旦兩者在某些特徵上產生顯著歧異，系統便能據此修正下一個 token 的預測。她最後總結，當前的基礎模型在真實世界規劃任務中仍有所不足，未來研究方向應在於整合形式方法與學習式系統，使 AI 夥伴既能與人類自然溝通，亦能提供可驗證的安全保證。

Lewis 教授：無人機群與情境感知的兩難

Lewis 教授接續以「無人機團隊野火監測中的情境感知」（Situation Awareness for Wildfire Surveillance by UAV Teams）為題進行分享，從問題的迫切性切入。2025年全球因野火燒毀的土地面積高達3.9億公頃，相當於歐盟面積的92%，單是洛杉磯野火造成的損失就超過530億美元。隨著氣候變遷，預估至2030年野火頻率與強度將上升14%，至本世紀末更可能增加30%。

當前的監測技術各有侷限，衛星雖覆蓋廣但易受雲層遮蔽，地面攝影機則受限於建設成本與覆蓋範圍，遠端遙控的單機無人機亦須來回飛行，搜索效率有限。較具潛力的解方是部署無人機群，但隨之而來的挑戰是，當人類監督者面對來自多架無人機的影像串流時，如何整合這些資訊並建立對整體情勢的理解，便成為人因工程上的關鍵問題。

Lewis 教授團隊以美國加州克里夫蘭國家森林為實驗場域，採用 Anduril 公司的 Altius UAS 平台進行中等保真度模擬。研究設計的核心在於對比四種介面條件，包括同步觀看影像（即時影像）與非同步存取（事後重播）、完整介面與簡化介面，並進一步將人類受試者的表現與 GPT-4o 進行比較。本研究共招募 400 名受試者參與，屬於相當大規模的人機互動實驗。

研究結果相當具有啟發性。傳統上普遍認為「即時影像越多越好」，然而本研究的實證資料卻顛覆了這項直覺。在提供同步串流影像的條件下，受試者於整體情境感知（situational awareness）上的表現反而明顯下降，顯示持續性的即時影像可能成為認知負擔與注意力干擾的來源。相較之下，表現最佳的條件並非資訊最豐富的介面，而是「僅提供地圖資訊、影像可於事後重播」的非同步介面設計。當研究團隊將同樣的任務交由 GPT-4o 執行時，發現大型語言模型在即時的目標判斷上不如人類精確；然而在需要整合空間與時間資訊的全域性情境感知上，其表現反而超越人類受試者。研究團隊推測，原因可能與人類的記憶限制及多任務處理瓶頸有關。基於上述發現，Lewis 教授主張，若要充分發揮無人機群的潛力，未來的系統設計必須將導航、目標偵測、即時威脅評估，乃至於部分情境感知任務交由自動化處理，讓人類監督者能聚焦於真正需要判斷與決策的環節。

綜合對話與啟示

兩場演講後的綜合討論時段由簡士鎰教授主持，與會師生就自主代理人記憶機制、信念—欲望—意圖（BDI）架構、人機混合主動式互動，以及心智理論在機器中的實作可能等議題踴躍提問。Sycara 教授特別指出，記憶體的組織、檢索與「遺忘」策略仍是開放性的研究問題，而從每次互動中萃取「經驗教訓」的反思機制，已被證實能提升系統在後續任務上的表現。Lewis 教授則補充，現有 AI 在「情境變化偵測」上仍受限於框架問題，研究者必須在「聚焦」與「完整」之間做出取捨。

針對在場學生關心的研究入門問題，Sycara 教授鼓勵同學親手實作既有方法的程式碼，而非將其當作黑盒子使用，方能真正掌握其運作邏輯與潛在錯誤。另一方面，Lewis 教授則強調，當下正是投入此領域的絕佳時機。隨著相關工具越來越容易取得，研究門檻已大幅降低，同時跨領域合作的機會也比過去更加廣泛，為學生與研究者帶來更多可能性。

本次研討會不僅讓政大師生有機會直接與兩位國際頂尖學者對話，更勾勒出人機協作研究的當代圖景。當 AI 從工具演進為夥伴，研究者所面對的不再只是技術上的最佳化問題，更涉及人類與機器如何在共享目標、互相理解的基礎上完成複雜任務的協作哲學。

研討會尾聲，主辦單位致贈紀念禮予兩位主講人 Lewis 教授（左二）與 Sycara 教授（右二）。（照片來源：AI 中心）

Sycara 教授於現場分享其對複雜情境下人機協作的研究觀點。（照片來源：AI 中心）

Lewis 教授就無人機團隊野火監測中的情境感知議題進行說明。（照片來源：AI 中心）

主講人與與會師生於研討會結束後合影留。（照片來源：AI 中心）

訊息公告

從工具到隊友：AI 角色的典範移轉——政大商學院、資訊學院與人工智慧跨域研究中心共同邀請國際奠基者，深析人機協作的溝通哲學與技術瓶頸