Predicting Commuting Modes and Sustainability Awareness: A Pilot Study of ICI Students at NCCU
鄧O淵、黃O潔、陳O莉、朱O禦、黃O瀚、黃O兒
本前導研究探討國立政治大學創新國際學院(ICI)學生通勤選擇的主要影響因素,並檢驗一個簡單且具可解釋性的機器學習模型是否能預測學生的通勤方式。大學永續報告通常著重於校園總碳排放與能源使用等宏觀指標,卻鮮少捕捉真正形塑交通排放的日常決策。本研究將通勤方式同時視為實際考量與永續相關的決定,以填補此一落差,並對應聯合國永續發展目標第11項(永續城市與社區)與第13項(氣候行動)。我們透過 ICI 的 LINE 與 Instagram 管道蒐集了46份自陳式問卷,取得四項預測特徵——居住地點、最早上課時間、天氣適應性,以及自評的環保努力分數——以及每位受訪者的主要通勤方式。此任務被設定為監督式多類別分類問題,以通勤方式為標籤,四項特徵為預測變項。完成資料清理與類別標籤標準化後,我們於 RapidMiner(Altair AI Studio)建立決策樹分類模型;之所以選用決策樹而非更複雜的模型,是因其在小樣本下較不易過度擬合,且具備透明、可視化的分支邏輯。模型表現以整體準確率與交叉驗證下的混淆矩陣評估。模型整體準確率達52.50%(±10.46%),明顯高於五類別問題中隨機猜測的20–25%。模型對主要類別表現良好,「步行」召回率為75.00%、「捷運/YouBike」為80.00%,但對「機車」與「其他」等少數類別完全失效(召回率0.00%),並在模糊案例中頻繁誤判為「步行」。此現象反映出小樣本所造成的類別不平衡——多數受訪者居住於校內並仰賴步行或大眾運輸。分支規則顯示,雖然環保努力分數為初步預測因子,但居住地點的實際便利性最終凌駕於學生所陳述的環保意圖之上,主導其日常通勤決策。本研究的主要限制包括樣本數偏小、類別不平衡,以及未納入預算、實際通勤距離與車輛擁有狀況等特徵。我們建議與政大總務處合作,將此概念驗證擴大為全校分層抽樣調查,以解決類別不平衡問題,並支援如隨機森林等更穩健的集成模型,進而為實務性的永續政策提供依據。
