數位聯展

消費數據分析 發票背後的故事

陳O鴻、顏O伍、梁O銘、陳O衡、陳O安、張O傑

本專案以結構化的「雲端發票」為核心,深入挖掘潛在的消費商機與大數據趨勢。相較於格式雜亂的傳統紙本,雲端發票具備統一特徵,利於數據探勘。我們透過四大核心模組展現數據價值:首先,建構「台灣發票交易熱力圖」,直觀呈現地理空間的消費密度與金額分布;其次,利用發票總額與品類等特徵進行 K-Means 分群,精準將消費者自動歸納為隨手買、日常採買、高單價精品與大量囤貨四大客群;再者,深入對比線上與線下通路,揭示雙通路在客客單價(線上為線下 2.8 倍)、深夜購物比例與年齡層結構上的黃金營業交錯特徵。最後,專案導入機器學習技術,以知名零售通路(如全家)為例預測未來營收,並成功開發「單次消費金額預測模型」。該 Ridge 迴歸模型整合了地點、時間、通路、品牌與折扣等特徵,在測試集評估中取得 R^2 = 0.5337、MAE 顯著優於基準線的優異預測表現,證實了發票數據在商業決策與精準行銷上的巨大可行性與應用價值