數位聯展

聆聽深度的自然之聲(鳥類叫聲即時辨識)

黃○維、陳○翰

在這個繁忙的現代社會中,人們常常忽略了大自然中的美好,其中包括鳥兒的歌 聲。鳥鳴不僅是大自然中最動聽的音樂之一,還能夠給人心靈帶來慰藉,放鬆緊 張的情緒,是一種簡單而有效的減壓方式。

本研究計畫的目標是使用自監督式(Self-Supervised Learning, SSL)的預訓練模型結合多標籤(Multi-Label)辨識的技術,即時辨識多種鳥類的叫聲。透過深度學習方法,可以更深入地理解生態系統的複雜性與多樣性,從而促進科學研究和生物多樣性的保護工作,提升大眾對環境保護的認識和參與度。此外,能夠辨識和欣賞周圍自然鳥鳴聲音的人們,更有可能參與到保護自然的行動中。

研究計畫使用 Xeno-Canto 資料集,並採用 Wav2Vec 2.0 與 BEATs 模型來處理音訊資料,以捕捉鳥鳴聲音中的細微特徵和模式。接下來,將使用神經網絡架構來執行多標籤任務,即時辨識這些特徵對應的鳥類。本計畫的創新性在於將最新的音訊嵌入(audio embedding)技術應用於鳥鳴辨識中,並且聚焦於同一音檔中多種 鳥鳴的辨識。