2018年4月27日

從自然聲景訊息中 擷取生物多樣性的變化

林子皓/科技部獨立博士後研究學者;國立研究開發法人海洋研究開發機構海洋生物多樣性研究分野博士後研究員。


生活周遭的環境,無論是都市或是山林裡都充滿著各式各樣的聲音,像是氣候、地殼運動產生的環境音,各種野生動物發出的鳴唱叫聲,還有人類活動製造出的各種噪音,這種由環境音、動物音與人為噪音所構築而成的聲音景觀(soundscape,簡稱聲景)蘊含著許多關於生態系、棲地環境變動的許多訊息。透過一小段的環境聲音,我們可以辨識出降雨、風吹等天氣事件,甚至可能從長時間錄音資料探討氣候變遷;從野生動物的錄音片段可以判斷哪些動物在鳴唱,也可以從許多地點、時間收集到的大量動物聲音分析物種多樣性的時空變化;從人為噪音的強弱,除了可以調查人為活動的頻度,更可以透過動物聲音和人為噪音之間的交互作用,探討人為開發對生態的潛在影響。因此,聲景不只是關於個人聆聽環境、生態的感受,聲景其實是一種觀測生態系動態變化的資訊平台,野地錄音也不只是等待我們聆聽的數位檔案,聲景已然成為生態科學中重要的監測資料。

受到這種生態資料科學的刺激,許多針對生態聲學(ecoacoustics)或是聲景生態學(soundscape ecology)的研究、應用也逐漸成長。隨著自動化錄音技術在近年的發展,大尺度的聲景監測網路已在全球各地的森林生態系建立,例如:日本東京大學在各實驗林架設的Cyberforest 計畫(https://global.pioneer/en/crdl_design/soundlab/cyberforest)、日本沖繩科學技術大學院大學在沖繩本島建立的OKEON美ら森プロジエクト(https://okeon.unit.oist.jp)、美國普渡大學在全球各地以及透過公民科學方式建立的Center for Global Soundscapes(https://centerforglobalsoundscapes.org)。海洋研究領域中,也有許多海洋物理的觀測網路配備有水下麥克風, 例如:Listening to the Deepocean Environment(https://www.listentothedeep.net)整合了許多國家的深海被動聲學觀測節點。


臺灣生態聲學網路
臺灣在這波熱潮下其實也走得不慢,農委會林業試驗所早在2014 年之前就開始在臺北植物園、蓮華池與六龜等地建構了長期生態感測網路(https://iesn.tfri.gov.tw/forestDW),收集許多蛙類的聲景資料,林業試驗所的陸聲山博士、王豫煌博士也建立起臺灣與東南亞國際合作的亞洲聲景平台(https://soundscape.twgrid.org)。中央氣象局也在2011 年建立了臺灣東北海洋觀測站,在蘇澳外海約277公尺深的海床上架設了一組連接海纜的水下麥克風,能夠24 小時連續不間斷地聆聽深海中的各種聲音。2016年開始,透過科技部獨立博士後研究專題計畫的支持,筆者和許多大專院校、研究單位、各地NGO 合作建立的臺灣生態聲景長期監測平台目前已連結了至少18 個長期陸域聲景測站(https://goo.gl/6SnYNd),並將大部分的原始錄音資料都公開在亞洲聲景平台中,希望以聲景建構出資料導向的生態監測網絡,並透過開放聲景資料來建立生態科學、資料科學與公民科學之間的跨領域合作。

目前在臺灣生態聲景長期監測平台的各陸域測站,每半小時就會啟動5 分鐘的錄音,日夜不停的累積觀測資料。儘管只是收錄人耳可聽頻率範圍的雙聲道錄音,一年下來單一錄音測站也會累積約1 TB 的資料量,如果要收錄超音波頻率範圍,長期錄音的資料量將會更龐大。這麼大量的數位資料,幾乎不可能仰賴人工檢查、分析,因此除了「工人智慧」之外,勢必也須導入「人工智慧」來協助分析處理聲景資訊,才能實際落實以聲景為基礎的生態監測應用。跨領域整合生態領域和資訊領域的專業知識並不容易,因此筆者和中央研究院資訊科技創新研究中心的曹昱博士合作,開發聲景訊息擷取(soundscape information retrieval)的資訊工具來協助生態研究人員,透過大量聲景資料了解生態系與棲地環境的動態變化。



視覺化觀察聲景的長期變化
聲景訊息擷取,顧名思義就是一種從大量錄音探勘聲景中關於環境、動物群聚與人為活動的訊息分析方法(圖一)。為了有效了解自然聲景的日夜、季節變化,首先可以產生長期時頻譜圖來觀察環境音、動物音與人為噪音的頻譜特性。長期時頻譜圖是一種透過統計方法壓縮錄音片段,達到減少資料量的方法,並可以藉由選定的壓縮時間比例來讓使用者視覺化不同時間尺度的聲景。例如,以5 分鐘為解析度壓縮頻譜觀察聲景的日夜變化、或以每天為解析度觀察聲景的季節變化。長時間頻譜圖其實是一種破壞性的壓縮方法,因此無法直接在長期時頻譜圖上觀察到原始的聲音訊號,但透過在地的生態觀察、聆聽經驗還是可以快速的在長期時頻譜圖上辨認出聲景中的各種主要元素,甚至能夠直接辨認出發聲動物的類群。例如,從濕地的長期時頻譜圖,即可觀察到白天明顯增強的低頻人為噪音與機具噪音、夜間出現的昆蟲鳴唱與蛙類合唱(圖二)。因此,長期時頻譜圖可以作為媒合生態研究、資料科學家與在地公民的聲景視覺化平台。

圖二:應用長期時頻譜圖觀察濕地聲景中的機具噪音、夜間昆蟲鳴唱與蛙類合唱。(作者提供)

雖然長期時頻譜圖是一種能夠觀察聲景長時間變化的簡易方法,但對生態研究人員來說,能否透過自動化工具辨認生物性和非生物性聲音才是最重要關鍵,否則仍得耗費大量人力與時間才能完成資料分析。自然界中有許多動物聲音和其他聲源,但目前仍然缺乏一個完整的聲音辨識資料庫。在缺乏大量辨識資料讓演算法學習的狀況,想要自動辨識哪些是生物性的聲音、哪些是非生物性的聲音仍非常不容易。那換個角度思考,是否有可能讓電腦聆聽大量的聲音資料後,自主學習找到生物性和非生物性聲源的差異呢?我們針對這個問題開發了「週期性編碼非負矩陣分解法(periodicity-coded nonnegative matrix factorization)」,這個工具是
可以自主學習輸入資料的頻譜特徵與時間的強度變化,再透過頻譜特徵在長時序資料中的週期性活動模式,將輸入資料拆解為一類具有強週期性的聲源以及一類具有弱週期性的聲源。我們把這個工具應用在自然聲景資料後,發現即使沒有預先定義演算法的規則,也沒有大量的人工標籤資料供演算法學習,週期性編碼非負矩陣分解法,仍可自動將長期時頻譜圖拆解為一類具有日夜週期性的動物合唱,另一類通常則為不具穩定週期性的環境噪音與人為噪音(圖三)。


圖三:應用週期性編碼非負矩陣分解法,將森林聲景的長期時頻譜圖拆解為具有不同日夜週期性的兩種聲景元素。(作者提供)


......【更多內容請閱讀科學月刊第581期】



沒有留言: