2013年11月1日

網民一起探索宇宙

我們共同擁有和欣賞同一個宇宙,但長久以來,研究和探索宇宙的工作全落在天文學家身上。1999 年,SETI@Home 的出現,完全改變了這個模式。

作者/曾耀寰(任職中研院天文所)

天文三大吸睛的亮點:大霹靂、黑洞和外星人,尤其是外星人,歷久不衰,但也最容易誤導科學。只有單純地問:到底有沒有外星人來到地球,可將這議題給看小了,這樣的疑問只能當作好萊塢科幻電影的題材,對人類科學進展沒有太大的幫助。

尋找外星文明的公式

外星人所引發的天文議題是全面性的,從生命起源、到星球起源都可以值得大書一番,例如在無生物環境當中,如何自行發展出有機的生命物質,這問題在地球上都還沒有解答,更遑論到外太空找外星人。不過我們還是可以對這個問題做一些簡單的估計,就像估計在凱達格蘭大道上可以站立多少名抗議人士,我們也可以估計銀河系內有多少高等文明。美國電波天文學家德瑞克(Frank Derek)曾在1961 年提出在銀河內發現高等文明的公式,這一公式並不代表找到外星人的證據,主要目的是用一個科學的方法討論這個問題。

我們可以用一個日常的例子來瞭解德瑞克公式。假設我想要知道台北市有多少家餐館是我喜歡的,最直接的方式就是踏遍台北市區,一家一家嘗試。但我也可以用較為科學的方式估計,先從台北市有多少家餐館開始,餐館總數乘上我喜歡的比例,得到的就是估計的結果。例如我喜歡中式餐館,可能的比例是50%,若是台式料理,佔中式餐館的比例可能是50%,其他如餐廳交通位置、餐廳裝潢、廚師手藝、服務品質、衛生程度等等條件,夯不啷噹地乘在一起就是我偏好的餐廳數量。同樣的方式,在找尋銀河內的高等文明時,首先要知道恆星數量,然後是這些恆星擁有行星的比例、每顆恆星的平均行星數量(我們相信高等文明是發展在行星上)、類似地球的行星比例、適合產生生命、生命能夠維持、能夠發展出高等文明等等的比例,最後得到的就是高等文明數量的估計值。

除了估計外,天文學家還可以主動出擊,對外太空發射電波訊號 [註一] ,或利用太空船攜帶地球簡介手冊 [註二] ,希望能有外星人收到訊息,並回覆我們,就像海邊撿到的瓶中信。但仔細評估,這種方式有點天真,天文學家估計離我們最近的恆星約4 光年,先不論訊號是否可以準確地射中星球,光是發射電波訊號,來回就要8 年的時間,銀河盤面的大小約十萬光年,也不考慮電波訊號的強度隨著傳播距離的平方成反比,光是傳播的時間就要等個天荒地老。因此,天文學家只得採用守株待兔的方式,利用電波望遠鏡接收外太空的訊號,期望收到外星人給我們的瓶中信。
------------------------------------------------------------------------------------------------
註一:1974 年阿雷西波電波望遠鏡將一份訊息以電波的方式朝向球狀星團M13 發射, 稱為阿雷西波訊息(Arecibo message),該訊息包括二進位的數字、DNA 所含的五種化學元素、核苷酸、雙螺旋、人類資料、人類所在的星球、發射此訊號的望遠鏡等。M13 離我們2 萬5000 光年,若M13 內有高等文明,預計在五萬年後可以收到對方的回覆。

註二:1977 年美國航海家太空船攜帶一張12 吋鍍金唱片,上頭記載了地球上的影像和聲音,包括大自然的海浪、風聲、雷電和動物聲,以及人類56 種不同語言的祝賀語,名為航海家金唱片(Voyager Golden Record)。航海家並沒有朝向特定目標,但估計在四萬年後,會接近到葛利斯445 恆星周圍1.6 光年範圍內。

這種守株待兔的方式就是SETI 計畫的構想。SETI 是Search for ExtraTerrestrial Intelligence 的縮寫,也就是搜尋地外文明的計畫。1960 年,德瑞克使用直徑26 公尺的電波望遠鏡搜尋來自外太空的訊號,他主要針對頻率1420 MHz 的氫原子電波訊號 [註三] ,用頻寬100 Hz 的接收器,掃描了400 kHz 的範圍,但沒有發現有趣的訊息。後續不斷地有相關的搜尋計畫,例如1963 年的俄亥俄州立大學SETI 計畫,使用大耳(Big Ear)電波望遠鏡,經過長年觀測,終於在1977 年8 月16 日偵測到一個有趣的窄頻電波訊號,當時整整持續了72秒,此後就未曾再出現。檢測到訊號的研究員埃爾曼(Jerry Ehman)在記錄該訊號的列印紙上隨手寫下了「哇!」(Wow!)字樣,因此這個訊號便被稱之為「哇訊號」(wow signal)(圖一)。
圖一:哇訊號,6EQUJ5 表示訊號變化的強度;
該訊號的位 置來自人馬座的方向。
------------------------------------------------------------------------------------------------
註三:1420 MHz 氫原子譜線,是頻率1420 MHz 的光子,相當於波長21 公分,又稱做21 公分譜線。這個特定波長的光子來自氫原子,氫原子是由一個質子和一個電子所構成的,質子和電子都有自旋,自旋是量子的現象,和日常生活中所看到的自旋是不同的。質子和電子的自旋方向可以同方向,也可以反方向。若質子電子自旋方向相同,則氫原子的能量較高,因此從自旋相同方向的狀態,轉變成自旋方向相反時,會釋放出能量,能量大小是兩個狀態的能量差,並以光子形式釋出,這個光子的波長為21 公分。由於氫原子是宇宙中含量最多的物質,外星人若要對外傳送訊息,應該會利用這個波段。

1979 年,美國加州大學柏克萊分校啟動名為搜尋鄰近已發展高等文明的地外電波發射(Search for Extraterrestirial Radio Emissions from Nearby Developed Intelligent Populations, SERENDIP),主要是找尋非自然產生的電波訊號,到了第四代SERENDIP計畫則是利用波多黎哥的阿雷西波電波望遠鏡,檢查頻率從1418.5~1421.5 MHz,每隔0.6 Hz,大約紀錄1 億6000 多萬個頻道,每天收集大約有35 GB 的資料。35 GB 相當於8000 多首mp3 的音樂檔。

 SETI@Home

為了從中找到外星訊號,早期天文學家設計出特殊功能的超級電腦作為資料處理的工具,例如一台造價70 萬美金的超級電腦,計算能力約1080 GFlops(1 GFlops是每秒處理十億次浮點運算)。1994 年,科學家傑岱(David Gedye) 與凱斯諾夫(Craig Kasnoff)在聊天中為SETI 計畫構思出全新的分析資料構想,並開了網民參與科學的先河。1999 年,加州大學柏克萊分校啟動了SETI@Home,讓全世界擁有個人電腦的網民,一同協助SETI 計畫分析資料。

SETI@Home 在網路上提供一個螢幕保護(screensaver)程式讓人下載使用,原本螢幕保護程式的功能是在電腦閒置時會自動執行的程式,藉以延長早期電腦CRT 螢幕的壽命,但SETI@Home 提供的程式則是在電腦閒置時,啟動分析SETI 資料的程式,先透過網路下載經過切割的部分電波資料,然後利用閒置的電腦分析資料,最後將結果上傳。根據當時(2003 年11 月)的統計,超過四百萬台個人電腦參與SETI@Home,總加的計算能力有5 萬GFlops,相當於價值3500 萬美金的超級電腦。

現今的SETI@Home 已經是第七版本(圖二),有針對 Windows、MacOS 和Linux 不同作業系統,也提供最新顯示卡最佳化的版本,利用高速的GPU 顯示卡達到更高效能的分析能力。由於SETI@Home的成功案例,不少類似的網民科學計畫上線,讀者可以透過BOINC 軟體的下載安裝(http://boinc.berkeley.edu/download.php),選擇想要參與的計畫,例如SETI@Home、Climateprediction.net 和 Rosetta@Home 等等。
圖二:新版SETI@Home 螢幕保護程式的快照。

SETI@Home 的軟體在個人電腦上所執行的步驟包括:下載資料、找尋可能的訊號、測試資料的正確性、移除訊號中的電波干擾(包括系統本身軟硬體的干擾,以及微波爐、汽車啟動、手機等外在干擾),以及確認出可能的訊號等五個步驟。所有的資料都是儲存在阿雷西波天文台的數位磁帶內,資料會先被切成348 KB 大小的片段(稱做工作單元),以供參與SETI@Home的網民下載分析,每個工作單元會被自動分派給一位以上的網民分析,以確保分析結果的正確性。

你如果幸運地找到可能的訊息,SETI@Home 會寄發一份正式的電報通知,也會在這項發現上列入你的姓名。沒發現的人也不要失望,就像買了沒中獎的彩券,你還是可以下載一份證明(圖三)。
圖三:SETI@Home 提供分析資料的證明文件範本。

透過來自網民的電腦資源,分析處理科學上的前沿研究,這在當時是一項創舉。一個吸引大眾的議題:尋找外星人訊息,讓更多熱心的參與者能夠加入SETI@Home計畫,以更科學的方式滿足大多數人的好奇心。這計畫的成功也啟發了許多研究單位爭相效法,希望藉由類似的模式,讓一般大眾能夠實際參與科學研究,例如天文方面的星系動物園(Galaxy Zoo)、行星獵人(Planet Hunter)等。

大家一起來動動腦

星系動物園, 或行星獵人雖也和SETI@Home 一樣,屬於網民科學,但與SETI@Home 不同,它們並不是需要分散在全世界的電腦資源,而是靠人腦資源。我們總認為電腦萬能,許多工作、甚至科學研究都得靠電腦的高速計算來完成。但電腦並不是在所有的工作上都能有較高的效率,有時人腦反而能超越電腦,例如圖形辨識能力。星系動物園和行星獵人就是利用人腦的優勢,透過網際網路的介面,經由大腦的判斷來完成一些辨識判讀的工作。星系動物園所要求的辨識其實很簡單,在第一版中,只要求網民從星系照片中判斷是否為橢圓星系、螺旋星系或相互碰撞的星系(merger),如果是螺旋星系,則螺旋臂的旋轉方向是順時鐘或逆時鐘(圖四)。
圖四:星系動物園網路分析快照圖,中間照片是待判斷的星系照片。
(圖片來源: Galaxy Zoo)

「星系」主要是由幾十億顆以上的恆星所構成的天體,恆星之間靠著彼此的萬有引力而相互聚集在一起,銀河就是由二千億顆恆星所構成的棒旋星系。之所以歸為棒旋星系,是由外觀所決定。美國天文學家哈柏經過長期觀測星系的經驗,將星系的外觀分為幾類。哈柏分類主要有橢圓星系、螺旋星系、棒旋星系,以及沒有特殊外觀的不規則星系(圖五)。照字面上看,星系的主要分類特徵有橢圓形狀、螺旋臂,以及當中的棒狀結構,所謂棒旋星系,就是既有螺旋臂,又有棒狀結構。第一版星系動物園的任務就是針對大量的星系影像進行分類,影像來自於史隆數位巡天(Sloan Digital Sky Survey, SDSS) 計畫。星系動物園於2007 年7 月11 日啟用,剛開始12 小時內,平均每小時獲得網民2萬個分類,40 小時之後的分類速率達到每小時6 萬個分類。SDSS 總共提供了將近90萬張星系影像,到2008 年4 月,星系動物園已經有超過10 萬網民參與分類的工作,並且每張星系影像平均有38 次的分類,一張影像的多次分類可確保網民結果的可靠性。
圖五:哈柏星系分類音叉圖。
圖中左側為橢圓星系,右上是螺旋星系,右下是棒旋星系。

由於第一版的成功,2009 年又推出第二版星系動物園(Galaxy Zoo 2, GZ2)。這次網民提供星系影像更多的訊息分類,例如星系的顏色和核球(bulge)的尺寸大小,甚至可以透過網頁介面的繪圖功能,讓網民描繪出棒狀結構的形狀和大小。GZ2的影像來自第一版中最亮的25 萬個星系,上線14 個月,獲得網民6000 萬個分類。緊接著的網民科學是哈柏動物園(Hubble Zoo),這次的主要目的是希望透過星系顏色和形態之間隨著時間的變化,瞭解星系如何演化,例如早期宇宙的藍色橢圓星系是否比紅色橢圓星系多?早期宇宙的不規則星系是否比較多?

科學上的貢獻

也許有人會質疑:這樣簡單的形態分類有什麼功用?其實不妨換個角度來問:宇宙中的星系為什麼有螺旋和橢圓兩種基本的形態?我們發現這個問題才更有趣。延伸出來的是,這兩種形態是如何產生?如何隨著宇宙演化而演化?之間是否有先後順序的關連?還是各自獨力演化?哈柏當時所做的分類也是為了能系統地瞭解星系形態外觀的起源,而至今這些還是天文學上未解的疑問。有些人將哈柏的音叉分類圖看成星系演化的過程,認為星系是從橢圓形狀演變成螺旋形狀,事實上哈柏分類圖是沒有先後演化的順序關連,造成誤解的原因可能來自名詞用法的混淆所致。哈柏將音叉圖左邊的星系稱為早期(early type),而右邊星系稱為晚期(late type),天文學家至今仍將橢圓星系稱做早期星系,螺旋或棒旋星系稱為晚期星系,但早期和晚期是無關於演化的先後順序,晚期並不代表該星系已經步入晚年,觀測顯示大部分的晚期星系比早期星系擁有更多的年輕恆星。這種字面上的困擾有點像光年,一個看似時間的距離單位。

網民所產生的星系形態資料庫,為星系研究提供非常重要的證據,例如顏色和形態的關係,天文學家通常假設顏色偏紅的星系,應該是橢圓星系,因為恆星年老之後,會進入紅巨星的階段,星系偏紅表示裡頭有較多的年老恆星,通常觀測的橢圓星系有較多的年老恆星,因此我們認為早期星系偏紅,晚期星系偏藍。星系動物園的分類顯示八成的星系的確如此,利用顏色可做為初步的形態分類。但星系動物園的資料也顯示不少的紅星系是螺旋星系(晚期星系),並且藍色的橢圓星系比預期的多。一般認為橢圓星系的歲數較老,相對地,裡頭的氣體較少,應該不會再產生大量的恆星,這項結果讓天文學家對於橢圓星系的演化過程有了新的看法。

再者,GZ2 對棒旋星系的棒狀結構進行調查,從分類結果顯示核心較大的紅色盤狀星系擁有棒狀結構的機會比藍色盤狀星系多;通常天文學家認為藍色表示年輕,如果藍色盤狀星系比較少有棒狀結構,這暗示了棒狀結構在星系演化的過程中扮演重要的角色。

這些大量的分類資料庫可以提供一些具有統計意義的線索,幫助天文學家理出星系演化的過程。除了線上分類外,星系動物園還成立了討論園地,讓網民們相互交流心得,或提出疑問和新發現,例如一位荷蘭網民在一張影像當中看見一團藍色物體,沒有人知道那團東西是什麼,該物體現稱做Voorwerp(荷蘭語的物體),單從SDSS 的原始影像是找不到答案,天文學家利用可見光和紫外線望遠鏡做了後續的觀測研究。

結語

由於電腦科技的快速進步,不僅電腦算的快,儲存的資料也快速累積,現今已經進入拍位元組(Petabyte, PB; 1 PB=1000TB=1015 byte)的大資料(big data)時代。剛開始的SETI@Home 可以在短短幾年的時間處理大量的電波訊號,但隨著觀測技術的演進,天文學家不再只像以往針對少數天體進行觀測,而是全天域全波段的巡天觀測,第一代星系動物園處理了大約一百萬個星系,需要數兆位元組(Terabyte, TB),現今市面上可以買到大約5500 新台幣的4 TB Sata III 硬碟,對網路儲存不成問題。但新一代的大型綜合巡天望遠鏡(Large Synoptic Survey Telescope)計畫能快速地進行全天可見光觀測,這是一台等效口徑6.7米的可見光望遠鏡,採用視野9.6 見方度的32 億畫素相機,每天產生的資料就有數十兆位元組,十年的觀測壽命可產生數十拍位元組,紀錄500 億個天體,每個天體大約會被重複拍攝1000 次。

這樣的資料還是得靠電腦處理,問題是電腦要如何分析和判斷資料,這部分就得靠網民參與科學的貢獻。已經有研究人員針對網民科學所提供的結果,作為電腦自我學習的範本,2010 年,英國劍橋大學的芭納吉(Manda Banerji)博士利用神經網路教導電腦學習如何對星系動物園的影像進行分類,類似的研究持續進行,這對未來大資料時代的資料挖掘(data mining)有很重要的貢獻。

網民科學對天文學的應用不僅讓一般民眾透過網路參與真正的科學研究,一起協助天文學家處理觀測的結果,天文學家藉由網民分類的資料,以及網民提供意外的發現和想法,可以從另一種角度瞭解我們的宇宙。從天文學以及資訊科學的未來進展來看,透過學習網民的操作行為與模式,讓電腦能夠自我學習,而不僅是準確地執行天文學家所提供的程式指令,也能依照人腦的判斷模式,更正確地快速處理大量的天文資料,並產生有意義的知識,而不至於讓我們迷失在大量的資料中。

沒有留言: