2018年7月31日

全民玩轉LHC 公開實驗數據。用虛擬作業系統蓋一個探索小屋吧!

趙元/從事高能物理研究,也是自由軟體與開放原始碼的愛好者。曾參與Belle與CMS實驗,目前是臺大物理系的助理研究員。

2008年9月,位於瑞法邊境、全世界最大的粒子物理實驗室──歐洲核子研究組織(Organisation Européenne pour la Recherche Nucléaire, CERN)開始試運轉大型強子對撞機(Large Hadron Collider, LHC)進行試運轉,並於2012年證實粒子物理學標準模型(standard model, SM)的基本粒子之一「希格斯粒子(Higgs particle)」存在。時至今日,當年以LHC的粒子偵測器緊湊緲子線圈(compact muon solenoid, CMS)所產生之實驗數據也已公諸於世,而人們也能利用這些數據,重現希格斯粒子的發現過程。

公開實驗數據,全民科學動起來
近年來在學術界與各國政府單位,都掀起所謂開放資料的風潮,是繼開放原始碼、創用CC授權與開放取用(open access)後,另一個知識全民共享的概念。除了在政府方面可增加公民參與、認可施政方針外,對於研究單位推廣科學普及教育,也是相當大的一個重點。

其實公開實驗數據這件事,並不是一個全新的概念。早在多年前,廣為人知的「美國航太總署(NASA)」就已階段性地把舊有的衛星數據、天文望遠鏡照片等資訊公開在其網站上供民眾自由下載,甚至可作為研究論文發表;而日本研究B介子的Belle實驗,也有公開一小部份的實驗數據,作為其高中生參與數據分析科學營之教學活動的教材。

從大型強子對撞型加速器,開啟數據分析的大航海時代
接下來所要提的「大型強子對撞機」實驗可說是現今粒子物理實驗研究的最先端,其在2012年所發表之希格斯粒子發現更是物理界的一大盛事,並在次年讓6位提出相關理論的其中2位物理學家希格斯(Peter Ware Higgs)與恩格勒(François Englert)教授得到諾貝爾物理學獎的殊榮。
在CMS偵測器中,希格斯粒子衰變的模擬事例重建圖。(Wikipedia)
解密推手
LHC實驗所在的基地,位於瑞法邊境的歐洲核子研究組織(CERN),不但是WWW全球資訊網(即大家每天瀏覽網頁背後的基礎協定)的發源地,也是歐洲基礎科學研究的一大推手。參與LHC實驗的主要成員除了鄰近的歐洲會員國外,美國也是長期的觀察會員國,不僅參與Atlas與CMS實驗(2個主要的通用型偵測器實驗),還有許多其他規模較小的實驗。

而在基礎科學研究不遺餘力的日本,也是觀察會員國之一,主要參與Atlas實驗為主。至於臺灣,雖不是CERN的會員國,卻也是參與Atlas、CMS等實驗的合作國家,文化部過去甚至與CERN官方共同舉辦「藝術與科學倍速合作計畫」及「藝科倍速@臺灣計畫」等交流活動。

全民玩轉LHC公開數據
LHC實驗不僅積極推動其發佈在期刊上的研究論文作開放取用,在「開放數據」上也有實際作為,作為政府經費的研究成果,公開讓全民可以無償取得,確為知識共享的具體展現。前面所提到的希格斯粒子,正是依賴巨量數據運算處理與分析能力,才成就這個偉大的發現。現在,2011∕2012年的完整CMS實驗數據,也搬上了CERN Open Data入口網站平台,總資料量更是高達了300TB,大數據公開的時代才正式來臨。

說來很好玩的,人人都可以親手分析發現希格斯粒子的數據,相信大家都躍躍欲試。讓我們依著CERN Open Data Portal所提供的範例解說(http://opendata.cern.ch/docs/cms-getting-started-2011),一步步來玩轉這份公開數據吧。

在數據分析前你必須知道的軟體環境建置
一開始我們需要建置分析數據的軟體環境。LHC實驗採用的作業系統是CERN與美國費米國家實驗室(Fermilab)共同維護的Scientific Linux,為基於紅帽(RedHat Linux)企業版的開放原始碼計劃。考慮從事相關研究的多數用戶較少使用這個環境,CMS實驗組提供了一個基於CERN Virtual Machine(CERN VM)的磁碟鏡像作因應,使用者只需下載VirtualBox這個跨平台的自由免費軟體,就能直接使用這個預先建置好的軟體環境。

雖說少掉一個麻煩,但也不是沒有缺點,依使用者設備的處理器硬體支援虛擬機器的程度不同,所要承擔的效能損失不一。因此,實驗合作者在效能需求的考量下 ......【更多內容請閱讀科學月刊第584期】

沒有留言: