2009年6月7日

期刊影響指數細說從頭

作者/潘震澤(任教美國奧克蘭大學)

「量化」是科學研究的根本。從最簡單的計數、丈量、秤重等,到利用儀器將各種物質特性,如溫度、溼度、硬度、透(吸)光度等,「讀」出數字後,就可進行各種比較、計算、統計、作圖等「科學」工作,所謂「壓搾數字」(crunching number)是也。甚至心理學家與醫生,也會試著把生物行為及病人情況分級,變成數字表示,以求客觀(主觀判定仍免不了)。因此,有人會想出方法來給學術期刊打分數,也不足為奇。

一份學術期刊的好壞,決定因素很多,客觀主觀都有。除了發行量、印刷品質與收費,以及編輯部成員等因素外,期刊的讀者群、作者群以及刊登論文的品質,才應該是最重要的考量因素,但那也是最難量化的。1960年代初,美國嘉菲德(Eugene Garfield)創立了「科學資訊社」(Institute for Scientific Information, ISI),並定期出版《科學引用索引》(Science Citation Index, SCI)。自此,學術期刊與學術論文的量化評比,也進入了新的時代。

傳統的論文資料庫,以收集論文本身的資料為主,包括作者、文章標題、期刊卷號頁數年份等。SCI 則不僅於此,它還把每篇文章引用的文獻都納入資料庫,藉以追蹤每篇論文發表後遭受引用的情形,這可是劃時代創舉。

學術論文都少不了文獻引用這一項。按性質及期刊不同,一篇論文引用的文獻少則10來篇,多則40~50篇。若以平均30篇計算,每期刊登10篇文章的小型期刊,會有300 篇文獻,一年下來就是3600 篇(以月刊計)。SCI 收錄的期刊,從1964年的600種,一路增加到2009年的6650種,就算扣除重複引用的文獻,其數字也相當可觀,在數百萬以上。早年沒有數位檔作直接傳輸,每篇文獻都得以人工輸入,可謂工程浩大,這也是嘉菲德與ISI 成功之處。

擁有這樣豐富的資料庫,嘉菲德就能進行各式各樣的統計分析與計算。譬如說以發表論文數、論文被引用數,或是兩者的比值,將學術期刊予以排名列表。ISI 更於1973 年推出《期刊引用報告》(Journal Citation Report, JCR),每年出版。其中尤以計算論文引用與發表數量比值的「影響指數」(impact factor, IF),影響最為深遠,也遭到最多的誤解與濫用。

IF 的計算,是把任一期刊前兩年發表的論文,在當年被SCI 收錄期刊所引用的次數當成分子,前兩年該期刊發表論文的總數當成分母,一除而得。舉例來說, Nature 於1967~1968兩年共發表6811 篇文章,這些文章在1969 年被引用了15956次,15956除以6811,就得出1969年Nature的IF值:2.3 。

曉得IF的計算方式,有助於了解它的意義與侷限。首先,IF代表的只是某期刊連續兩年內刊登的論文,在第三年遭SCI 期刊引用的數字比,可說是非常短期的指標。嘉菲德曾計算7年及15年的期刊I F 值,發現像《應用生理學期刊》(Journal of Applied Physiology),其單年IF值的排名,從1983 年的164 名落到1991 年的376 名;但其7年(1989~1995)及15年(1981~1995)的IF值,則都躍居第96名。反之,《病毒學期刊》(Journal of Virology)單年及7年的IF值排名變化不大(35, 29 與23),但15年的則降至第67名。由此可見,常用的單年IF值並不能代表所有期刊的長期影響力,一味追逐每年的IF值,是沒有太大意義的。【更詳細的內容,請參閱第474期科學月刊】

回本期目錄

沒有留言: