「量化」是科學研究的根本。從最簡單的計數、丈量、秤重等,到利用儀器將各種物質特性,如溫度、溼度、硬度、透(吸)光度等,「讀」出數字後,就可進行各種比較、計算、統計、作圖等「科學」工作,亦所謂「壓搾數字」(crunching number)是也。甚至心理學家與醫生,也會試著把生物行為及病人情況分級,變成數字表示,以求客觀(主觀判定仍免不了)。因此,有人會想出方法來給學術期刊打分數,也不足為奇。
一份學術期刊的好壞,決定因素很多,客觀主觀都有;除了發行量、印刷品質與收費,以及編輯部成員等因素外,期刊的讀者群、作者群以及刊登論文的品質,才應該是最重要的考量因素,但那也是最難量化的。1960 年代初,美國的嘉菲德(Eugene Garfield)創立了「科學資訊社」(Institute for Scientific Information, ISI),並定期出版《科學文獻引用索引》(Science Citation Index, SCI);自此,學術期刊與學術論文的量化評比,也進入了新的時代。
傳統的論文資料庫,以收集論文本身的資料為主,包括作者、文章標題、期刊卷號頁數年份等,SCI 則不僅於此,它還把每篇文章引用的文獻都納入資料庫,藉以追蹤每篇論文發表後遭受引用的情形,這可是劃時代創舉。
學術論文都少不了文獻引用這一項。按性質及期刊不同,一篇論文引用的文獻少則 10 來篇,多則 40-50 篇;若以平均 30 篇計算,每期刊登 10 篇文章的小型期刊,會有 300 篇文獻,一年下來就是 3600 篇(以月刊計)。SCI 收錄的期刊,從 1964 年的 600 種,一路增加到 2009 年的 6650 種1, 2;就算扣除重複引用的文獻,其數字也相當可觀,在數百萬以上。早年沒有數位檔作直接傳輸,每篇文獻都得以人工輸入,可謂工程浩大,這也是嘉菲德與 ISI 成功之處。
擁有這樣豐富的資料庫,嘉菲德就能進行各式各樣的統計分析與計算;譬如說以發表論文數、論文被引用數,或是兩者的比值,將學術期刊予以排名列表。ISI 更於 1973 年推出《期刊引用報告》(Journal Citation Report, JCR),每年出版。其中尤以計算論文引用與發表數量比值的「影響指數」(impact factor, IF),影響最為深遠,也遭到最多的誤解與濫用3。
IF 的計算,是把任一期刊前兩年發表的論文,在當年被 SCI 收錄期刊所引用的次數當成分子,前兩年該期刊發表論文的總數當成分母,一除而得。舉例來說,《自然》(Nature)於 1967-8 兩年共發表 6811 篇文章,這些文章在 1969 年被引用了 15956 次;15956 除以 6811,就得出 1969 年《自然》的 IF 值:2.31。
曉得 IF 的計算方式,有助於了解它的意義與侷限。首先,IF 代表的只是某期刊連續兩年內刊登的論文,在第三年遭 SCI 期刊引用的數字比,可說是非常短期的指標。嘉菲德曾計算 7 年及 15 年的期刊 IF 值4,發現像《應用生理學期刊》(Journal of Applied Physiology),其單年 IF 值的排名,1983 年是 164 名, 1991 年則落到 376 名;但其 7 年(1989-1995)及 15 年(1981-1995)的 IF 值,則都維持在第 96 名。反之,《病毒學期刊》(Journal of Virology)單年及 7 年的 IF 值排名變化不大(29 與 23),但 15 年的則降至第 67 名。由此可見,常用的單年 IF 值並不能代表所有期刊的長期影響力,一味追逐每年的 IF 值,是沒有太大意義的。
再來,IF 的計算,很容易在分子分母上動手腳。有人可能疑惑,1969 年《自然》的 IF 怎麼才只有 2.3;理由其實很簡單:該年的文章總數約是 2004 年的 8 倍(6811 與 878 之比)。這不是說《自然》的篇幅變小了,而是 ISI 在《自然》期刊編輯的抗議下,把不屬於研究論文的社論、新聞、書評、投書等文章都去除了。這麼一來,分母變小、分子卻沒變(甚至還增加),於是 2004 年《自然》的 IF 值也就高達 32.2 了。類似的期刊 IF 值變化,經常可見。
打從成立起,ISI 就是私人商業機構,以販賣各種資訊產品圖利;1992 年,ISI 由湯姆森路透(Thomson Reuters)集團併購後,更是變本加厲,一切朝錢看。由於嘉菲德是學者出身,不斷利用其資料庫數據,提供新穎的分析,而取得學界信任;但在商言商,嘉菲德對 IF 的批評聲浪,可是極力辯護,絕不承認缺失。多數學術期刊編輯與出版社本著「打不過、就加入」的態度,也玩起提昇 IF 的遊戲;到後來連學校、研究機構與政府單位也都跟進。
2007-8 年,洛克斐勒大學出版社干冒大不韙5, 6,出面質疑湯姆森的 IF 值計算是黑箱作業,無法重複;並呼籲同行將旗下期刊論文的引用資料存入公共資料庫,讓人自由取用,而不再受制於湯姆森的專賣束縛。這可是多年來對 IF 最嚴厲且有力的批評。
洛大出版社的呼籲,一時可能還看不出效果,但國內大學及研究機構卻應該及早從 IF 的數字遊戲脫身,更無需每年送大筆銀子給湯姆森購買 JCR(三~五年買一份即可)。國內學界只要根據本身經驗,參考現有資料,就可以自行給期刊分類,作為大致評比的依據,而無需追逐每年由湯姆森出版的 IF 值。
以獨立思考判斷自詡的學術界,應該有如下體認:一、IF 不是判定期刊品質高下的唯一標準;二、IF 只是期刊的短期表現指標,不代表所有期刊的長期影響力;三、期刊的 IF 值高低,不能為每篇發表於該期刊的文章背書;四、學術論文應優先發表於有口碑的本行期刊,而不是 IF 值高的非本行期刊。
文獻引用索引(citation index)是了不起的發明,從中確實可以看出研究取向,以及論文受矚目的程度,但現行的期刊 IF 值計算,卻有許多缺失與誤導之處,並不科學。學界應有向 IF 說不的道德勇氣,自行建立規範,以杜絕現行以數字取向的弊端。
引用文獻:
- Garfield, E. (1972). Citation analysis as a tool in journal evaluation: Journals can be ranked by frequency and impact of citations for science policy studies. Science 178, 471-479.
- Thomson Reuters (2009). Science Citation Index. Retrieved from http://thomsonreuters.com/products_services/scientific/Science_Citation_Index
- Garfield, E. (2006). The history and meaning of the journal impact factor. Journal of the American Medical Association, 295, 90-93.
- Garfield, E. (1998). Long-term vs. short-term journal impact: does it matter? The Scientist, 12, 10-12.
- Rossner, M., Van Epps, H., & Hill, E. (2007). Show me the data. The Journal of Cell Biology, 179, 1091-1092.
- Rossner, M., Van Epps, H., & Hill, E. (2008). Irreproducible results: a response to Thomson Scientific. The Journal of Cell Biology, 180, 254-255.
原載 2009 年 6 月號《科學月刊》