為什麼說21世紀是生命科學的世紀?
2019年11月24日10:25

  文章來源:Nature自然科研

  原文作者:Alexander J。 Gates, Qing Ke, Onur Varol & Albert-László Barabási

  為《自然》150週年紀念撰寫的一篇分析指出,和以往相比,現在的科研論文所參考的資料來自更多的科研領域。

  知識如何啟迪學科和改變學科,這本身就是一個活躍的研究領域[1]。關於新發現、新觀點、新概念和新技術的元研究對政策製定者來說很重要,因為他們希望資助能滿足社會最迫切需要的研究,而社會問題不可避免地牽涉多個學科。

《自然》的共引網絡。圖中顯示的是《自然》自1900年以來出版的逾8.8萬篇論文,點代表論文,顏色代表學科。如果有其他的科研論文(被Web of Science收錄的)同時引用了這篇論文,那麼它們之間就產生連接。點的大小代表被共引的次數。| 來源:A。 J。 Gates et al。
《自然》的共引網絡。圖中顯示的是《自然》自1900年以來出版的逾8.8萬篇論文,點代表論文,顏色代表學科。如果有其他的科研論文(被Web of Science收錄的)同時引用了這篇論文,那麼它們之間就產生連接。點的大小代表被共引的次數。| 來源:A。 J。 Gates et al。

  從1869年創刊以來,《自然》成為了許多學科的重大科研進步的展示窗口。為了紀念它的誕辰,我們追蹤了不同學科論文引用以及被引用的模式。我們採用的數據來自Web of Science (WoS) 收錄的數千萬篇科學論文。WoS是一個收錄了1900年之後的數千種期刊的文獻索引系統,屬於科睿唯安(Clarivate Analytics)。我們的重點關注對像是《自然》的論文。在我們看來,上面這張圖片表明學科融合正在變得愈發普遍。

  但要注意幾點。我們的指標在20世紀初表現出一定的跳躍性,一部分原因在於當時的論文的引用文獻要少得多。在20世紀20年代前,《自然》的論文一般不列出參考文獻。但是如今的論文的參考文獻可達50條。另外需要指出的是,WoS承認的學科數量從1900年的57個增長至1993年的251個,但這個因素只能部分解釋我們發現的規律。

  許多學者都開發出了評估科學出版對知識的影響的指標和測量方法。

  從整體來看,我們的分析發現,和100年前相比,現在的論文參考的學科更多,影響的學科也更多,不過有一部分學科的影響力比另一部分的要大。《自然》出版的大多是細分學科的專業論文,因此參考文獻的學科範圍較為狹窄。但是,刊登在《自然》上的論文卻會被眾多學科引用。

  龐大的論文庫

  我們從WoS數據庫中提取了1900-2017年間的論文的參考文獻,這些文獻包含著近7億引用關係。我們對其中有至少1條引用文獻、受到至少1次引用並且發表在2010年前(這樣論文有累計引用的時間)的約1900萬論文進行了分析。最後所得的論文庫包含3800萬篇論文的學科信息。

  為了識別論文所屬學科,我們採用了WoS的粗略分類信息。這些信息不一定完美,但是憑藉龐大的數量能夠揭示出一定的規律。大多數期刊按學科劃分,WoS會根據論文所發表的期刊對其所屬領域進行判定,將其歸為一個或多個學科。比如,發表在Journal of Bacteriology上的論文就被歸為微生物學。

  通過識別文獻引用,我們就能追溯一篇論文的構思心路,因為作者會在參考文獻里列出他們採用的理論、方法、技術以及思想的來源。同樣,我們也可以通過一篇論文得到的引用來評估其影響力。在用引用來評估論文和作者時需要小心謹慎,但是,這類數據的體量以及可用性仍可以為我們展示科學知識累積的過程[1]。

  利用WoS的學科分類,我們分析了88637篇《自然》論文如何調節思想的“新陳代謝”。對於一篇參考文獻主要來自生物醫學研究領域的《自然》論文,它自身的引用也將主要來自其它生物醫學研究論文(見“知識流動”),不過約有一半引用來自其他學科。

  與之相比,主要參考了工程和技術文獻的論文更有可能被其他學科引用(72%),被本學科引用的量只占28%。不過,工程和技術類論文只占《自然》發表的論文的一小部分,而被選中的論文主要是因為它們的影響面大。另一個極端則是地球科學和空間科學的論文,這類論文更有可能被本學科(72%)而不是其他學科引用(28%)。

數據來源:Web of Science。 分析:A。 J。 Gates et al。
數據來源:Web of Science。 分析:A。 J。 Gates et al。

  另外一個分析學科內和跨學科知識流動的方法是研究共引情況[2]。這個方法將每篇論文看成一個節點,以點表示。如果有另外一篇論文同時引用了2篇論文,那麼這兩篇論文就形成了連接,節點的大小代表著共引的次數。我們的可視化算法將每個連接看作可以伸縮的彈簧,並讓連接儘可能地短。利用這個算法,我們對《自然》論文的學科交叉水平進行了歸類(見go.nature.com/n150int)。

數據來源:Web of Science。 分析:A。 J。 Gates et al。
數據來源:Web of Science。 分析:A。 J。 Gates et al。

  整體的網絡結構與人們對學科間的關係的感受遙相呼應。論文根據所屬年代和主題彙聚成群,因為作者通常會引用和本論文主題相關的近期論文[3]。在《自然》最近的歷史中(見“隨時間變化的學科”),超過一半的論文屬於生命科學領域。因此,大量生物醫學論文聚集成簇,出現在了網絡中。

  從1930年開始(此時可以利用參考文獻對論文學科進行分類),物理論文的佔比下降,地球科學和空間科學的佔比上升。某些論文(比如發現了第一顆繞類日恒星運行的系外行星的論文[4])被深嵌在同類論文中。但是發現臭氧層空洞[5]這篇論文出現在許多領域(化學、社會科學和地球科學)彙集的地方(見“共引網絡”)。我們的分析顯示,這篇論文的參考文獻所屬學科比95%的《自然》論文更加多樣,而它被引用的領域也比99%的《自然》論文更加繁多。

數據來源:Web of Science。 分析:A。 J。 Gates et al。
數據來源:Web of Science。 分析:A。 J。 Gates et al。

  如果是對更專的期刊進行同樣的共引網絡分析,得到的結果會大不相同。但是在《自然》的共引網絡中,科學史上的獨特片段依舊得到了彰顯(見go.nature.com/2patums)。這些片段包括:20世紀30年代的放射性元素的研究,80年代末和90年代超導材料的廣泛應用研究以及對其理論基礎的深入探討。

  時間流逝

  在過去的一百年里,每個學科的論文數量都呈指數式增長[1]。儘管不同學科的增長速率不同,但是大約從60年代開始,48%的論文屬於生命科學領域(另外42%的論文屬於“硬”科學,10%屬於行為科學)。

  研究者對跨學科影響力的定義和測量方法不盡相同。多學科一般指的是包含多種學科,同時各個學科保持相對獨立。我們對多學科期刊的定義是期刊論文參考的學科以及影響的學科的廣度。學科交叉一般指的是學科的融合,我們對跨學科的定義是某篇論文的參考文獻的多樣性,以及該論文滲透影響多個學科的多樣性。

  雖然很難評估引用了某篇論文的其他研究之間的融合度,但是我們的定義能夠衡量某篇論文傳播的知識是否具有多方位的影響[6]。這種分析能夠顯示多種學科交叉的程度,但是並不能體現學科交叉的具體作用方式。

  我們首先研究了某本期刊論文的參考文獻和被引情況所反映的學科廣度,以瞭解該刊的多學科性(見“靈感源和影響力”)。我們對期刊里的每篇論文的參考文獻(靈感源),以及引用了這篇論文的其他論文(影響力)的主要所屬領域進行標記,然後對其多學科性進行打分(從0-1)。

  我們利用歸一化熵(normalized entropy)進行記分。0分意味著一篇文章的所有參考文獻,或者引用了這篇文章的論文均屬於同一個學科。1分意味著參考文獻以及引用文獻中學科分佈是均勻的。我們發現,歸一化熵並不受到期刊發表論文數量的影響,它反映的可能是期刊的其他特質,比如接收的稿件特徵,或是編輯的選擇標準。

數據來源:Web of Science。 分析:A。 J。 Gates et al。
數據來源:Web of Science。 分析:A。 J。 Gates et al。

  對大多數期刊來說,論文影響力以及靈感源的學科範圍高度相關。對於那些學科性很強的期刊,如《細胞》和《物理評論快報》來說也是如此。當代期刊論文的參考文獻和被引的學科數量一般是6個。

  泛科學期刊《自然》和《科學》的影響力(被引用)以及靈感源(參考文獻)的學科廣度超過99.7%的期刊。《自然》的多學科性在20世紀60年代達到頂峰,之後一直維持在高位。這或許反映了《自然》收錄的論文擁有更廣泛的吸引力,並且這些論文更容易被科學界獲知。

  其次,通過測量每一篇論文的參考文獻以及引用了它的文獻的學科多樣性,我們對每一篇論文的學科交叉性進行了評估[7-10]。有許多方法可以測量學科交叉性,有時得到的結果可能並不一致(見參考文獻11、12)。

  但是研究者們就一點達成了一致,那就是僅僅看參考文獻和引用的學科數量是不夠的。比如,一些論文的參考文獻里大部分是生物學和臨床醫學的研究,那麼它的學科多樣性就不如那些綜合了生物學和物理的論文。我們採用饒斯特林指數(the Rao–Stirling diversity index)來測量這個性質,饒斯特林指數能夠反映代表性的學科數量、它們的分佈以及差異,所得指標的範圍在0和1之間[13]。

  我們的分析顯示,參考文獻和引用的學科多樣性都在增長。粗略來看,近10年里一篇典型的論文的參考文獻以及引用了它的論文所涉及的學科數量是50年前的3倍。

  目前平均一篇論文要參考11個學科的文獻,但《自然》的論文的參考文獻學科數量僅僅為9個。這印證了之前的研究結論——有高度影響力的論文也更有深度[14]。

  反之,泛科學期刊受到引用的學科範圍高於其他期刊,這說明這類期刊在科學界的影響範圍比其參考的範圍更廣。這個現象很合理,因為這類期刊希望通過出版科學大發現來影響更多的讀者。

  有時,某篇論文的參考文獻所屬學科和它所影響的學科相距甚遠。比如,2003年系統生物學家Leroy Hood 和David Galas[15]發表在《自然》上發表了“The Digital Code of DNA”,它的參考文獻主要來自分子生物學,但是卻被計算機科學、臨床醫學以及社會科學引用。

  我們賦予跨學科性0-1的分值區間。0指的是某篇論文的參考文獻和引用了這篇論文的學科完全相同。1指的是,兩者完全不同(用JS散度來計算,JS散度體現了兩個概率分佈之間的差別)。

  我們發現,近幾十年來跨學科性下降了,泛科學期刊的下降速度超過了整體水平。這或許是因為,跨學科的研究會影響到包括該研究所屬的多個學科。隨著參考學科數量的增加,它能影響的一套完全不同的學科範圍便縮小了。

  對科研成果的評估最好在其所在學科的框架內進行。比如,生物醫學類研究的引用數量和生物醫學類的相比才更有意義,和物理學的比意義就不大了。但是如果學科之間的“互動”不斷上升,那麼限製嚴格的比較就失去了價值。

  我們認為研究一篇論文涉及哪些學科,可能有助於進行學科間的比較,也有助於改進對論文影響力的評估。此外,如果學科之間的界限不再分明,那麼嚴格的院系劃分以及資助項目就不太說得通了。作為研究網絡的科學家,我們希望科學不再那麼封閉。

  我們發現,所有學科都出現了學科交叉性的增長,且沒有放緩的跡象。隨著研究人群、科研論文以及知識的增加,不同學科會變得愈來愈融合。研究機構以及資助單位應該意識到,學科交叉正在成為主流。

關注我們Facebook專頁
    相關新聞
      更多瀏覽