中心发布基于病毒学文献数据的情报分析
2019新型冠状病毒(2019 novel Coronavirus,以下简称2019-nCov)在武汉爆发,2020年1月30日WHO宣布将新型冠状病毒感染肺炎疫情列为国际关注的突发公共卫生事件(PHEIC)。冠状病毒(Coronaviruses、CoV)肆虐全球,成为所有人关注的焦点。
浙江大学文献信息分析与应用中心(https://ciraa.zju.edu.cn/)、中国工程院知识中心中国工程科技机构与专家库(http://expert.ckcest.cn)课题组基于Web of Science数据库,利用关键词对法构建发布了病毒学研究文献数据集,涵盖了病毒学领域2003-2018的研究文献322094篇,1839840条学者与研究机构信息,我们基于上述数据集进行了一些分析与探索,希望有助于学者的进一步合作与研究。
病毒学及传染病学研究概况
采用构建的相关研究数据集,统计数据按学者姓名和其所在机构聚类,如同机构同名学者将被认为是一位学者。我们对发文量前20的学者的研究内容进行聚类,按发文量指标进行排序后,得到前20的学者数据如表1所示。
表1病毒学及传染病学活跃研究者
作者 |
机构 |
发文数 |
研究方向 |
被引总次数 |
Haynes, Barton F. |
Duke Univ |
167 |
HIV-1, vaccine, broadly neutralizing antibodies, HIV vaccine, innate immunity |
17263 |
Montefiori, David C. |
Duke Univ |
153 |
vaccine,HIV,HIV-1,vaccines,antibodies |
10456 |
Mascola, John R. |
NIAID |
147 |
neutralizing antibodies, HIV-1, broadly neutralizing antibodies , human immunodeficiency virus, vaccines |
15366 |
Diamond, Michael S. |
Washington Univ |
143 |
flavivirus, Zika virus, viral pathogenesis, alphavirus, chikungunya virus |
12397 |
Wilson, Ian A. |
Scripps Res Inst |
141 |
X-ray crystallography, broadly neutralizing antibodies, HIV-1 vaccine, Env, crystal structure |
15814 |
Akira, Shizuo |
Osaka Univ |
139 |
innate immunity, signal transduction, NF-kappa B, TLR, cytokine |
17204 |
Kwong, Peter D. |
NIAID |
118 |
HIV-1, intranasal vaccine, live attenuated vaccine, respiratory syncytial virus, CD4 |
12939 |
Croce, Carlo M. |
Ohio State Univ |
109 |
microRNA, lung cancer, cancer, cell signaling, microRNAs |
18781 |
Rice, Charles M. |
Rockefeller Univ |
107 |
viral hepatitis, Liver Disease, Antiviral, ApoE, HCV |
11002 |
Flavell, Richard A. |
Yale Univ |
102 |
caspase-1, ASC, Inflammation, NLRP3, colon cancer |
10160 |
图1 病毒学及传染病学活跃研究者主要研究方向
冠状病毒的研究
将上述专家研究方向按云图展示发现病毒学领域的主要研究关注是艾滋病(HIV),而冠状病毒是一个相对细化的分支,因此病毒学TOP20的学者中并没有研究者以coronavirus(冠状病毒)作为主要研究方向。
为此我们从数据集中抽取coronavirus有关的关键词数据共计22个关联关键词,主要内容为冠状病毒及具体症状,如:MERS、MERS-CoV、severe acute respiratory syndrome (SARS)、SARS virus等,除此之外,也有一些上级词汇,如:Evolution(进化)、Vaccine(疫苗)等,如下图。
图2冠状病毒关联研究分布
通过对冠状病毒研究的共词,按出现最早年份排序,可以获得冠状病毒研究的研究过程树。从图3中可以看出冠状病毒的研究源于自身免疫性(Autoimmunity)研究(1990年),其下级节点包含SARS(2003年),MERS(2014年), 突刺蛋白 (Spike Protein,2017年), 猪流行性腹泻病毒 (PEDV,2019年)。其中SARS有关论文发文年度为:2003-2019,共计155篇;MERS有关论文发文年度为:2014-2019,共计1829篇。由上述数据可知,MERS所引发的关注远比SARS集中而持久,由于其超高的致死率,学术界对其倾注了极大的研究资源。
图3冠状病毒研究过程树
通过上述冠状病毒相关的22个关键词对,在数据集中二次检索收敛获取冠状病毒TOP20研究学者结果(因为发文数量并列,实际选取23名)如表2所示。
表2 主要研究学者
姓名 |
机构 |
发文数 |
研究方向 |
被引 |
Yuen, Kwok-Yung |
Univ Hong Kong |
45 |
coronavirus, MERS-CoV, influenza, MERS, vaccine |
7996 |
Baric, Ralph S. |
Univ N Carolina |
42 |
coronavirus, vaccine, norovirus, MERS-CoV, emerging pathogen |
2163 |
Perlman, Stanley |
Univ Iowa |
36 |
MERS-CoV, MERS, coronavirus, interferon, DPP4/CD26 |
1246 |
Drosten, Christian |
Univ Bonn |
32 |
evolution, MERS-coronavirus, coronavirus, pathogenesis, viral load |
2898 |
Peiris, JSM |
Univ Hong Kong |
23 |
influenza A, virus evolution, SARS, SARS-coronavirus seroprevalence, children |
6009 |
Chan, KH |
Univ Hong Kong |
21 |
SARS, SARS-coronavirus seroprevalence, children, cytokine, human avian |
5316 |
Mueller, Marcel A. |
Univ Bonn |
21 |
evolution, E3 ubiquitin ligase RCHY1, Ebola virus, MERS, MERS-Coronavirus |
2036 |
Haagmans, Bart L. |
Erasmus MC |
20 |
MERS-CoV, coronavirus, MERS, Middle East respiratory syndrome coronavirus (MERS-CoV), SARS |
1857 |
Rottier, Peter J. M. |
Univ Utrecht |
20 |
CHO 15B cells,CHO lec1 cells,LC3,N-linked glycosylation,PEDV |
1307 |
Denison, Mark R. |
Vanderbilt Univ |
18 |
coronavirus,ExoN,MHV,exoribonuclease,innate immunity |
907 |
Guan, Y |
Univ Hong Kong |
18 |
influenza A,virus evolution,angiotensin-converting enzyme 2,coronavirus,cytokine |
5961 |
Meyerholz, David K. |
Univ Iowa |
17 |
cystic fibrosis,MERS,coronavirus,inflammation,interferon |
476 |
Poon, LLM |
Univ Hong Kong |
17 |
cytokine,humanavian,influenzaA,virus evolution |
5466 |
Memish, Ziad A. |
MinistHlth |
16 |
MERS-CoV,screening,viralload,Ctvalue,HCV |
2334 |
Weiss, Susan R. |
Univ Penn |
15 |
coronavirus,2-5A,ExoN,MHV,Nidovirales |
448 |
Woo, Patrick C. Y. |
Univ Hong Kong |
15 |
Middle East,coronavirus,deltacoronavirus,falcon,houbara bustard |
1038 |
Li, Fang |
Univ Minnesota |
14 |
MERS-CoV,receptor-binding domain,spike protein,MERS,MERS-related coronavirus |
552 |
Snijder, Eric J. |
Leiden Univ |
14 |
genetic recoding,+RNA,ISG15,Nidovirales,coronavirus |
429 |
Zhao, Jincun |
Univ Iowa |
14 |
MERS-CoV,MERS,crystal structure,humanization,neutralizing monoclonal antibody |
519 |
Gerber, Susan I. |
Ctr Dis Control & Prevent |
13 |
MERS-CoV,Middle East respiratory syndrome,coronavirus,EMC-CoV,Jordan |
349 |
Jiang, Shibo |
New York Blood Ctr |
13 |
gp41,peptide,MERS-CoV,Anti-HIV agents,HIV-1 gp41 |
524 |
Lau, Susanna K. P. |
Univ Hong Kong |
13 |
Middle East,coronavirus,deltacoronavirus,falcon,houbara bustard |
862 |
Rottier, PJM |
Univ Utrecht |
13 |
Coronavirus,RNAi,virus infection,PEDV,nidoviruses |
1195 |
从表2可以看到香港大学的袁国勇(Yuen,Kwok-Yung)院士以相关研究成果45篇位列第一。同时,在冠状病毒研究TOP20学者中,香港大学学者占据7位。可见我国香港地区对冠状病毒有着持久的研究和长足的人才储备,未来极有可能在此领域产生重要的学术成果和解决方案。我们以袁国勇院士为例进行文献计量分析。
图4袁国勇院士
袁国勇,中国工程院院士,2001年至2011年担任香港大学微生物学系主任,2005年担任香港大学新发传染性疾病国家重点实验室首任主任,2020年,担任国家卫生健康委员会高级别专家组成员。
袁国勇院士在2013-2019年间对冠状病毒和SARS的研究共计发文29篇,在发现引起非典型肺炎的病原体方面,袁国勇院士发挥了关键作用,并在《柳叶刀》上发表了第一篇关于甲型H5N1流感的临床和实验室诊断论文。
截止2019年,袁国勇院士已在《Lancet》、《New England Journal of Medicine》、《Science》、《Journal of Virology and PNAS》等顶级医学期刊发表超过900篇学术论文,被引用超过36000次,主要的研究方向如图5所示,近期主要SCI医学期刊发文情况如图6所示。
图5袁国勇院士研究关键词图谱
图6袁国勇院士近期发文情况
通过对冠状病毒关联文章中的机构进行聚类,得到冠状病毒主要研究机构如表3所示,以香港大学位居首位。其中,中国的冠状病毒的主要研究机构有香港大学、中国科学院、中国医学科学院。
表3冠状病毒研究主要机构
机构名称 |
研究成果 |
研究专家 |
合作机构 |
关联国家和地区 |
Univ Hong Kong |
108 |
415 |
104 |
28 |
Univ Utrecht |
61 |
115 |
90 |
22 |
Univ N Carolina |
60 |
103 |
69 |
10 |
Univ Iowa |
49 |
79 |
64 |
18 |
Chinese Acad Sci |
38 |
199 |
68 |
9 |
NIAID |
38 |
143 |
39 |
10 |
Ctr Dis Control & Prevent |
36 |
202 |
51 |
14 |
Univ Bonn |
35 |
38 |
134 |
31 |
MinistHlth |
28 |
83 |
72 |
16 |
Vanderbilt Univ |
25 |
46 |
33 |
8 |
Leiden Univ |
25 |
63 |
25 |
12 |
Erasmus MC |
24 |
50 |
51 |
20 |
Univ Penn |
24 |
51 |
31 |
6 |
Univ Texas Med Branch |
20 |
39 |
24 |
6 |
Natl Inst Infect Dis |
20 |
44 |
24 |
5 |
Chinese Acad Med Sci |
20 |
96 |
37 |
6 |
Univ Minnesota |
19 |
25 |
28 |
5 |
Loyola Univ |
19 |
40 |
23 |
7 |
Purdue Univ |
18 |
35 |
20 |
5 |
Scripps Res Inst |
18 |
78 |
26 |
9 |
New York Blood Ctr |
18 |
47 |
22 |
3 |
Inst Pasteur |
16 |
29 |
44 |
13 |
Harvard Univ |
15 |
42 |
36 |
10 |
Univ Tennessee |
15 |
23 |
11 |
2 |
CSIC |
15 |
38 |
6 |
3 |
全球对冠状病毒研究的国家有55个,覆盖亚洲、欧洲和美洲的绝大部分国家和地区,其研究热度分布如图7所示。可以明显看到,热点研究区域主要集中在美国和中国,我们预计,对于此次疫情的防控和治疗方案也将依赖中美两国的研究与合作取得突破。
图7冠状病毒主要研究机构分布
中国工程院中国工程科技知识中心
浙江大学信息资源分析与应用
2020.2.13