谈灰色地带的科研诚信
中科院神经科学研究所2012年年会蒲慕明所长的讲话
2012年12月28日
(根据录音整理)
一、前言
我今天想讲的主题是过去主题的延续。几年前我曾经谈过诚信的问题。科学研究的诚信问题现在越来越重要。媒体上常有关于科学不端行为的报导,但事实上明目张胆的科学不端行为(scientific misconducts),所谓伪造、篡改和剽窃(Fabrication,Falsification,Plagiarism,简称FFP),是极少见的。现在最严重的问题不是明显的FFP,而是灰色地带的诚信问题,就是那些不容易被发现、标准不容易确定的问题。我们每一个从事科学研究的人都会遇到这些问题,都应该认真考虑,当遇到这些问题时,怎么做才符合诚信的要求。
二、数据分析和表述时的灰色地带行为
今天我首先想讲的就是数据分析和表述时的不当行为。首先,较严重的就是选择数据。只选择自己喜欢的结果,不喜欢的就不要。忽略不计对自己的结论有威胁性的数据。第二,在发表文章或口头表述结果时不当地夸大表述。前者比较容易判断是非,后者则是较困难判断的灰色地带问题。
1.数据选择或排除的理由必须清楚地说明
实验得到的数据是不是可以进行选择?根据什么样的原则来决定哪些数据保留,哪些数据可以舍去?我们每个人都会遇到类似情况,下面说说我个人的看法。如果你刚刚开始做实验,还在慢慢地摸索各种实验条件,可能得到的结果不可靠。逐渐地你把各个实验条件都摸索清楚了,得到的结果越来越可靠、重复性高。比如说,初期手术操作慢,生物体损伤大,实验结果差,到操作熟练后,结果就大不相同了。生物材料确实存在这类问题。当你的实验越来越熟练的时候,得到的结果往往是更可靠的,而早期学习过程中获得的结果往往不可靠。这个时候你可以做数据选择,但是一定要非常明确地说明,从何时、使用何种参数的实验开始的数据都算,之前的全部都不算。你不能把先前“好的”数据选出来与后来的数据一起统计。这种“好的”要,“不好的”不要就是不当行为。在表述研究结果的时候,最好把所有的参数以及由于操作慢得不到好结果的情况也说出来。因为如果你在报导的时候不讲,别人就可能无法重复出你的结果。虽然他是因为操作不熟练而做不出预期的结果,他很有可能认为你得到的结论是错的。为了维护你研究数据的可靠性,让别人能够重复你的工作,你一定要把数据选择的过程都讲清楚。所以,实验数据是可以进行“限制性的选择”的,但选择的方式必须是合理的,在报导时也必须将选择过程有明确的交代。
2. 如何避免无意识的数据选择
但当我们在做数据采集或分析的时候,常常还会有无意识地选择数据的倾向。你知道分析的标本是什么,在无意识的情况下你可能会选择了你所期望得到的数据。比如说,你采集了40个数据,得到的结果总的来说是合乎你的期望,你就觉得数据足够了,停止采集。但有可能当你采集了80个数据的时候,这种现象就消失了。这种无意识的数据选择常常影响了实验的结论。现在大家做实验常常会出现这样的情况,课题是你个人的,实验自己做,取样自己取,标本自己分析,这种工作方式很不好。最好是通过合作的方式来采集或分析数据。比如你得到了实验样品后,可以请你的同学对你的样品进行编码,做盲实验(blind experiment)。目的就是你自己做数据采集或分析时,不知道样品是哪一种。盲实验有单盲和双盲实验,我们就以单盲实验为例,简单来说就是数据采集或分析者不知道标本是实验组还是对照组。这一点很容易做到,如果是两个人合作,一人负责实验,另一人负责数据分析,彼此不知道样品的具体情况。即使是你一个人的课题,你既做实验又做分析,你也可以请同学帮忙,让他帮你把样品重新编码,然后你再来分析,得到结果后再解码。这么做的好处在于你对自己得到的结果会更有信心。尤其是当你得到了很惊人的结果时,一般人的第一反应是会怀疑你的数据的可靠性。如果你的论文中有描述:“我这些结果都是在blind experiment的情况下得到的”,你的结论就会更有说服力。现在很少人在文章中能写出这句话,因为大部分人都没有做到数据采集分析是盲实验这一点。所以我建议以后在做采集分析数据时,采用盲实验的方法。
3.不符合所期望的数据可能是有意义的,甚至是更重要的数据
我们常常希望看到想要的结果。如果实验结果符合你的假说,你会很高兴。但是那些不符合你所期望的数据,其实可能是有意义的,甚至可能是更重要的。为什么这么说呢?当我问一位同学:你现在正在做什么?得到的回答常常是:我在证实我的一个假说。其实这种说法其实是不正确的,因为我是永远不可能证实我的假说。我只可能做有限数量的实验,最多只能说是在有限条件下得到结果符合我的假说。因为谁也不可能去检测所有的条件,所以从逻辑上讲,没有一个假说是可以真正被证实的。我们在口语中常说:“I want to prove my hypothesis”。虽然口语说说无伤大雅,但这种说法可能无意识地造成一种偏见,认为实验工作的目的就是为了找到符合或“证实”自己假说的结果。比较正确的说法是:“我的实验是为了检测(test)我的假说”。因为在得到结果前,并不知道我的假说是对是错,所以假说只是帮助目前工作的假说(working hypothesis),工作结果最多只能是支持或推翻我的假说(My data support or refute my hypothesis),而并不能证实(prove)我的假说。直到有一天,别人做了其它的实验,可能在不同的条件下发现我的假说根本不对。到那时候就得修正我的假说。所以,没有一个假说是可以永远成立的,即使牛顿定律也一样。鉴于此,当你被问到你在做什么时,真正最好的说法是:我在找推翻我的假说的证据(“I want to refute my hypothesis”)。这才是你真正应该做的事情。
如果你的实验结果并不符合你的假说,这可能是对科学更有意义的贡献。为什么这么说呢?我们先看看假说是怎么被提出来的。一般你都是根据目前大家的想法,再根据已有的实验结果,经过你的思考整合后提出的。也就是说,在目前已知的现象和概念下,这个假说可能是最合适的。如果你的实验结果并不符合这个假说,说明我们目前对自然现象的理解是不对的,需要进一步修正,这就是科学的进展。因此,推动科学进展的结果常常不是符合大家认为是合理的假说的证据,而是不合假说的证据。从这个角度讲,推翻你自己的或是别人的假说,应该才是实验工作的最好目标。如果你的实验数据不符合你现在的假说,这不是坏的实验数据,也不是实验不成功,事实上实验是真的成功了。当然你的实验数据必须可靠、有重复性,有时正有时负的数据是不可靠的,能重复得到的负结果和正结果一样是重要的结果,甚至更重要。总之,假说存在的价值就是可以作为推进科学进展的一个工具。假说是用来给人推翻的,而不是给人证实的(Hypothesis is there to be refuted, not to be proved)。
4.数据的重复性
我们说不符合你假说的数据,可能是最好的结果。因此在这种情况下,你要比较客观地来看待你的数据,这就不得不提一下数据的重复性。重复性是指,可靠的实验结果一定要能够被你自己或别人重复。在各位的实验室中,如果某一位同学得到了很重要的结果,我认为最好请实验室的另一位同学重复再做一次这个实验。如果结果能重复,那么对这个结果的信心就会大大增强。这也是我们要求合作的原因之一。合作研究不见得一定要做不同的实验,可以做同样的实验。如果得到一样的结果,大家都更有信心,写文章的时候就信心十足。
数据的重复性是非常重要的,少数的例子是不可靠的,格外突出的结论需要格外有力的证据(Extraordinary claim demands extraordinary evidence)。尤其是关键性的重要实验,最好有格外强有力的证据, 重复性要高,与对照组有差别要大,误差(error bar)要小。这种证据下得到的结论才能让别人信服。
5.什么是统计上有意义的结果
什么是统计上有意义的结果?举例说,我们得到了两组数据,它们的差别用t检验法得到的p值为0.045。我们一般认为p值小于0.05,差别就是有意义的。你在报道结果时写成“Two groups are significantly different”,读者或者听众就会认为你的两组数据有非常显著的差别,但是实际上你的所谓“显著差别”只是在统计上达到了某种程度的意义(statistical significance at a particular level)。现在很多期刊都规定要把p值明确写出来,不能仅仅写p值小于多少。正确的写法应该是:“Two groups are different with statistical significance at a level of p = 0.045”。你告诉读者这两组数据在统计学上达到了某种程度的差别,让读者自己去判断这种差别有多大的意义。你自己也要知道得到的p值的意思,简单来说t检验法得到的p值若等于0.05,就是说有95%的可能性你的两组数据是有差别的,有5%的可能性是没有差别的,所以你一定要明确说出p值的具体数值。生物学家常把p = 0.05作为差别是否有意义的标准,有些物理学家认为这个标准很可笑,他们认为有意义的差别p值应小于0.01甚至0.001,标准是因人而异的。
我们的两组数据差别如果p值是0.055,我们就说结果没有意义。但是0.055和0.045的差别到底有多大不同呢?也许你多做两次实验,你的p值就从0.055变成了0.045,因为p值与样本数(n值)有关。也可能多做着两次实验要花费你很多时间精力,因此你不想做了。但是我认为,如果这是一个格外重要的结论,你的证据一定要非常充分,你的p值标准应降到远低于0.05,不能只满足于0.05。如果你的两组数据p值是0.055,你得到的结论“Two groups are not significantly different”。我认为这样表达也不对,正确的表述应该是:“The difference between the two groups are not statistically significant at a level of p = 0.05)”或者说“Two groups are different with statistical significance at a level of p = 0.055”。如果P值是0.055,我也可以说两组数据有差别。我猜测0.055的原因可能就是样本数不够,也许多做两次实验P值就降到0.05以下了。但是我不能说我的两组数据有显著差别,我只能告诉大家这两组数据的差别在p = 0.055的水平,这就是如实地表述你得到的结果。所以“Two groups are different with statistical significance at a level of p = 0.055”这句话是没有错的;它和前面的那句话“Two groups are different with statistical significance at a level of p = 0.045”并没有什么差别,差别就是p值的数值而已。你得到的数据p值有差别,而两组数据差别的本质是没有太大的不同,所以两句话的叙述方式应该是一样的。
6.为什么不当的数据选择行为十分普遍
不合诚信的数据选择行为十分普遍,我认为主要有以下的原因。首先,不诚信的数据选择是很难被发现的。假设你独自一人做实验,没有选取某个数据,除了你自己没有其他人知道。但是我认为这么做的恶果是自己或别人被引导到错误的方向。因为你的结论是基于数据选择而得到的,事实上你就把自己绑在这个结论上。等到有一天别人得到了相反的结果,你就必须承认错误了。即使没有其他人发现,但也许相反的结果更加重要,而你已经被牢牢地限制在你的错误结论上。当有一天相反的结果被发现,你也只能承认过去的错误或者承认数据不充分。如果是被别人指出你的数据是错误的话,后果就更严重了。而且越是重要的发现,后果越严重。
有的人认为,发表自己知道不可靠的结果,似乎没有什么风险。很多论文都不能重复,我的论文不能重复又有什么关系。反正我的论文已经发表在顶尖的期刊上了,名声也已经建立了,顶尖期刊的很多其他论文也不能重复,所以有人愿意冒这个风险。这是为了短期的利益而冒的风险,因为不可靠的结论很快就会被发现,尤其是那些重要的结论(无关紧要的结论,也许没有人关心,不会被发现)。如果你从事的研究大家都很感兴趣,而你的科研事业就依赖于这项发现,那么发表不可靠结果的风险马上就会出现。感兴趣的研究一定会有人去重复,现在从事科研的人那么多,迟早是会被发现的。所以我认为相对于个人长期的科研事业,不当数据选择获得的利益是短期的,存在着很大的风险。如果你要在科学界长期生存,成为一位声誉好的科学家,你就不能不坚守诚信的标准。
三、实验记录的规范
1. 个人实验记录本的规范
下面我再谈谈实验记录本的问题,虽然我过去强调过一定要认真完成实验记录,但是我今天要有系统地再谈一下这个问题。
首先要强调实验记录本不是你个人的,它属于你所在的实验室,而且是实验室必需保存的重要资料。当你离开实验室时,所有的原始实验记录本都必须保留在实验室,你可以带走影印的副本,原件必须保留在实验室。
实验记录本要保留在实验室,实验记录也必须非常仔细地完成。为什么要仔细记录呢?我不知道是否同学们认真思考过这个问题?我认为实验记录的目的包括:(1) 整理自己的思路,(2)实验的历史记录,(3)帮助自己回忆实验过程,(4)有助于他人重复你的实验,(5)在有不端行为控诉时,有为自己辩护的材料。
实验记录本是一件能够帮助整理自己思路的,很重要的工具。实验记录本上应该有做实验的目的,也应该能够反映出你整个实验的过程。你做实验记录的过程实际上也是你整理自己思路的过程。实验的历史记录。实验记录本上的内容也是你实验的历史,它能够帮助你回忆自己过去的实验过程。有可能实验完成若干年以后,你已经忘记了实验的内容和实验的目的,这个时候实验记录本可以帮助你回忆实验的过程。实验记录本不单单帮助你自己回忆,也能够帮助别人重复你的实验,这一点更加重要。几年以后,也许你的师弟师妹要开展下一步的工作,必须重复你的实验,你的实验记录本就是他(她)的“经典”资料,他必须根据你的实验记录来重复实验。如果实验结果出了问题(过去我们所发生过类似的事件),我们就必须详细地审查过去的实验记录本,查看当初到底是怎么回事。所以当有控诉不端行为的时候,实验记录本也是为自己辩护的材料。假如是有很好的记录,你就有很好的资料来为自己辩护。
实验记录本上应该有5项内容,请大家一定要记住,别的内容可以不记录,这5项内容必须齐全。(1)日期 (记录本必需是装订好有印好页数的本子,不能是活页本),(2)实验的名称, (3)实验目的的简短说明, (4)实验的叙述, (5)结果的总结(和解释)。
几年前我就要求所里的研究生在做年度进展报告的时候要提供实验记录本,我参加的时候都会翻阅一下。虽然没有仔细去看,但还是看到很多问题,这5项一般都不全。第一项日期都是有的。必需强调一点,实验记录本必须是装订好的,不能是活页的本子(神经所有统一制作的实验记录本,所有记录本均有编号和领用记录),这是所有实验记录本的规矩,尤其是在工业界。将来无论你从事哪一行,科学研究也好,工业界也好,这个规矩是通用的。你现在养成良好的习惯,对你将来的事业是很有帮助的。
实验的名称大家都没写。实验名称要写明是做什么实验,比如今天是“测量cAMP的水平”或者“测量在XX条件变化下XX基因的表达水平”等等,一般来说简单一句话即可。名称下面,应该用简短的一段话说明实验的目的,即为什么要做这个实验,比如“之前得到了XXX结果,所以今天要做XXX实验”。之后就要叙述实验的过程,写清楚这个实验是怎么做的。比如今天做的是麻醉动物的电生理记录,那么至少要写清楚“什么时候开始麻醉,如何麻醉,多少剂量,什么内容等等”,总之要把实验的详细内容叙述清楚。我经常看到同学的实验记录本上大部分是数字、剂量,缺少详细的描述过程,有些数字只有实验者本人知道代表的意思,外人或者其他需要重复你实验的人很难理解。实验叙述完以后,还应该有对结果的总结或解释。按照实验的类别不同,有的结果需要分析后得出,但是有的结果当场就可以分析(解释)。即使当时分析不出来,我也建议你分析好以后补充进去。比如“今天得到的数据,发现麻醉剂量过度,因此得到的数据数量有限,造成实验可能不成功,下次实验应该改变什么样的剂量”。
实验记录的5项内容,一般花个十分钟就可以完成了。既然你已经做了一天的实验,为什么不能再花十分钟把实验记录做完整呢?我希望大家做完实验马上写实验记录,写完实验记录才算完成了一天的实验任务。养成良好的实验记录习惯,将来受惠无穷。如果将来你去做博士后,你的导师翻开你的实验记录本,这5项内容都有,他将会印象深刻。假如看到的是我们现在的实验记录本,就会觉得离标准实在太远了。
2. 必须保存原始数据资料
现在很多数据资料不是记录在实验记录本上的,数字化的数据是保存在磁盘或者计算机中的。这类原始数据资料必须妥善保存。几年前美国显微镜学会(Microscopy Society of America)制定了有关数字化图像的处理规定,他们定义了符合科研道德的处理数字化图片的方式(Ethical digital image processing, Microscopy Today, Nov/Dec 2003, p. 61)。他们认为,图片资料存档如保存在CD-R光盘上,该图片资料必须是未经压缩或其他操作处理的原始图片资料。这么做的目的是什么呢?假如你在CD上保存的是处理过的图片,将来写论文的时候,如果需要改变图片的某一个参数(如对比度),你在CD上的图片已经经过处理,再也无法找到原始的图片。所以保存在CD上的必须是最原始的资料,即使你要保存处理过的资料,你必须另外存一份原始资料。图像文件资料的处理和生成的所有参数,随后的处理步骤等,都必须存档并记录,以保证资料能够被重新处理组成。你在实验记录本上,必须详细地记录你未处理过的资料保存在什么地方,处理过的资料保存在什么地方,这样别人才能通过实验记录最终找到原始的资料。电生理的数据也是一样。比如,你应该保存所有原始的膜电位或脉冲数据,而不是经过分析后的图表。
实验室组长要监督这些事情。在写论文之前,实验室组长必须要检查过所有的原始数据。虽然这很困难,但却是不可避免的工作。实验室组长要注意实验的细节和原始数据资料,不要只看最后组成的图表。实验室组长还应该培育良好的实验室文化,尊重实验操作符合伦理的态度,强调规范地做好实验记录。希望各位组长能够一起努力做到这一点。
四、挂名为共同作者的要求和责任
另外一个灰色地带的问题涉及到共同作者的问题。现在很多论文都有一大批共同作者,所以科学界应该对共同作者有一个共识,各位也应该对共同作者有一个正确的理解。我们对第一作者的要求比较清楚,但目前有很多共同作者的署名是不合理的。现在很多期刊都要求写清楚作者的贡献,即使某些期刊不需要撰写作者贡献,你也可以自己在文中提供这些资料。这么做的好处就是帮助你排除不应该挂名作者的人,有时候别人想挂名,你把贡献内容列出来,没有实质贡献的人就知道自己不应该作为共同作者。以网络期刊Neural Development为例,它对作者贡献的要求最详尽,内容篇幅很长,比如:“PIT designed the study, wrote the manuscript, and performed and participated in all experiments. HHK, YTL and SRY participated in the electrophysiological experiments and analysis. CG and RHP designed, manufactured, and supplied the Fak56 point mutation and Fak56RNAi constructs, performed dpERK embryonic staining, and contributed to manuscript revisions. AG and DVV helped to characterize the NMJ phenotype of Fak56CG1. TTL and KPP helped to analyze the synaptic markers at NMJ of Fak56 mutants. RHC helped revise the manuscript and provided suggestions with regard to signal transduction and intellectual input for the study. CTC participated in the overall design and coordination of the study and helped to write the manuscript. All authors have read and approved the final manuscript”(Neural Develop 3: 26)。”
大家特别要注意提供材料的人的挂名问题,所提供的材料必须是本人制作的(manufactured),不能是他人制作的再转送给你。这两者是有本质区别的,现在有很多不合理的挂名行为,比如提供了一个鼠,而这个鼠又不是他本人制作的,也要求挂名。过去论文只有一两个作者的时候,文章的贡献比较容易鉴别,现在很多作者的情况下,作者的贡献必须写清楚。如果不写清楚,也许同行的人,熟悉该项工作的人是知道每个作者的具体贡献。但是不了解情况的人,也许会认为某些挂名的人为论文做了相当大的贡献。现在甚至有些人明明没有什么贡献,别人只提供了部分材料(如小鼠),也要求担任共同通讯作者。如果按照下述的作者贡献的要求,这是极不合理的。
那么究竟谁可以被列为作者呢?国际医学期刊主编委员会(International Committee of Medical Journal Editors)曾经讨论并制订出了以下的标准:“作者必须对本文章在以下各方面有过相当的贡献:研究的初始想法和设计,数据的采集、分析、和解释,文章书写或修订时有实质内容的贡献,并同意最终所发表文章的内容”。新英格兰医学杂志(New England Journal of Medicine)的编辑Arnold Relman也曾经明确地列出了共同作者的责任:“(1)任何同意列名为作者的人都担起主要的责任, 应能随时公开为该文辩护,因此必须对该文的可靠性应有信心。(2)给予或接受共同作者的原因不能只是为了报偿该作者提供了资源或资助了一位主要完成工作的人员。(3)只要是共同作者,必须对所有的内容负责,不可以只对部分内容负责。”因此,如果论文出现了错误,不可以推托自己只参与了部分研究工作,是别人的实验出现错误。共同作者应共享论文带来的荣耀,同时也共同承担错误的责任。共同作者也必须对论文有信心。曾经出现过有外面的人员到神经所的实验室做实验,使用了实验室的设备,愿意将实验室的几位研究人员挂名为作者,这些人没有拒绝。结果论文最后被人指出有造假行为,神经所的研究人员受到牵连。所以今后如果有人在你的实验室做实验,如果你对他的数据没有信心,你没有参与工作,你就不应该挂名为共同作者。另外,你不能因为提供了设备甚至资助了完成工作的人员就挂名,更不能把挂名作为一个“礼物”。所有的医学期刊都认为共同作者的署名应该遵守上述的原则,其实生物学期刊也是一样。虽然他们没有讨论制定统一的标准,但是如果你去问他们,他们会叫你遵循相同的规则。
五.怎样算是剽窃?
抄袭别人的成果作为自己的工作发表是最严重的剽窃行为。这种情况很容易被发现。很多论文的撤回(retraction),重大的学术不端行为都是这种情况。另一种剽窃是一字不差地(整句或整段)复制别人的文字而没有注明出处。这种文字剽窃的程度不尽相同,有的情节很严重,有的相对不严重,但依然被认定为剽窃。比如一字不差的抄袭别人的实验方法(methods)或者引言(introduction)。有的学生解释说因为英文的写作能力差,想学习别人的写作。我认为学习是可以,但是要改写(paraphrase),可以用类似的词或者类似的语法来学习别人的写作方法。千万不能一字不差的抄袭,特别是实验方法,这会被认定为文字剽窃。除了剽窃别人的,还有自我剽窃。有些发表的论文,重复使用实验室已经发表过的实验方法文字,或者把已经发表过的文字穿插在新的论文中。甚至还有数据的自我剽窃,比如以前的论文已经发表了的数据里加入新的数据,作为新的结果来发表。
总结一下文字剽窃的规则,如果你的论文中有超过整段的文字,包括引言、材料、方法等等,已经在其他论文中出现过,那么将会被定义为剽窃。更严格的标准是超过7个字一模一样的连续出现,就被认定为剽窃。如果你必需再次使用自己已发表文章中相当长的一部分(如实验方法),你必须清楚地写明你是在引用以前的文章。有些期刊已设有筛检剽窃的工具(如Crosscheck)可迅速筛检已发表论文与送审论文之间的相同文句(http://www.crossref.org/crosscheck.html)。使用Crosscheck的期刊,编辑在收到网上投稿的论文以后,在送审之前先会发送到Crosscheck进行在线筛选,看是否已有类似的文字发表过。所以在文章撰写中一定要注意文字剽窃的问题,避免收到无谓的指责。
最后,我要谈谈我认为科学界最严重的灰色地带剽窃行为,就是偷取别人的想法、方法、结果,或复制别人的实验或发现,作为自己的成果发表而没有适当地提到别人的工作。比如有位来访的同行学者,参加了实验室的组会或通过与实验室人员的交谈,了解到了某些研究结果的信息,回去以后从事相同的工作,而且完全不告知被访的实验室,并抢在该实验室之前先发表了同样的结果。你控诉他不诚信时,他还可振振有词的说:“我一直有同样的想法,也在做同样的工作,只是没先说出来而已”。你自己愿意告诉他你的研究结果,没有法定约束他一定得告诉你他在做什么。虽然他可以为自己辩护,但在科学上这就是一种不诚信。有的人认为只要别人没有发表,就是在进行科学竞争。如果科学研究都沦落到必需使用不诚信的手段进行竞争,这将是科学走下坡路的征兆。
六、科学交流与科学竞争
下面我要特别来讲和科研诚信直接有关的科学交流与科学竞争的问题。我会列举几种观点,做一个简单的民意调查,然后再谈谈我的看法。
1. 明知别人的工作结果,只要他们还没有发表,我可以抢先发表?(少数听众同意此观点)
除了上述的同行来访的例子。通过交流听到别人未发表的信息,回去后靠所得到的讯息做出同样的结果,并抢先发表。为什么在未发表前人家愿意告诉你呢?一方面是为了要与你交流听听你的意见,另一方面也是告诉你,他已经首先有了这个发现。你如果得到了信息后,在短时间内抢先发表,这种做法就是灰色地带的不端行为。说是灰色地带,因为你可以说我原来就在做这个工作,是独立的发现,没有人有确切的证据说你在说谎。还有人认为这就是科学竞争。没有发表的成果就没有优先发现的正式认可,但是我不同意这种观点。科学界对公平竞争还是有不成文的规矩的,对科学家的诚信标准还是有共识的。刚才我们投票的结果就说明我们大多数在座的是认为如果明知别人已得到的结果,自己照着做,抢先发表是不对的。假如一个科学家不断地做这种事情,那么科学界终将判定他是一个没有诚信的科学家,他是不会受人尊敬的,他在这个科学领域也是不会有发展的,这是他得到的恶果。当然还是会有人为了出一两篇重要论文,完全不顾这种后果。
2. 为了科学竞争,没有发表的结果不要告诉别人?(更多的听众赞成此观点,但赞同的人未过半数)
目前科学界已经出现了科学交流与科学竞争之间的矛盾。但是科学世界中最有可贵的内容就是科学交流,做科学家的乐趣很大成分是源于科学交流。什么是交流?你把没有发表的内容,不成熟的想法告诉别人,别人给你反馈,然后你再进一步改善自己的想法。反过来说,你也从别人那里得知最新的未发表的讯息。交流已发表的成果这种效果就小得多。交流未发表的结果,有可能成果被人抢走,上面我已举了例子。我认为一个态度开放,愿意同别人交流自己没有发表结果的学者,虽然偶尔可能被别人抢了研究成果,但是他长远上的收获是大于他偶然遇到几次的损失。我从事了40年的研究,我也曾遇到自己的成果被别人抢走,但我还是愿意告诉别人我的想法,未发表的成果。我坚信作为一个长期在科学界工作的人,开放交流的态度可能会让你偶尔吃些小亏(也许偶尔吃次大亏),但从长远来讲,利大于弊。
再举例来说,为什么我们要去参加美国的神经科学年会?成千上万个墙报都是没有发表的工作。很多墙报前都聚集了一群感兴趣的同行,给你建议或批评, 你能得到很多反馈,可以在未发表前提高你的工作水平。当然也可能有人偷偷地看了你的墙报,回去做实验抢你的成果,但是给你建议的同行远远要比只偷看你墙报的人多。正因为交流未发表的研究工作有好处,所以才会有上万人愿意展示他们未发表的工作。
从另一个角度讲,公开介绍未发表的工作也是告诉大家,我已经先有此发现,请不用再做同样的工作了。但是大部分学者知道了以后,会认为这方面工作已经有人做了,不会去花功夫重复你的工作。但如果你的发现是极为重要的,一定会有些人赶着去重复。一方面,他们不一定相信你的结果,另一方面他们也想捷足先登。这也没有什么不对的,但有诚信的做法是他应该告诉你,他对此问题也有兴趣,已经在或者将会去研究这个问题。如果双方大致在同时完成工作,可一起发表论文。我们常常在同一期杂志上看到唱双簧的两篇back-to-back的文章,多半是这么来的,而不是碰巧两个实验室同时独立完成同样的工作。这种有交流又有竞争的科研是件好事,因为两个实验室的做法不见得完全一样,总体结果的可信度也更高。总体上来说,科学交流与科学竞争并不一定是有矛盾的,只要大家以诚信的态度交流,以公平的方式竞争。
3. 为了知识产权,不要把自己的好想法告诉别人(有许多听众赞成此观点,赞同的人近半数)
有人说我有一个很特好的想法,想到了一个特妙的实验,不能告诉别人,因为我有知识产权(intellectual property),要先保密。虽然科学史上有牛顿和莱布尼茨关于谁发明微积分之争,但是知识产权不是科学界的概念。所有的科学想法都不是凭空而来,即使是爱因斯坦的时空不变性理论,李政道和杨振宁的弱作用中宇称不守恒理论。这些有创新性的想法,其实也是建立在别人的基础之上。比如时空不变性理论是建筑在Lorentz 和 Maxwell的场论之上;宇称不守恒的可能性也曾经有其他人提过,只不过没有人像李杨那样完整地描述这个概念并提出可检测的实验。所以我认为,所谓的科学想法,不是凭空出现的,而是被别人的想法或知识触发的,根本不应该有什么知识产权的概念。知识产权是科学商业化、工程产品商业化所衍生的产物。如果我们在科学界把科学想法也赋予知识产权,科学家终将沦为商人,科学界将沦为全球商业世界的一部分。
七、科学工作者对社会的责任
科学的目标就是追求真理,而诚信是追求真理的必要条件。这种诚信不单单是黑白分明的诚信,还包括灰色地带的诚信。科学界应最不能容忍各种不诚信行为,包括浮夸、欺骗行为。为什么要特别注意灰色地带的问题?就是因为在灰色地带的不诚信行为,最终将累积而成极端的恶果。再举一例,似是而非地浮夸自己的科技成果或浮夸自己将要获得的成果,不能仅仅看作是获取科研支助时不可避免的公关手段。有位认识干细胞造假事件主角黄禹锡的韩国同行朋友曾经告诉我,大家都知道黄禹锡一向喜欢夸张报导他的成果,大家都也一直容忍他的做法,以为这只是他的个人作风,是为他自己甚至为大家争取科研经费的公关行为。但是黄禹锡从浮夸到实际造假,不过一步之差。我们发表了一篇高档期刊的论文,就向媒体宣称在某领域有重大突破,为治疗某某疾病找到了治疗靶点。这种长期对社会大众的浮夸,已造成社会是对科学家信心的下降。科学工作者应是维护社会诚信的主力。如果连科学界都不讲诚信,怎能要求社会大众讲诚信?为建立诚信的社会,科学工作者必需从自己做起,从小事做起。是非分明,实事求是,严守诚信的标准。自己讲诚信,再进一步影响别人。
八、中国科学家对世界的贡献
我从事了四十多年的科学研究工作,遇见过海内外各式各样的“科学家”,也看到了海内外科学界的各种现象。我一直在思考中国科学家、在座各位科研工作者将来对世界会有什么贡献?今天在座的同学很多人将来都要出国,有好几位马上就要离去。你们出去学什么?如果出去以后只是学到一套不诚信的做法,学会了不公平的竞争方式,那就不合学科学的初衷了。
1.比较西方科学家和中国知识份子的传统
谈到中国科学家对科学界可能有的贡献,我想先比较一下西方科学家的传统和中国知识分子的传统。我们现在看到的西方科学家,都是以自我为中心,追求个人的科学兴趣和个人的成就,这是西方科学家的传统。而中国知识分子的传统是完全不同的。传统的中国知识分子不是以自我为中心的,更常见的是一种忘我精神和对社会的关怀。西方的科学家努力的最高的目标常常就是获得诺贝尔奖,因为那是科学成就的最高体现。但是,科学家对社会的贡献不是只从个人成就来判定的,只顾个人成就甚至有很多负面的影响。我所知的有个别诺贝尔奖得主是在不公平竞争下,甚至于是践踏其他科学家的基础上获奖的。我们的社会并不需要这样的科学家。西方科学家的传统和中国知识分子的传统似乎是不相容的,社会目前需要的是在追求个人兴趣和成就的西方个人主义之中注入中国知识分子的关怀社会的精神。
2. 什么是科学界的大师?
媒体经常会提到“钱学森之问”,最近也有记者在采访时问我,现在中国科学界为什么缺少大师?我们怎样才可以培养出新一代的大师?我反问他,你说的的大师是什么样的大师?是个人成就很高,发表高档论文无数,得过国际大奖的科学家?但是我们中国曾经出现过的大师,比如教育界的蔡元培,建筑学的梁思成,气象学的竺可桢等等可不是这样的。以竺可桢的能力,他完全可以做出世界一流的学术成就,但他却在学术生命最旺盛的时候,奔波中国各地用最简单的仪器设备建设气象站,后来觉得办教育比建气象站重要,就到浙江大学去做校长。像这样的大师们是个人学术成就最高,发表的顶尖论文最多吗?我认为不是。更近一辈的还有数学家华罗庚、力学家钱学森、生理学家张香桐、生化学家王应睐等等,他们是当之无愧的大师,但不是因为他们个人的学术成就最高,而是因为他们影响了一大批科学家,带领了一批从事科研工作的人,做出了重要的成果,这才是我们心中大师的标准。他们所做的科学事业的是对社会最有用的,这才是我们社会需要的大师。我想,只有先明白什么样的人算是大师,才有可能培养出我们需要的大师。
3.什么是科学界的大牛?
除了大师以外,近十年来还出现了“大牛”一词。我经常会听到学生说,“XXX来做报告,他是大牛,一定要去听他的报告”。我每次听到“大牛”这个词,脑海中就会浮现出牛的画面。我脑海中出现的大牛形象有西方斗牛场中那种横冲直撞、伤人为上的公牛(bull),还有我小时候在南方水田里看见的水牛(buffalo),那些在田里举步维艰的拖着耕犁,勤恳耕耘的水牛。我们现在科学界有太多像公牛一样的所谓“大牛”,许多横行霸道的bully,为了达到目的而不择手段的大牛。我希望各位同学不要去学那些以自我为中心的横行霸道的公牛,要学“俯首甘为孺子牛”的水牛。
4.现代社会需要的科学家
现在世界上的迫切需要解决的问题太多了?D?D 环境问题,健康问题,粮食问题,人口问题等等,都需要科学家去帮助解决。我们现在的社会已经允许有追求个人兴趣和个人成就的科学家,但是我们更需要的是有忘我精神和关怀社会的科学家。我们神经所也是如此,可以允许自由探索,追求个人成就,但是我们更需要在此基础之上,有继承和发扬中国传统知识分子精神的科研工作者。
中国科学界可能对世界科学的贡献,不只是有大批科学家在国际刊物上发表大批论文,得多少个诺贝尔奖,而是能把中国传统知识分子的忘我精神和社会关怀注入科学界,及早解决世界上各种迫切需要解决的问题,这将是中国科学家对世界科学界独特的贡献。
我今天就讲到这里,谢谢大家!