最近韓國納米材料大牛李永熙(Young Hee Lee)教授只怕有點頭疼。
今年 7 月李教授課題組發表的Nature Nanotechnology論文中,拉曼數據和透射電鏡選區電子衍射數據涉嫌造假。
李教授為韓國科學院院士、ACS Nano 副主編,是國際納米材料領域的頂級科學家,還是韓國的國家學者(National Scholars)之一。如此重量級的科學家涉嫌論文作假,不知道這是不是又一次黃禹錫事件。
當然,學術圈打假的門檻比較高。如果不是事主承認,學術不端往往不是三言兩語就能蓋棺定論的。
因為各種原因導致發表的論文有瑕疵,這是很正常的情況。
不少人總想製造大新聞,聽風就是雨,很容易把節奏帶壞。今天我來自爆家醜,說說我所碰到的幾件遊走在學術不端邊界的灰色事件。
為發表論文而被修飾的產率
要說令人頭禿,科研人一定首選寫論文。在薅頭髮比薅羊毛還迅速的日子裡,論文撰寫一度是科研人的「噩夢」。
只有在對著電腦枯坐,一天寫下不足兩百個單詞的時候,科研人們才會覺得,那些實驗中的屢敗屢戰全都是小兒科。
歸根到底,這種不如意還是來自實驗數據沒有足夠好。
「當時只道是尋常」,沒日沒夜熬出來的實驗數據,在寫論文的時候才被發現竟然略有差池;「只是當時已惘然」,已經開始寫論文,數據即便有瑕疵,也是「箭在弦上不得不發」了。
好巧不巧,這種經歷恰好在我撰寫博士期間第一篇論文的時候,就真真實實被印證了。
我博士期間主修有機化學和化學生物學,在艱難完成一個天然產物的化學合成後,我開始著手撰寫論文。論文寫好後,導師說其中一步產率有點低,只有 40 多。
他想讓我多重複幾遍,怎麼也優化到 60 以上,才能勉強算是 modest yield。
剛好那時我手頭還有點原料,就花了兩周多的時間不斷重複再重複。很不幸,產率始終上不去,最高還是 49。分析下來,這個結果也僅僅是熟練度帶來的產率微弱提升。
眼看手裡的原料要用光,我開始了一次足以改變人生的思辨。
本來吧,能發論文是挺高興的事情,在項目完成的大前提下,因為一個數據增加過多工作量,本質上是得不償失的。刨去時間成本不說,科研人也和打工人一樣,最忌諱的就是從導師口袋裡掏錢,遑論我還未必能搞定,將來搞不好還要面對導師那張飽經數據摧殘的老臉。
想通此中關節,我頓時豁然開朗。為了快點搞定論文,我在最後一次實驗中,假裝無意地縮短烘乾時間,把產率好歹做到 54。報告給導師後,再稍稍 make up 一下,變成了 58。
我當時的感覺是,又回到大學裡面的公共課考試,即便考 40 多分,授課老師也拼命往 60 分拉。
有時候,寫論文就跟嫁閨女一樣,大家一起努力,爭取在最短的時間內促成此事,免不了動點小心思。
反正數據未見報導,究竟什麼樣子,這個地球上只有學生本人說了算。端的是「天知地知我知」,所以不排除有些學生會鋌而走險了。
回想這段不光彩的心路,一次次地重複實驗,不是因為求真和執著,而是一種黔驢技窮後的掙扎,我頗有些心酸和無奈。
儘管如此,今天依舊能夠坦然講起這件事,恐怕還是學術界論及這種對數據小小的 make up 早已司空見慣,所以如果讀者想黑我,也請手下留情。
不慎解錯的單晶
小小不言地修改數據這種事情,肯定是不光彩的,即便無傷大雅也是道德汙點,當事人自黑起來也有那麼一絲調侃的成分。但某些學術成果經不起調侃,外界也不允許此類調侃發生。
接下來說的這件事,絕對是無心之失,但造成的後果反而比對個別數據的 make up 還要嚴重。
我最早的專業是晶體化學,主要做些稀奇古怪的金屬配合物單晶。組裡有位兄,大三就進組,後面本科畢設直至博士,在組裡呆了七年。論資排輩的話,師兄位列前茅是不必說的;就脾性來說,師兄也是組裡難得的好脾氣;做事又是極其認真負責,學術能力也是組裡的 TOP 級人物;所以,他是導師最器重的弟子。
就在我進組後不久,師兄發表了一篇很優秀的論文,迄今為止,在我們實驗室發展歷史上都有著重大的意義。
論文的 IF 雖然不算頂級高,但期刊是本領域中非常有 credit 的一流雜誌,並且當時還是組裡發的最好論文。整篇論文從最初 idea 的產生,到設計實驗,發表論文,都是在本組完成的。
以碩導的學術履歷而言,這篇論文不但擺脫導師博士期間工作的延續,而且還是在不接受任何外組幫助下獨立完成的,確實非常難能可貴。
然而幾個月後,導師接到編輯部回饋的信件,很委婉地說是有讀者寫信給編輯,認為我們給出的一個單晶結構可能解錯了。具體地,讀者認為晶體中應該有三個金屬核心,而我們給的是一個單核結構。
咱們都知道,單晶解析實際上收集到的是一些重核的點陣,也就是原子的位置。這個位置上到底是什麼原子,則需要根據反應可能的產物來猜測。當然,我們還有其他的檢測手段做輔助,幫我們猜得更準一點。
組裡的單晶一直是師兄做解析,從來沒出過錯,怎麼解自己單晶會出問題呢?而且按照以往的經驗,組裡在設計反應的時候,從來都指向一個金屬的產物,得到的晶體絕大多數也是單核的。我們這幫傻不愣登的小弟都很信任師兄,覺得是讀者搞錯了。
出於對自己學術聲譽的珍惜,導師把質疑看得很重,讓師兄重新解單晶。因為單晶怕水怕氧,保留重測的數據並不太好。導師就讓師兄把項目重做一遍,而且每一步都必須扎紮實實。師兄自己也挺慌,帶著一個師妹沒白沒黑地開始重新做實驗,導師也一天好幾遍地來問。小師妹哪裡經歷過這個,一周之內哭了三鼻子,最後好歹把高質量的單晶拿到了。
我們組以最快的速度測完晶體,重新解析,自己解完後還找了福建物構所專門解單晶的高手行家請教。最後發現,的確是我們解錯了。
導師回信承認了錯誤,也很誠懇地建議可以撤回論文。幸運的是,編輯部非常慷慨,認為這個瑕疵不影響論文的整體工作和結論,而且並不涉及到學術造假,所以只是在雜誌上發了條 correction/addition,事情就這麼解決了。
師兄畢業後,導師還經常拿這個事情舉例,告誡學生做實驗一定需考慮周全,無論是前期的數據收集還是後期的數據處理,都得一絲不苟,考慮到儘可能多的情況。
話雖如此,可學生們的水平總有限,水平高的也難免疏忽,出現錯誤真是在所難免的。
畢業後我有次跟師兄吃飯說起這事兒,師兄竟然說自己運氣好,原話是:還好解錯的是我自己的單晶,不然……
瞧,這麼好心的人,斷然不可能學術造假。然而發表的論文裡,卻的確存在錯誤,還被細心的讀者逮著了。
您說,這事兒找誰說理去?
故意無視的意外
以單晶解析來說,只有一種結構是正確的。解錯的話,一定會出現跳脫的數據。
我後來琢磨著,師兄大概是在解單晶的時候有意無意地忽略了幾個關鍵的跳脫數據,所以才搞出上面有驚無險的一次意外。
相比較而言,還有一些意外就更多了。實驗中總會遇到很多跳脫的數據,拿到各種意料之外的結果。
絕大多數時候,我們沒有時間和精力來進行解釋。因為這種解釋往往意味著延伸出更多的實驗,而在這些延伸出的實驗中,肯定還會再次出現意料之外的結果,一環套一環。
我們總在解決問題的時候發現新的問題,於是問題越來越多,就像愚公說的那樣「子子孫孫,無窮匱也!」
我博士期間進行過很短暫的多肽合成,雖然有理論上那麼完美的固相合成技術,但總有些胺基酸就是上不去。我們知道那麼多胺基酸連不上的原因,在設計反應的時候盡力迴避,但真的到了連不上的時候,也沒人能說出個所以然。
類似的,一條多肽有時並不是直接用固相合成法就能搞定的,需要先合成兩條短肽,再通過自然化學連接得到。這類連接反應的模版很多。具體到目標多肽,根據不同的模版反應,理論上可以選擇不同的連接位點,對應兩段不同的短肽。
比如一段 60 個胺基酸的多肽,到底是用 20+40 還是 30+30,這是很考驗學術直覺的事情。經常會碰到容易連上的位點,也有怎麼都連不起來的。
當然,這些問題確實有人研究過,也能查到文獻,但當面對一條新的多肽合成路線時,常常很難給出完美的解釋,也不太可能驗證。
多數時候給出的解釋是:序列決定的(depends on it’s sequence)。很顯然,這個解釋非常牽強,約等於什麼都沒說!
面對這樣的意外,更多的情況則是選擇性遺忘。偶爾一次備料做壞了,其實無傷大雅,再來一輪,能順利做過去就行了。連接位點選錯也沒關係,重新選一個,發論文的時候只說自己搞定的,對自己沒有連成功的位點提也不提。
只要最後做成了,之前的失敗可以全都忘掉,反正也沒有時間搞清楚。
這些說不清的結果,絕大多數沒有體現在論文裡,可能有一小部分會在畢業論文中提一句,不然那些失敗的實驗,沒辦法體現出工作量嘛~
但提歸提,給定論是不可能,隨便寫一個大家都能接受的、可能的解釋就好。同樣的,「天知地知我知」,沒人追究的。
從某種意義上說,這種偶然闖入的「小意外」裡有一定概率蘊藏著革命性的發現,科技史上這類例子不少。很多理想主義的研究人員也認為這些意料之外的結果才是科學研究的精髓。
但如果每個博士生都抱定把所有碰到的「小意外」都弄明白的信念來做研究的話,恐怕一輩子都讀不完博士。
所以,對某些跳脫的意外視而不見,是博士生們「自保」的方式之一。
理想很豐滿,現實很骨感。實驗中碰到的情況,遠比用軟體寫下的方程式和機理更加複雜,也比簡單幾下 PS 更難。
回到最初學術不端的問題,相信任何有過足夠實驗室經驗的人,大概都會認為這是個灰色地帶。
最終的認定,也需要非常專業的人士來評估。所以,面對那些新聞,我們還是應該保持清醒的頭腦,不跟風,不盲從,讓新聞飛一會兒。