過去的這個春天不太平,「新冠」病毒肆虐,引發全球瘟疫,嚴重影響人們的生活秩序,有效的藥物和疫苗開發擺在全世界面前。新藥或是疫苗到底有無作用,如何評價?科學評價藥物藥效的試驗方法制定最為關鍵,雙盲實驗在此期間發揮了關鍵作用。
「盲」在試驗中是一種基本的思路,用以在試驗中排除參與者的有意識的或者下意識的個人偏愛。比如,在非盲試驗中檢驗受試者對不同品牌食品的偏愛,受試者往往選擇他們偏愛的食品,但是在盲試驗中,即品牌不能被辨認的情況下,受試者可以真正排除個人品牌偏好而進行試驗。
單盲試驗指的是這種試驗:在試驗中可能引起個人偏好或者使試驗結果發生偏差的信息不向試驗的參與者(participant)提供,而試驗的試驗者(experimenter)卻完全掌握關於試驗的所有信息。單盲試驗在心理學和社會科學研究中具有風險,因為試驗者對結果的預期可能會有意識或者下意識地影響參與者而造成偏差。
雙盲試驗是一種更加嚴格的試驗方法,通常適用於以人為研究對象的試驗(human subjects),旨在消除可能出現試驗者和參與者意識當中的主觀偏差(subjective bias)和個人偏好(personal preferences)。在大多數情況下,雙盲試驗要求達到非常高的科學嚴格程度。
在雙盲試驗中,試驗者和參與者都不知道哪些參與者屬於對照組(control group)、哪些屬於試驗組(experimental group)。只有在所有數據被記錄完畢之後(在有些情況下是分析完畢之後),試驗者才能知道那些參與者是哪些組的。
三盲法是雙盲法的擴展,即受試對象、研究人員和資料分析人員均不知道受試對象的分組和處理情況。這種方法在理論上可以減少資料分析上的偏差,但在分析時減弱了對整個研究工作的全局了解,對研究的安全性要求較高,在執行時也較嚴密,難度較大。
「盲」實驗方法不僅在醫學中發揮巨大作用,在各行各業都不可或缺。
有位外加劑方面的專家,在外加劑廠任總工。有次參與某工程的外加劑入圍競標,審查資質、業績、註冊資本金、生產規模、廠房設備、人員等通過後,送樣品到指定檢測單位進行檢測,結果送樣指標不合格,他感覺蹊蹺,因為與以前自己做的檢測差異很大,仔細研究入圍廠家,發現基本都是與這個檢測機構有關聯的單位,其餘廠家概不合格。他拿了這個機構本身企業的「合格」產品,換了包裝,全程做了記錄,留下證據,沒寫廠家名再次送檢。檢測結果可想而知,不合格!他拿了報告和證據,給到有關部門,揭穿了把戲!
這種事不是孤例。南方某地,也是一個混凝土結構工程出了質量問題,施工方懷疑水泥出了問題,將樣品送往當地一家檢測機構檢測,測量結果三氧化硫嚴重超標,這能解釋工程出現的質量問題。因為當地檢測機構資質低,重新送樣到某權威檢測機構,結果水泥各項指標均合格,施工方懷疑這裡面有問題,重新送樣,不寫明廠家品牌,結果與地方的檢測結果基本一致,還是不合格。問題很明顯了,檢測環節出了人為幹擾問題,後來了解到這家機構與水泥廠關係密切。
以上的兩個例子,要說明的是真值很重要,要得到真實信息,必須去除幹擾因素,不管是主管因素的幹擾還是客觀因素的幹擾,否則得到的數據也不具備參考價值。
一些建設工程,利益的誘惑往往是工程質量的禍根。為避免人為因素的幹擾,借鑑雙盲實驗的方法進行材料選取。比如,各個廠家的材料隨機分成A、B、C、D、E、F組......,交由評審專家組,專家組掌握著對應的廠家與編號,建設管理單位和檢測單位一概不知,等拿到檢測結果,一併公示,心明眼亮,最大限度的避免人為操作的可能。再進一步,檢測單位也不止一家,也處於保密狀態,A、B、C、D、E、F組各個樣品送到哪一家也是隨機的,這樣的數據真實性就更強。
上邊的例子是要避免主觀因素的幹擾,客觀因素的幹擾也必須引起足夠的重視。山東某家攪拌站給我電話,說出現了一個百思不得其解而且可怕的現象:混凝土7d的強度比以前低很多,60%多一點,以前都在85%以上。我們都知道,混凝土的強度都已28d強度為設計依據,但因為一個月的時間,混凝土試塊強度檢測肯定滯後的,為了儘早了解可能的的強度,往往以3d或7d強度來推測,當然7d更具參考價值,如果達到了預期值,那麼基本推定28d可以滿足要求。但現在7d不夠,攪拌站很害怕,一旦28d強度值差很多,將損失慘重。因為在此之前,我處理過混凝土強度差的問題,也就按以前的經驗,直接問了幾個問題:第一,原材料有無大的變化;第二,攪拌工藝有無變化;第三,試模有無變形。我刻意讓他們重點測試一下使用的試模,結果都沒有問題,材料和攪拌工藝基本都無變化,在此情況下,我一時也有點陷入盲區,但很快藉助邏輯分析手段找到原因。
任何產品的生產或製作都可以用邏輯圖(圖1)表示。對混凝土而言,輸入就是各種原材料,中間處理過程就是攪拌時間、下料順序,輸出就是混凝土拌合物,自然,生產過程受到環境的影響。自然,如果輸入是穩定的,中間處理過程是穩定的,環境是穩定的,輸出肯定是穩定的。反過來,如果輸出發生了變化,前面至少有一項發生了變化。順此思路,我問何時在哪製作的試塊?結果發現在製作試塊那幾天正好來了寒流,當時的溫度5℃-15℃,是在實驗室成型的試塊。癥結找到了,由於實驗室沒有空調,做出試塊放了兩天,拆模後放標養室,成熟度不夠,7d強度肯定不足。
圖1 產品製作邏輯圖
按標準規定,混凝土試塊成型室溫度 20±5℃ ,溼度≥50%;混凝土標養室的環境要求溫度是20℃±2℃,溼度95%以上。我建議他們成型後直接放標養室,一天後拆模,結果7d強度都回歸以前狀態。
也就是說要想得到真實的數值,除了主觀因素的幹擾,客觀環境的幹擾因素也必須排除,否則得到的數據就是假的,也會干擾判斷。