用的治療方法越多,癌症病人活得越長?手術會增加癌症轉移風險?這些錯誤觀點是怎麼來的
筆者的主業是腫瘤登記,是諸多疾病監測中的一種,經常被稱呼為「搞統計的」,如今的調侃已升格為「搞大數據的」。
「搞統計的」這個稱呼實在是愧不敢當,因為統計太難搞了,比搞對象還難,至於「大數據」更是連門也沒摸到。
如果遇到還知道點的西貝行家,就會補刀問一句:SAS玩得挺溜?
筆者當然是連連搖頭的命。
一般情況下,對方就會接下來再來一刀:那平時用SPSS?
因怕中刀太深,就會連忙答應下來:會點簡單應用~簡單應用~,主要還是Excel~Excel~
至於本人究竟用哪些統計軟體,其實並不重要。
作為一名統計工作者,最重要的還是要對基本概念和基本理論熟悉和掌握。
尤其是在目前的工作環境下,流行病學和統計學沒有形成明確的分工,大多數需要一肩挑,那麼對於流行病學的基本概念和基本原理的掌握可能要比掌握一門統計軟體更為重要。
否則,對於統計結果的解釋,會產生偏差甚至謬誤。
一
先講個段子是「黑」統計師的。
傳說搞統計的人,生命力特彆強。
舉例為證,一群各種職業都有的探險愛好者,組團徒步穿越撒哈拉大沙漠,不巧就遭遇沙塵暴了。
救援隊收到受困求救的信號後,即刻出發搜索,但直到7天後才找尋到目標,結果辣么多人里就一個搞統計的人還奄奄一息的活著。
科學家們就研究了,最後的結論就是:搞統計的水分就是多。
所以還有一句話,常聽人調侃,說統計是個Game,搞統計就是玩數據。
要問筆者有沒有玩過呢?的確也玩過一次。
曾有小夥伴拿著一堆統計結果全是陰性的數據來商量對策。所謂陰性就是因素之間的不同,造成結局的差異都沒有統計學意義,即常說的不是P
其實統計老師一再強調:陰性結果也是結果。
但實際上在做研究設計時,總歸會提出有差異的假設,並希望得到印證,否則很難展開深入的討論。
縱觀這批數據後,發現還真有門。
怎麼發現的呢?並不是小夥伴後來盛讚的「有數據敏感性」。
而是之前就流傳有「臨界P值」的說法。比如P=0.05,或者在0.05附近,一般不超過0.10,可以想辦法調教出有統計學意義來。
首先聲明,這種說法是極端錯誤的,是為專業統計師所不齒的。
但是,那次嘗試將幾個處於「臨界P值」狀態的因素,由n組重新均分為n+1組,比如3組重新分為4組,結果就P
這種投機取巧,講究的就是要碰巧。可不是所有的變數都能這樣做,P值就會變小,其實變大的也多了去。
二
大多數情況,小夥伴們是拿著欣喜的統計結果來複核的,結果被本人無情的打擊。
臨床上的朋友好像特別喜歡用直線回歸法,通常是1個因素對應1種結局,畫出個散點圖,同時點擊統計軟體的畫出「擬合線」的功能。
筆者印象特別深刻的是位醫生美眉,研究治療前紅細胞數量和某癌病人無病生存期的關聯。
這當然不能用線性回歸的方法,而得用生存分析。
結果就是沒有結果,治療前貧血和不貧血,在治療後沒有差異,而且不管怎麼將紅細胞數量分組都不見差異。
美眉很是失望,一直念叨著自己原來那條擬合線很直很漂亮的,咋就會沒有差異呢。
我說妹妹啊,你選這個軟體的功能,就是要畫出條直線來呀。若是不直,那才奇怪呢。
三
科學研究是最容易被表象所蒙蔽雙眼的,統計結果往往都只是幻象,一些先入為主的主觀意願很可能被錯誤的解釋為原因。
再回到撒哈拉大沙漠,又有一批人冒險徒步穿越了,這次職業不再是因素。
這次救援隊又晚到了好幾步,不過這回探險團中還活著2個人。
他們不是統計師,只是1對情侶。他們被發現時是面對面擁抱在一起的,而且是臉貼著臉做著熱吻狀。
好事的記者拍下了一張經典的照片,寫出了「愛情的力量」的評論員文章,也算火了一把。若是有朋友圈,肯定10萬+。
一時大家都紛紛表示又相信愛情了,還說意志力是有作用的等等。
偏偏嚴謹呆板的科學家最不羅曼蒂克了,很快解開了真相。
他們認為,的確是臉貼著臉做熱吻狀的姿勢救了2人,但絕對不是愛情的力量,而是這樣鼻子對著鼻子的呼吸,可以將各自呼出的水氣,互相的被對方吸回「利用」,從而減緩了2人的水分丟失。
所以,即便是2個大老爺們,如果能醬紫也能活得長,畫面稍顯重口味又有什麼好怕的。
四
這種表象誤導,筆者也有經歷。
那年媒體炒作「過度治療」比較多,有專家就找上門來,希望能夠給出個權威說法,予以批駁。可見研究假設帶有極端的傾向性。
方法是利用腫瘤登記中隨訪信息收集到的治療手段變數做為生存分析的因素,治療手段用的越多,生存結局是好還是孬呢?
筆者當時也覺得這是個好主意,而且做起來也方便。統計結果還真得非常「理想」,多的和少的差異十分顯著。
出idea的專家也很開心,已經將結果做成PPT準備參會獻演了。
筆者突然醒悟了,連忙電話阻止,避免了專家的此次「現眼」。
這個研究存在的謬誤是因果次序倒置,表面上是治療手段越多,生存期越長,但也有可能是因為生存期長了,所以有時間和精力接受更多的治療手段。應該是互為因果的關係。
另一方面,由於治療手段部分的信息,是通過社區隨訪調查獲得的,而不是診療機構報告的。因此存在時間差和信息差。
尤其是生存期越短的病例,社區成功隨訪到的幾率就越小,那麼能調查到的治療手段信息也就越少了。
五
這次雖然阻止及時,但專家並不領情。後來TA給自己的團隊專門招聘了一名統計師,學歷背景還挺高,結果卻是「出師未捷」丟了人。
這回折騰的是專家自家收集的數據,有關手術和生存結局的,結論是做過手術的比沒做過手術的生存期長。
由於因素和結局單一,所以整體研究就顯得單薄,因此又增加了一個「癌症是否轉移」的中間指標。
於是就得出來一個堂而皇之,令人乍舌的結論:做過手術的比沒做過手術的,癌症更容易轉移。
這下好,參會聽講的觀眾全都炸鍋了。用腦子想一想,如果真是這樣,那還給癌症病人開什麼刀呀?
專家還在那裡搗鼓可能性的理由:什麼有可能是普遍存在開不幹凈的情況,手術刀划來划去會引起種植轉移等等。
其實是什麼呢?筆者的理解是:沒做手術的很可能原發灶就致死了,生存期本來就短,壓根沒有條件和時間發生轉移嘛。而對於前一個結果,也不能下定論,極有可能是做手術相比沒做手術的,身體素質和家庭條件等基礎水平就好呢,唯有控制變數才能得出結論。
所以,統計有風險,解讀需謹慎!
本文是春曉醫生參與腫瘤登記項目的心得體會,所有文字僅代表個人觀點,用於分享交流。
歡迎參與和關注本項目的同行留言,您的想法和建議,將有助於工作的開展。
※老中醫都不透漏的秘密:這些食物竟是癌症剋星,平時要多吃!
※吃火鍋的日子就要來了,但是好吃莫貪,小心吃出癌症來
※指甲、脖子出現這些異常可能是癌症前兆!如果發現,千萬別忽略!
※深度解讀癌症、炎症與免疫的恩怨情仇!
※慘遭癌症摧殘的明星,有的骨瘦如柴,有的已經離世
TAG:癌症 |