无敌时时彩在线计划 重庆时时彩后一方式 重庆时时彩一天输10万 新疆时时彩玩法 重庆时时彩如何逮豹子 重庆时时彩刷钱 重庆时时彩杀0杀9技巧 重庆时时彩代理平台 最新时时彩走势图 时时彩返点回水 时时彩计划都是坑 老发时时彩一看就是托 重庆时时彩论坛绝学技巧 重庆时时彩技巧 重庆时时彩南国的网址
加載中........
×

應該調低P值,還是干脆拋棄“統計顯著性”?

2019-8-18 作者:醫咖會   來源:醫咖會 我要評論0
Tags: 醫學人文  

近年來,關于“statistical significance(統計顯著性)”和P值的爭議一直存在。前段時間,《Nature》發表了一篇題為《scientists rise up against statistical significance》的文章,《美國統計學家》也專門發布了一個針對P值的專刊。

近日,《歐洲心臟病雜志》(EHJ)發表了一篇專家觀點,再次針對“統計顯著性”發表了自己的觀點,到底是降低P值,還是拋棄統計顯著性,我們來看看這位專家持怎樣的態度。

幾十年來,論文中都基于p<0.05來聲明具有“統計顯著性”。然而,很多專家也發現,有些論文中的統計學意義和臨床意義并不相符,p值的濫用問題很嚴重。2016年,美國統計協會(ASA)曾針對這些誤用發表了共識(表1)。

表1. ASA關于P值的主要聲明要點



方法學專家在核心問題上意見一致,但在許多關鍵細節上仍然存在分歧,更重要的是,在如何最好解決“統計顯著性”問題上也存在分歧。理想情況下,所有學科都需要全面了解統計工具、注意事項和如何正確解讀結果。然而,提高所有學者、臨床醫生甚至普通大眾的統計素養需要長期的努力。

最常見和嚴重的誤解是,“P< 0.05”就表示效果“是真的”,甚至結果“很重要”。目前大多數達到P<0.05的研究,并不太可能反映真實的因果效應,更不用說重要效應。大多數研究都存在偶發性或偏倚,可能很少真的具有臨床重要意義且值得采取措施。

還有一個誤解是,P≥0.05就必然意味著“不是真的”或“不存在差異”。小型研究可能就無法發現真正的差異性。如果偏倚削弱了估計值,即使是大型研究也可能會遺漏一些真正的差異。在某些領域,尤其是社會科學領域,有人認為不管差異多么小,也總是存在差異的。還有另一種學派主張,大多數經過檢驗的關聯和效果很可能實際上是無效的。

前段時間,有學者針對文獻都陷入“統計顯著性等同于P< 0.05”這一困境,提出了兩個解決辦法。

其中一個建議是保留統計顯著性,但要增加達到統計學顯著性的難度 [PMID:30980045 ]。對于仍使用P< 0.05這個閾值的研究,該建議將統計顯著性閾值改為P<0.005。這降低了“假陽性”,但增加了“假陰性”。如果“假陽性”確實相比“假陰性”是一個更嚴重且常見的問題,那么這種方法看起來合理。調低p值可能會給研究人員帶來壓力,迫使他們進行大規模(或許研究設計會更細致)的研究。

如果一個研究是評估不太可能發生的事件,P< 0.005可能仍然不足以保證真實性。此外,還有人擔心,許多研究人員可能會更加偏激,強行使P值達到<0.005。盡管如此,這種使用P<0.005的方案還是比較簡單,可以應用于已發表的和未來的研究,也可以迅速去除大量沒有研究價值、沒有臨床意義的方向。

另一個解決辦法是完全放棄“統計顯著性”和任何“顯著/非顯著”的概念[PMID:30894741]。這種禁止“統計顯著性”的概念但又保留P值的建議可能是不明智的,如果沒有任何預先制定好的規則,任何研究人員都可能以對自己有利的方式來解釋任何結果。

雖然“零假設”顯著性檢驗常常被誤用,但如果正確使用,按照預先制定的分析計劃來處理研究問題,仍然是很有價值的,可以幫助排除掉“無意義”的結果。這在很大程度上取決于事先制定整個排除計劃時考慮得有多仔細。對于許多臨床研究,例如隨機試驗,是需要有預先定好的規則的。

EHJ文章中報告P值的情況

本文作者檢索了歐洲心臟病雜志(EHJ)2018年發表的所有文章,檢索出摘要中使用了“significant”這個詞的文章。最終有62篇文章被納入。只有11篇論文使用該詞來指代臨床意義,3篇論文明確寫的是統計顯著性(statistical significance),49篇論文是通過一個假設的統計推斷間接提到了“significant/significance”。

62篇論文的摘要中,37篇至少報告了一個p值,62篇總共報告了141個p值,其中86%的p值<0.05。96%的摘要中至少有一個p值<0.05。

在P< 0.05的論文中,36%會寫結果具有“提示性(suggestive)”,除非P< 0.005,否則不會提到統計顯著性(statistical significance)。

許多P值是用截斷值(cut-offs)來報告的,而不是精確值,如141篇論文中有13篇為P< 0.01, 30篇為P< 0.001, 7篇為P< 0.0001。目前多數人認為,用截斷值表示p值不是最佳辦法,應該給出準確的數字。例如,當P<0.01時,目前尚不清楚這意味著P=0.009還是p=0.0000000001。

總之,對統計顯著性的閾值要求更加嚴格,會使大多數臨床研究論文受益。更有爭議的在于是否應該完全禁止統計顯著性。不管怎樣,更加考慮研究的臨床意義,研究開展之前做好計劃,使用合適的統計方法,可以幫助改善臨床研究。

參考文獻:Eur Heart J. 2019 Aug 14;40(31):2553-2554.

doi: 10.1093/eurheartj/ehz555.



小提示:78%用戶已下載梅斯醫學APP,更方便閱讀和交流,請掃描二維碼直接下載APP

只有APP中用戶,且經認證才能發表評論!馬上下載

web對話
老时时彩胆号预测器
无敌时时彩在线计划 重庆时时彩后一方式 重庆时时彩一天输10万 新疆时时彩玩法 重庆时时彩如何逮豹子 重庆时时彩刷钱 重庆时时彩杀0杀9技巧 重庆时时彩代理平台 最新时时彩走势图 时时彩返点回水 时时彩计划都是坑 老发时时彩一看就是托 重庆时时彩论坛绝学技巧 重庆时时彩技巧 重庆时时彩南国的网址
福彩新快3中奖规则 幸运28害了多少人 麻将app平台 90级板砖赚钱 上海快三走势图基本图 青海快三开奖详情 分销代理现在赚钱吗 一十轻风 连码不断 奔驰宝马游戏下载地址