日本亚洲欧洲免费在线

【原創】淺談統計推斷與數據收集

2019-12-23 16:22 ?阅读数:352 标签:
談到用統計學進行決策,離不開所謂的“統計推斷”,即用樣本去推斷總體的信息,進而指導決策。在現今的大數據時代,統計學作爲一門學習和認知的哲學,成爲了連接“數據”與“信息”這兩大熱門概念的堅實橋梁。統計學的認知基于對測度的客觀認識,即承認我們所觀測到的都是“信號”與“噪聲”的結合,在正視和量化“噪聲”的過程中,統計學發展出了一系列從“噪聲”中提取“信號”的工具,而假設檢驗、線性模型等經典統計推斷方法論就是其典型代表。

 
在當今的時代,所有人都應該明確的一點是“數據≠信息”,只有經過合理統計學方法論處理過的數據才能得出盡可能准確且能正確指導決策的信息。而這些統計學方法論的運用絕不僅僅局限于對已有的數據進行分析。事實上,統計學思維在數據收集過程中與數據分析過程中同樣重要。既然“好”的數據是獲得有用信息的基礎和前提,那麽究竟什麽樣的數據才是好的呢?以下是筆者總結的數據收集7原則:

01
理解統計意義與測量層面的重複

任何統計分析,都離不開“重複試驗”以獲得足夠的樣本量,但應注意的是統計意義上的重複與“重複測量”在很多情況下並不等同。例如在臨床試驗中,对同一例患者反复多次获得测量数据,并不等同于对多个患者获得的数据。因此在任何統計分析中,我們關注的“樣本量”不能只看觀測值的個數,而應了解數據收集方式以確認具有統計意義的樣本量。

02
理解數據類型

正确识别或定义數據類型是一切统计分析的基础,这影响了我们如何选择适用的统计学假设和统计推断方法。在有些情况下,數據類型并非显而易见,需要我们根据不同情况提出不同的前提假设。也就是说,同一组数据,根据研究的实际需要,可以视为不同的數據類型。常见的數據類型可分为计量型(连续型)、定序型和计数型(定类型),不同的數據類型包含的信息量有所不同,通常来说,如果一组原始数据是信息量较高的數據類型(如计量型),其可以依照某种原则转化或被重新定义为信息量较低的數據類型(如计数型),但是这样的转化可能会造成不必要的信息流失。

03
確保樣本對需要研究的總體“有代表性”

樣本對研究總體的代表性直接決定了統計推斷的有效性,因此任何研究者和數據分析人員都應該在數據收集階段進行自審和自查,如嘗試找出如下問題的答案:

  • 通過這組樣本得出的結論真的能反映我關注的總體嗎?
  • 我的樣本與總體具有怎樣的相似性?

原則上來說,如果能確定收集到的樣本對總體有代表性,如何獲得他們並不重要。然而在實際研究過程中,很多時候我們無法確切地知道樣本對總體的代表性,因此能做的就是盡可能地確保隨機性。原因在于,不隨機的抽取會導致樣本對于總體是“有偏的”,例如“研究全校學生平均身高的時候抽取其中某個專業的學生作爲樣本”或用“自願參與”調查問卷了解民衆對某一項政策的意見。

04
確保消除數據的潛在偏差


与確保样本的代表性类似,随机抽样和试验顺序的随机性也是消除数据潜在偏差的重要手段。如在臨床試驗中每一个试验单元的顺序都应尽可能随机,其目的在于尽可能地消除潜在的影响因素(它们可能是未知或不可控的),如“学习效应” 或时间造成的影响,这一类的“随机化”可以被理解为一项针对“意外变量” 的“保险”。需要注意的是,隨機性是常常是有代價的,沒有絕對完美的隨機。在實踐中,我們應認識到,隨機化是手段而不是目的,需要綜合考慮隨機性與一些其他試驗的重要方面,如分布的平衡性和操作便利性等。

消除数据偏差的另一个重要手段是“设盲”,通过对研究者和受试者设置盲态可以在很大程度上消除“安慰剂效应”或其他一些潜在偏差,这在臨床試驗中显得尤其重要。

當然,數據偏差的消除同樣離不開數據收集本身的規範性,針對這一方面,常見的做法是在數據收集中運用作業指導書與SOP或在正式試驗之前通過試運行來觀察潛在的數據收集幹擾因素,如需將不同數據源的數據彙總分析,則應十分謹慎,因爲他們很有可能來自不一致的收集方式。

05
在數據收集前決定樣本量

合理计算樣本量是试验规划和试验设计的重要一环,合理的樣本量计算要基于对试验目标和统计学相关假设的明确。任何統計學研究都應避免在獲取觀測值後出于改變結論的目的再次收集數據,即所謂的“二次抽樣”。

06
認清非一手數據的局限性


如果數據不是你收集的,那麽極有可能它們是被收集來回答不同的問題的(否則你的問題應該已經有答案了)。可能的不同與改變包括並不限于:SOP的改變,工藝流程的改變,測試系統的改變等等。

07
確保数据跟研究的问题相吻合

針對這一點,我們應特別注意如下方面:

  • 不要爲了收集數據而收集數據;

  • 不要先有數據,再去想問題;

  • 不要先收集數據,然後強行用這個數據去回答某一問題;

  • 當數據收集過程並未嚴格按計劃執行,請謹慎思考是否它還能被用來回答你想要研究的問題。

 

作者:日本亚洲欧洲免费在线  临床研究事业部


Hi,are you ready?

准備好開始了嗎?
那就与我们取得聯系吧

有一个医疗器械项目想和我们谈谈吗?您可以填写右边的表格,让我们了解您的项目需求,这是一个良好的开始,我们将会尽快与你取得聯系。当然也欢迎您给我们写信或是打电话,让我们听到你的声音!

奧咨達 | 高端医疗器械临床注册专家

24小時免費咨詢熱線:

400-6768632

填寫您的項目信息

填寫完表單後,請點擊以下任意一種溝通方式:

?