時間:2021-12-30
統計學是一門收集、處理、分析、解釋數據并從數據中得出結論的科學,主要涉及描述統計和推斷統計。首先是描述性統計,就是描述樣本的統計特征,用來總結大型數據集的重要特征,并不深入了解其內部規律,比如均值、中位數、眾數、標準偏差等。對于定性(類別)數據,使用表,餅圖和條形圖是匯總信息的最合適方法;對于定量(數值)數據,通常我們需要了解樣本中心以及該中心周圍數據點的離散度,因此直方圖,點圖及箱線圖是用于定量數據的合適統計圖形。
其次是推論統計,研究如何根據樣本數據去推斷總體數量特征的方法。它是在對樣本數據進行描述的基礎上,對統計總體的未知數量特征做出以概率形式表述的推斷。更概況地說,是在一段有限的時間內,通過一個隨機過程的觀察來進行推斷的。推論統計又可分為有參數統計學(Parametric Statistics)和無參數統計學(Non-Parametric Statistics)。其中參數統計學的總體呈正態分布(Normal Distribution)且方差齊性,如果均不滿足總體正態分布和方差齊性的要求,則需要考慮使用替代性的無參數統計,非參數統計檢驗不對總體做出任何假設。許多非參數統計中,使用中位數代替平均值作為集中趨勢的度量。對于非參數檢驗,將在中位數附近創建置信區間,或者將樣本數據與假設的總體中位數進行比較。
參數統計學的方法主要有:單樣本t-檢驗/兩樣本t-檢驗(One Sample/Two Sample t-test)、Z-test、單因素/兩因素/多因素方差分析(One-way/Two-way/N-way ANOVA)、配對t-檢驗(Paired t-test )、回歸分析(Regression Analysis)、相關性分析(Correlation Analysis)等。無參數統計學方法主要有:符號檢驗(Sign Test)、Kruskal-Wallis檢驗、Friedman Test、Wilcoxon’s Signed-rank Test、Mann-Whitney U Test、Spearman Rho等。
在我們日常的研發和生產過程中會產生大量的試驗數據,如何從抽取的這些樣本數據中得到總體的信息和特征,這就涉及到合理的數據收集以及對收集到的數據進行適當的處理,因此有必要進行相應的統計分析,所以統計分析在我們的研發和生產活動中是必不可少,相輔相成的,它可以為我們的研發和生產活動提供進一步的方向。
此外,統計學應用的范圍和領域很廣,幾乎遍及各行各業,而在醫藥行業,其制劑的研發和生產活動四個階段中涉及到的統計學方法主要如下圖所示:
當然如果我們僅僅通過幾組或幾十組數據的歸納總結直接得出結論,而未進行任何的統計檢驗,很可能會做出錯誤的判斷,因為再嚴謹的隨機抽樣,都存在抽樣誤差。舉個簡單的例子,新冠疫情爆發初期,市面上的眾多感冒藥物被用于新冠肺炎的治療中。其中國內某中成藥在其臨床試驗中有著相對較好的療效(單從相對較少的數據來看),但是在后續的統計檢驗中發現,它對新冠的治療作用在統計學上并不顯著,則我們會認定該中成藥對新冠的治療并無顯著作用。因此,任何無法在統計學檢驗中通過的結論我們都不應該輕信。所以學會如何運用統計軟件進行數據的統計分析,是十分有必要的,下面我們將講述如何使用Minitab軟件進行推論統計,如T檢驗,方差分析等。
首先,我們先來了解在統計檢驗中應用非常廣泛的推論統計——T檢驗。
T檢驗,亦稱學生 t檢驗(Student's t test),主要用于樣本含量較?。ɡ鏽 < 30),總體標準差σ未知的正態分布。t檢驗是用t分布理論來推論差異發生的概率,從而比較兩個平均數的差異是否顯著。它與F檢驗、卡方檢驗并列。用于評估單個樣本的均值是否與假設值不同,或者兩個獨立樣本的均值是否不同。主要有三種類型的T-檢驗,包括單樣本T-檢驗,未配對的兩樣本T-檢驗和配對的兩樣本T-檢驗。執行T-檢驗需要滿足兩個條件:數據服從正態分布和方差齊性。
A、單樣本T-檢驗
a.采用樣本均值并就總體均值進行陳述?;跇颖揪担╔)和標準差(S),樣本量為n,真實總體落在一個區間內的某個位置:下限<μ<上限。該測試未指定總體平均值的確切位置。它僅表示總體均值以一定的置信度位于兩個極限之間的某個位置。
b.可以確定樣本均值(X)是否等于假定的總體均值(μ):
原假設H0:X = μ;
備擇/替代性假設H1:X ≠ μ。
如果結果置信區間包括μ值,則原假設不能被拒絕,最好的猜測是樣本具有相似的均值。第二種方法是使用比率方法來計算t統計量。將所得的統計數據與臨界值進行比較,Minitab軟件可以報告t值和相應的p值。如果p值小于0.05,則以該決策至少95%的置信度拒絕原假設。
B、未配對的兩樣本T-檢驗
兩個樣本中的個體是完全獨立的,沒有什么聯系。
t檢驗的最常見用途是比較兩水平離散自變量和一個連續的因變量。執行兩個樣本t檢驗時,可以采取兩種方法:(1)建立總體差異的置信區間,或(2)使用比率法并將測試結果與臨界值進行比較。有兩種可能的假設:
方法 |
置信區間 |
比率法/臨界值 |
總體均值 是相同的 |
H0: μ1-μ2 = 0 |
H0: μ1 = μ2 |
總體均值 是不同的 |
H1: μ1-μ2 ≠ 0 |
H1: μ1 ≠ μ2 |
a. 第一種方法就是建立置信區間,顯著性的測定基于零是否落入置信區間內。如果零在置信區間內,則不能拒絕零假設μ1–μ2 = 0。如果所有結果都屬于正數或負數,則不可能為零,并且可以拒絕原假設,而使用替代假設μ1–μ2≠0。
b. 第二種方法是比率法,將結果與臨界值(t表上的值)進行比較。如果檢驗統計量的絕對值大于臨界值,則拒絕原假設μ1=μ2。如果絕對值小于臨界值,則樣本差異僅是由于偶然性造成的,并且原假設不能被拒絕?;蛘遬值小于0.05,則確定要否定原假設,這反映出至少95%信心否定原假設。
C、配對的T-檢驗
兩個樣本中的個體被連接在一起,樣本1中的第一個個體與樣本2中的第一個個體相連,依此類推至n對。在配對t檢驗的情況下,它會在兩個點(例如,兩個不同的測試條件,兩名不同的技術人員)測量樣品產生的差異。有時稱為重復測量程序,當兩種方法、個人或時間段之間不存在完全獨立性時,將使用該檢驗。假設是與基于樣本數據的總體平均差異有關:
原假設H0: μd =0; 備擇假設H1: μd ≠ 0。
這里,總體平均差異的最佳估計是樣本對之間的平均差異。與前面的兩個檢驗一樣,可以將結果評估為置信區間或比率法。
a.對于置信區間,如果零落在區間內,則原假設不能被拒絕。
b. 對于比率方法,p <0.05將導致原假設的拒絕。
T-檢驗是比較兩組均數差別最常用的方法,適用于小樣本(樣本容量小于30)數據之間的分析。例如,T-檢驗可用于比較藥物治療組與安慰劑治療組病人的測量差別,供試制劑與參比制劑之間或者不同生產批次之間的溶出、崩解、含量、重量、硬度等檢測指標之間是否存在差異。T檢驗可貫穿于藥物制劑開發的四個不同階段,即從處方前-處方和工藝篩選優化-中試批次及臨床樣品的生產-注冊批次/驗證批次生產-商業化生產/產品生命周期管理。
理論上,即使樣本量很小時,也可以進行T-檢驗(如樣本量為10,一些學者認為甚至更小的樣本也行),只要每組中變量呈正態分布,兩組方差不會明顯不同。方差齊性的假設可進行F檢驗,或進行更有效的Levene’s檢驗。如果不滿足這些條件,則可以使用非參數檢驗代替t-檢驗進行兩組數據間中位數的比較??梢愿鶕路降牧鞒虉D選用何種T-檢驗。