略過導覽連結
新藥查驗登記(NDA)
銜接性試驗評估申請案(BSE)
臨床試驗審查(IND)
申請及法規相關
生物製劑(BIO)
藥物毒理(Pharm/Tox)
臨床審查(Clinical)
統計
原料藥主檔案(DMF)
臨床試驗案統計審查Q&A
臨床試驗案統計審查Q&A

臨床試驗案之統計審查重點為何?

臨床試驗之統計審查重點,主要有以下八點考量:
  1. 主要評估指標
  2. 試驗設計
  3. 樣本數的估計
  4. 不劣性試驗/相等性試驗臨界值 (margin) 選取的合理性
  5. 是否執行期間分析 (interim analysis)
  6. 療效及安全分析群體
  7. 缺失資料 (missing data) 處理方法
  8. 統計分析方法

主要評估指標之審查重點為何?

  1. 主要評估指標基本上需針對試驗主要目標訂定,且需定義清楚。
    宜針對試驗主要目標訂定主要評估指標,其評估測量方法包括步驟與程序均應於計畫書中詳述,且定義清楚。例如主要評估指標定義為血壓坐姿舒張壓值的變化,則需清楚定義係測量血壓值變化的百分比,還是血壓值變化的絕對值,且需明確定義那一個時間點相對於基準值的變化。
  2. 評估測量方法需適當,不可造成評估偏差。
    例如主要評估指標為發生癲癇之次數,則極可能受到受試者觀察時間長短的影響,因為觀察時間越長,則可能觀察到的癲癇次數越多,故受試者觀察時間長短不同,易造成評估偏差
  3. 使用替代性指標 (surrogate endpoint) 的適當性。
    以替代性指標為主要評估指標,必須是已被大家認定且廣為接受之指標。例如癌症治療之確認性試驗 (confirmatory study),若以替代性指標 - 惡化時間 (time to progression) 為主要評估指標,則需謹慎考量其合理性及臨床有用性。
  4. 使用問卷量表 (questionnaire),需經過確效認定 (validation)。
    以問卷量表為主要評估指標,須有文獻證明所採用之量表,已確認其效度 (validity) 及信度 (reliability) 。
  5. 若為多重主要評估指標,需考慮多重檢定(multiple tests) 可能造成型一誤差(type 1 error)之擴增。

試驗設計之審查重點為何?

  1. 病人分派方法的適當性。
    具控制組之試驗設計,宜採用隨機分派方式,將病人分派至不同的治療組別。若試驗包括不同的時段如篩選期、導入期、及治療期等,隨機分派時間點是否適當將為重要的考量。若試驗之樣本數不大,且具重要之預後因子,則是否以重要預後因子分層,執行分層隨機分派將為考量重點。多中心臨床試驗,隨機碼的產生宜由中央執行單位統籌產生。
  2. 是否採用盲性作業 (blinded procedure)。
    基本上,雙盲試驗最符合科學原則。惟在單一治療組的臨床試驗,或某些有效藥對照試驗,由於治療組別間服藥時間、用藥途徑(口服或靜脈注射)或給藥頻率不同等原因,造成技術上無法執行雙盲時,採用其他盲性作業方式,如何避免試驗執行過程及詮釋結果時有所偏差將為考量重點。
    例如開放式設計,若主要評估指標為客觀性指標(例如:整體存活率),且隨機碼不預先產生,而由中央電腦系統於受試者進入試驗後再執行隨機分派,應可避免上述偏差。但若主要評估指標為較具主觀性的指標,則至少需達到評估者盲性 (evaluator blinded) 的原則。
  3. 是否為同步 (concurrent) 對照試驗。
    基本上,同步安慰劑對照臨床試驗,最能排除機會因素,亦最能確認療效。惟某些疾病具生命威脅性,不治療易產生不可逆的後果,若該適應症已有標準治療方法,則執行同步有效藥對照試驗,應較符合倫理原則,惟對照藥及其劑量選取是否適當,將是考量的重點。 除非該適應症迄今無標準治療方法,或在特殊情況及早期非確認性試驗,宜儘量避免採用歷史對照組 (historical control);欲採用歷史對照組,宜就相關事宜,事先諮詢查驗中心。
  4. 使用交叉設計 (crossover design) 的適當性。
    一般試驗多為平行設計 (parallel design),每位受試者只接受一種治療藥物。但某些情況下會使用交叉設計,受試者在同一試驗的不同時段,分別接受不同的治療藥物。此設計的優點是受試者自己為自己的對照組,可以排除治療組別以外其他不必要的干擾因子,使測量的精確度提高,變異量減低,因此可以較少的樣本數達到相同的檢定力 (power)。惟並非任何試驗皆可使用交叉設計,針對使用交叉設計的適當性,統計審查須考量試驗藥品宣稱的適應症是否為穩定且可逆之慢性疾病;試驗藥品療效是否能於單一時段呈現;時段與時段間沖洗期 (wash-out period) 是否夠長以避免殘餘效應 (carry-over effects) 等。

樣本數的估計之審查重點為何?

試驗針對不同的研究目標,將有不同的樣本數考量。一般而言,第一期臨床試驗並不要求樣本數的估計,惟計畫書應說明最多會收納多少受試者,且須符合國內法規需求 (例如:藥動試驗須至少12人) 。第二期試驗如為早期探索性臨床試驗,除了治療具生命威脅性 (例如癌症) 之適應症外,通常無需從事樣本數的估計。惟第二期試驗如果主要目的在瞭解劑量反應關係及決定最低有效劑量,則宜從事樣本數的估計。主要考量為是否提供足夠檢定力檢測劑量與反應是否正相關 (斜率>0)。而第三期療效確認性臨床試驗,則須針對試驗樣本數的決定有所辯明。法規統計審查的考量包括:是否根據主要療效指標參數值來估算;所使用的參數值是否具有文獻根據;用於估算的統計假說,是否根據試驗目的與臨床假說訂定;統計假說所檢測的療效大小 (effect size) ,是否為可達到的且具臨床意義 (achieveable & clinical significance);用於估計之統計方法是否適當;及是否有足夠檢定力來偵測所宣稱的療效等。


臨界值 (margin) 之審查重點為何?

採用同步有效藥對照試驗設計,若對照藥為被認定的標準療法,一般多採行不劣性/相等性試驗設計。此類設計的臨界值必須於計畫書中預先定義。評估其所選取臨界值的合理性,統計審查須請廠商提供二篇以上有效對照藥品與安慰劑比較之療效證據,以估計其療效大小。預設的臨界值宜保留有效對照藥療效大小百分之五十以上,且確認療效仍顯著優於安慰劑,另外所保留之療效,亦應具臨床有用性。


期間分析之審查重點為何?

長期性、針對生命威脅性適應症之臨床試驗,較多採「群集逐次設計 (group sequential design)」,並執行期間分析。執行期間分析可能是為療效或安全的緣故。一般而言,如僅為安全性監視,結果並不會導致提早停止試驗,則毋需於計畫書中載明停止試驗原則。若期間分析可能導致提早停止試驗,通常療效因素停止試驗之條件會比安全因素來得嚴苛。審查考慮的重點包括:
  1. 期間分析的方法及原則。
    例如提早停止試驗原則採用Pocock (1977) 或O’Brian-Fleming (1979) 等的方法,應於計畫書中載明期間分析的時間及次數,並據此定義提早停止試驗的邊界點 (boundary)。但若停止試驗原則採用Lan-DeMets (1994) 之a消耗函數 (a spending function),則可以不預先設定時間及次數。
  2. 是否組成「獨立資料監視委員會 (Independent Data Monitoring Committee, IDMC)」。
    獨立資料監視委員會原則上由獨立於廠商及試驗主持人之外部臨床及統計專家所組成,除監視試驗的安全性外,並執行期間分析。而每次期間分析,委員會將根據統計分析結果,考量各層面經過討論,責成繼續試驗或停止試驗的決議,向廠商提出。
  3. 整體雙尾型一誤差 (overall Type I error,a) 是否維持於0.05或以下。
    一般期間分析若允許因療效太好而提前停止試驗,則每多做一次期間分析,即增加發生型一誤差的機會,因此若未提前停止試驗,最後分析 (final analysis) 執行檢定時,可容忍之雙尾型一誤差必須經過調整低於0.05,以確保整體雙尾型一誤差不超過0.05。但若試驗設計期間分析結果可因療效太差 (futility) 而提前停止試驗時,則療效太差邊界點 (futility boundary) 的設定,一般皆不列入整體型一誤差調整的考量。
  4. 是否根據期間分析結果從事「調整設計 (adaptive design)」。
    廠商如果將根據期間分析結果,對決定樣本數的參數值假設有所調整,以重新估計樣本數;或根據分析結果,決定是否更改試驗設計由原較優性試驗 (superiority trial) 更改為不劣性試驗(non-inferiority trial),原則上須於計畫書中預先載明調整設計的計畫。由於調整設計迄今仍為頗具爭議性問題,廠商於計劃階段宜訂有標準操作程序 (Standard Operation Procedures; SOP),法規審查將審慎評估其適當性及是否造成執行上的偏差。


療效及安全分析群體之審查重點為何?

  1. 分析群體的定義。
    計畫書中需清楚定義各分析群體如意圖治療群體 (Intent-to-treat, ITT population),依計畫書群體 (Per-Protocol, PP population) 等所涵蓋之受試者範圍。
  2. 主要療效分析群體。
    第三期確認性試驗,須於計畫書中明確定義主要療效分析群 體。一般而言,對於主要療效的確認,宜以較保守的分析群體為主要療效分析群體。例如:安慰劑對照的較優性試驗,以 ITT為主要療效分析群體較為適當。反之,有效藥對照之不劣性/相等性試驗,以 ITT 群體分析則不保守,PP 群體則為較適當的分析群體。確認性試驗,除執行主要療效分析外,宜另外以其他分析群體執行「敏感性分析 (sensitivity analysis)」,若發現與主要療效分析群體結果相差甚遠,則需進一步提出合理說明及解釋。

缺失資料處理方法之審查重點為何?

療效評估指標,尤其是主要療效評估指標及問卷量表,宜於計畫書中明確定義缺失資料之處理方法。審查考慮的重點包括針對研究設計,主要評估指標所定義的處理方法是否適當;及針對主要療效的確認,所定義的處理方法是否為較保守方法等。例如主要療效評估指標為試驗終點糖化血色素 (HbA1C) 相對於基礎值的改變值,主要療效分析群體定為 ITT。若缺失資料採用不插補(no imputation) 的方式處理,則試驗終點無主要療效評估值的受試者,皆無法納入主要療效分析,並不符合 ITT 原則,故為不適當的處理方法。又如針對B型肝炎治療之安慰劑對照試驗,主要療效指標定義為治療48週 (試驗終點) e抗原血清轉換成功率,缺失資料的處理方法則為無論之前是否發生血清e抗原轉換,如果無48週主要療效評估值,一律定義為失敗,此種處理方法無論兩組缺失資料的比率是否相當,對治療組都較為不利,故為較保守的方法。另外療效確認性試驗,除了定義主要療效指標缺失資料的處理方法外,宜進行不同處理方法的敏感性分析,以確認療效,若有不同結果,亦應提出說明及解釋。


統計分析方法之審查重點為何?

統計分析方法的審查主要考量包括:
  1. 主要統計假說 (statistical hypothesis)。
    宜根據試驗主要目的與臨床之研究假說來設定。通常為針對主要評估指標的統計假說
  2. 整體型一誤差是否為單尾 (one-sided) 0.025,雙尾 (two-sided) 0.05。
    多個主要療效指標,或主要療效指標在多個時間點重覆檢定,及群集逐次設計執行多次期間分析等,都易造成多重檢定(multiplicity) 的問題,宜用適當的機制或調整方法,避免型一誤差的擴增。
  3. 調整基礎值及重要共變數 (covariate)。
    雖然隨機分派若執行得好,原則上治療組別間基礎值的分佈會達到平衡。惟療效評估係針對每位受試者改善的情形,因此除非特別考量,應針對每位受試者的基礎值有所調整,必要時亦應探討與治療組別間之交互作用。另外對於影響療效的重要因子,尤其是隨機分派的分層因子 (stratified factor),亦應考慮放入療效分析統計模式中加以調整。惟計畫書中應預先載明欲放入主要療效分析的調整因子,及療效的確認係根據「調整」或「未調整」的分析結果。
  4. 主要療效分析方法宜適當,不可造成結果的偏差。
    例如相依樣本以獨立樣本統計分析模式分析,即可能造成分析結果的偏差。又如受追蹤時間影響及有追蹤不完全造成設限(censoring) 情形的二分法療效指標 (binary outcome),如單純以二分法指標的統計分析模式分析,亦無法呈現真正的療效結果。
  5. 應提供點估計及信賴區間。
    主要療效分析不僅應提供假說檢定結果,亦應提供主要療效指標參數值的點估計及95%信賴區間,這在新藥的臨床有用性及效益危險評估上格外重要。