臨床試驗是臨床研究中最重要的步驟之一,通常用來評價疾病治療措施、干預(yù)措施的效果,其發(fā)展史可追溯到1747年James Lind的壞血病研究,并已成為醫(yī)學領(lǐng)域證據(jù)生成的金標準。常規(guī)臨床試驗設(shè)計遵循的基本原則是隨機、對照、盲法、重復(fù),常見類型有平行設(shè)計、交叉設(shè)計、序貫設(shè)計、析因設(shè)計。理想情況下,治療藥物或干預(yù)措施須通過設(shè)計精良的隨機對照試驗測試方能進入下一步應(yīng)用。但傳統(tǒng)的臨床試驗設(shè)計具有局限性,包括設(shè)計和實施復(fù)雜、外推性受限、效率低下、盲法不易實現(xiàn)等[1]。
隨著科學研究的發(fā)展,基因組學、蛋白質(zhì)組學、代謝組學、病毒學以及大數(shù)據(jù)科學、計算生物學和人工智能的技術(shù)進步,人類對基礎(chǔ)性疾病的病理生理學過程有了更好的理解。但是,醫(yī)學領(lǐng)域里從實驗室到床邊的轉(zhuǎn)化速度仍然落后,傳統(tǒng)的臨床研究已經(jīng)無法滿足新型藥物和治療技術(shù)研發(fā)的新需求:高效率、高質(zhì)量的證據(jù)[2]。隨著惡性腫瘤患病率的增加,抗腫瘤藥物成為全球新藥研發(fā)的熱點,腫瘤藥物臨床試驗方案設(shè)計較為復(fù)雜,傳統(tǒng)設(shè)計在顯著增加成本的情況下,并未提高試驗效率及成功率。同時,腫瘤治療已經(jīng)從過去相對單一粗放式的放化療,逐步向基于生物標志物的靶向治療和免疫治療共發(fā)展[3]?;蚪M學(用于識別分子改變)的進步、治療方法的發(fā)現(xiàn)和快速臨床轉(zhuǎn)化,腫瘤學領(lǐng)域比任何其他領(lǐng)域都更能引領(lǐng)這些技術(shù)進步,走向精準腫瘤學時代。因此,藥物臨床試驗方案設(shè)計創(chuàng)新具備急迫性和可行性,能更好地解決臨床研究設(shè)計的困境,并為加快藥物研發(fā)提供了新的機會[4-5]。本文主要介紹藥物臨床試驗設(shè)計創(chuàng)新的類型和設(shè)計思路,為相關(guān)研究提供方法學參考。
增加試驗靈活性的設(shè)計
主要是適應(yīng)性設(shè)計(adaptive design)中的成組序貫設(shè)計、樣本量重估計、無縫試驗、富集設(shè)計。適應(yīng)性設(shè)計是按照預(yù)先設(shè)定的研究計劃,在期中分析時使用試驗期間累積的數(shù)據(jù)對試驗做出相應(yīng)修改的臨床試驗設(shè)計。適應(yīng)性設(shè)計的核心在于適應(yīng)性地選擇設(shè)計參數(shù)或設(shè)計元素,這種選擇取決于研究目標、研究設(shè)計和分析方法。與經(jīng)典設(shè)計相比,適應(yīng)設(shè)計允許方案設(shè)計者在方案中預(yù)設(shè)可調(diào)的元素(樣本、對照組等),根據(jù)試驗中獲取的數(shù)據(jù)(包括研究自身的數(shù)據(jù)和外部數(shù)據(jù))作為新信息來確定這些可調(diào)元素在本試驗中的最終值。近年來,國內(nèi)外藥品評審和監(jiān)管政策[6-9]的支持引導及方法學的不斷成熟,使得適應(yīng)性設(shè)計在臨床研究中越來越被認可和應(yīng)用,其實施也取得了實質(zhì)性進展,從而大大改善了隨機對照試驗的靈活性。常規(guī)臨床試驗設(shè)計依據(jù)的前期探索性研究結(jié)果往往數(shù)據(jù)有限,且可能存在偏差,而適應(yīng)性設(shè)計允許通過研究過程中獲取的各類信息,對后續(xù)試驗進行調(diào)整,盡可能使受試者大程度獲益,縮短了研發(fā)的流程,最終提高臨床試驗的效率和成功率[10-13]。依據(jù)適應(yīng)性的目的分類,常用的適應(yīng)性設(shè)計包括:成組序貫設(shè)計、樣本量重估計、無縫試驗、富集設(shè)計、主方案設(shè)計等。
成組序貫設(shè)計
成組序貫設(shè)計(group sequential design)是每間隔一定的時間或一定比例的樣本量后,對已完成試驗的所有受試者進行期中分析,依據(jù)每一次期中分析的結(jié)果做出后續(xù)試驗決策,以判斷試驗是否可以提前得到有效或無效結(jié)論[14-15]。成組序貫設(shè)計將多次假設(shè)檢驗的思想納入到試驗設(shè)計中,研究可在期中分析時根據(jù)事先設(shè)定的規(guī)則提前得出結(jié)論,提高效率且更符合倫理。一項關(guān)于急性腦出血降壓治療的國際多中心、隨機、開放標簽的Ⅲ期臨床試驗,運用成組序貫設(shè)計,最終在完成第3次期中分析后因檢驗效能低于預(yù)設(shè)值而決定停止試驗[16]。
樣本量重估計
樣本量重估計(sample size re estimation)是指預(yù)先設(shè)定,利用累積的試驗數(shù)據(jù)重新計算樣本量,增強研究效力,以保證最終的統(tǒng)計檢驗?zāi)苓_到預(yù)先設(shè)定的目標或修改后的目標。樣本量重估計的設(shè)計目的是為了解決初始樣本量計算基于歷史或參考數(shù)據(jù),各種因信息不夠充分而導致的樣本量估算不夠準確的問題。比如一項關(guān)于乳腺癌無病生存期的隨訪研究,運用樣本量重估計方法后,發(fā)現(xiàn)其在估計對照組失敗概率方面具有很好的效用[17]。
無縫試驗
無縫試驗(seamless trial)是指將兩個試驗無縫連接,在前期試驗結(jié)束時做適應(yīng)性劑量選擇,并將所選劑量用于后期試驗。相比常規(guī)獨立的探索性和確證性研究,適應(yīng)性無縫劑量選擇可縮短試驗間隔、減少總樣本量、提高試驗效率。如Uozumi等[18]的研究模擬了無縫Ⅰ/Ⅱ期設(shè)計,在期中分析時用藥效學評價療效,實現(xiàn)了更有效的設(shè)計,節(jié)約了時間、成本及樣本量。在腫瘤臨床研究中,無縫Ⅱ/Ⅲ期設(shè)計是一種可行且合適的方法,根據(jù)研究終點具有不同的設(shè)計子類別。
富集設(shè)計
富集設(shè)計(enrichment design)是指通過分析期中結(jié)果,依據(jù)預(yù)先設(shè)定的標準對試驗人群亞組進行適應(yīng)性調(diào)整,以確定試驗后續(xù)階段的目標人群,試驗的最終分析目標可能是全人群、僅亞群,或者包括全人群和亞群,因此可以相對兼顧擴大至全人群以及亞組取得陽性結(jié)果的機會[19]。在新藥臨床試驗中,對一種新的藥物所適用人群往往缺乏足夠的了解,某些藥物可能對部分亞組人群有效,若入組全人群,則會導致治療效應(yīng)被稀釋,進而試驗失敗,同時也會將大量的受試者暴露在無效的藥物中。適應(yīng)性富集設(shè)計在一定程度上克服了上述的問題。富集的方式分為兩種:預(yù)后型富集和預(yù)測型富集。前者入選更有可能觀察到終點事件或疾病進展的高風險人群,增加試驗的絕 對效應(yīng),而非相對效應(yīng);后者根據(jù)疾病特征選擇對試驗藥物最可能有應(yīng)答的受試者,以提高試驗效率。應(yīng)用富集設(shè)計加速了Tazemetostat成為FDA批準的第一個甲基轉(zhuǎn)移酶抑制劑[20]。
此外,在臨床試驗中融入貝葉斯適應(yīng)性設(shè)計,已被腫瘤學領(lǐng)域和醫(yī)療器械領(lǐng)域廣泛接受。貝葉斯方法可以解決臨床試驗領(lǐng)域一些頻率統(tǒng)計難以解決的問題,貝葉斯適應(yīng)性設(shè)計試驗的主要優(yōu)點是適應(yīng)性和靈活性,以及能夠為治療評估提供更全面的、基于概率的推理平臺。
增加試驗效率的設(shè)計
發(fā)達國家和我國的一系列創(chuàng)新監(jiān)管方法的革新正在使新藥研發(fā)現(xiàn)代化,也大大提升了研究的效率。具有主方案(master protocols)的臨床試驗設(shè)計是加速腫瘤藥和生物藥研發(fā)的一種現(xiàn)代化方法,也是適應(yīng)性設(shè)計的一種形式,但其在提高試驗靈活性的同時,更能提高研究的效率。主方案是指一個整體臨床試驗方案含有多個子方案:籃式試驗(basket trial)、傘式試驗(umbrella trial)、平臺試驗(platform trial)。主方案設(shè)計是精準醫(yī)學背景下率先在腫瘤領(lǐng)域開展的一種高效的臨床試驗創(chuàng)新設(shè)計策略,旨在較短時間內(nèi)獲取高質(zhì)量證據(jù)以回答更多臨床問題,使藥物的臨床評估速度和研發(fā)速度更加符合臨床需求[2]。
籃式試驗
籃式試驗常用于同時檢驗一種藥物對于多種具有相同基因突變疾病的臨床效果,超越組織學的限制,可對多種疾病類型進行靶向治療評估,其本質(zhì)是一種藥物對應(yīng)不同的疾病或疾病亞型?;@式試驗因無法選擇一個共同的對照組,通常為單臂自身對照研究[21]。在腫瘤學領(lǐng)域的研究中,籃式設(shè)計的優(yōu)點是使得某些非常罕見的腫瘤因為帶有相同的基因突變類型而得到了治療的機會,并已經(jīng)在特定生物標志物驅(qū)動的人群中獲得了幾種藥物的應(yīng)用批準[22-26]。
傘式試驗
與籃式試驗相反,傘式試驗是針對一種疾病,可同時檢驗多種藥物臨床效果的設(shè)計。多項干預(yù)措施以“傘”的形式,集合了涉及某一疾病及其不同亞型的多項子研究,這種設(shè)計可以用于Ⅱ期探索性試驗和Ⅲ期確證性試驗。在腫瘤學領(lǐng)域的研究中,傘式試驗通常是在檢測特定的生物標志物之前對受試者進行篩選納入,然后再根據(jù)生物標志物的不同分入不同的亞組,開展不同的治療。BATTLE試驗采用適應(yīng)性分配,將受試者分為厄洛替尼、凡德他尼、厄洛替尼加貝沙羅汀或索拉非尼組,通過“實時”活組織檢查并驗證其可行性,推動了制定個性化肺癌治療方案的實質(zhì)性進展[27](圖1)。
平臺試驗
平臺試驗則同時檢驗多種藥物對于多種疾?。ɑ蚰骋患膊〔煌瑏喰停┑呐R床效果,用于評估多種治療方法或治療方法間不同組合的研究。其設(shè)計目的是在相同的主方案研究背景下,提供開放性的研究平臺,支持多種治療藥物或方案根據(jù)一定的決策算法進入或退出平臺,原則上允許平臺試驗永久進行。對于患者,可依據(jù)疾病特征獲得精準治療、獲得更大的入組機會,同時共用對照組的設(shè)置也可提高試驗效率。平臺研究已應(yīng)用于I SPY2試驗和基于血漿的晚期乳腺癌分子譜分析告知治療選擇等研究[28-30]。
新技術(shù)用于臨床試驗的創(chuàng)新
未來臨床試驗的成功需要結(jié)合科學發(fā)展的新成果、新模式,如人工智能臨床試驗研究的融合、數(shù)字化終點等,對所有可用數(shù)據(jù)進行深度挖掘與整合,從根本上改變試驗的設(shè)計、實施、監(jiān)測、調(diào)整、報告和管理方式,向更加以患者為中心和直觀的證據(jù)生成系統(tǒng)轉(zhuǎn)變。方法學的進步和基于人工智能的整合數(shù)據(jù)分析將為實現(xiàn)下一代“深度”循證醫(yī)學和個性化醫(yī)療的目標提供深刻的證據(jù)[31-34]。人工智能驅(qū)動的技術(shù)有可能改變臨床試驗過程的每個階段。如人工智能技術(shù)在收集、組織和分析臨床試驗產(chǎn)生的越來越多的數(shù)據(jù)(包括失敗的數(shù)據(jù))方面具有無與倫比的潛力,可以提取有意義的信息模式來幫助設(shè)計。人工智能算法可以通過自動化數(shù)據(jù)捕獲、數(shù)字化標準臨床評估以及跨系統(tǒng)共享數(shù)據(jù)來幫助監(jiān)測和管理患者。它與可穿戴技術(shù)相結(jié)合,可以實現(xiàn)對患者的持續(xù)監(jiān)測和對治療安全性和有效性的實時洞察,同時預(yù)測退出風險,從而提高參與度和保留率。試驗會產(chǎn)生大量的運營數(shù)據(jù),但功能數(shù)據(jù)孤島和不同的系統(tǒng)可能會阻礙技術(shù)平臺全面了解其在多個全球站點的臨床試驗組合。在開放數(shù)據(jù)標準支持的共享分析平臺上整合所有數(shù)據(jù)(無論來源如何),可以促進協(xié)作和集成,并提供跨重要指標的見解。然而,人工智能在實際臨床試驗過程中的應(yīng)用仍處于早期階段。與其他醫(yī)療保健領(lǐng)域相比,在臨床試驗的許多方面,目前對數(shù)字化的需求先于對人工智能的需求(圖2)。
臨床試驗的適應(yīng)性設(shè)計具備靈活可調(diào)性,更能滿足目前藥物研發(fā)的多樣性和復(fù)雜性需求。精準醫(yī)學的本質(zhì)是探索人體內(nèi)藥物、靶點與疾病之間未知的關(guān)系。針對某種疾病的分子亞型指導治療是傘式試驗設(shè)計的生物學邏輯。探索某個靶點對身體其他部位疾病的治療潛力,是籃式試驗設(shè)計的底層邏輯。開放性的動態(tài)理念是平臺試驗設(shè)計的核心。除了以上提到的單個適應(yīng)性設(shè)計,多重適應(yīng)性設(shè)計也是目前藥物臨床試驗的趨勢,也即在一項研究中運用多個適應(yīng)性設(shè)計類型,通過方法的組合更好地實現(xiàn)研究目標。總之,適應(yīng)性設(shè)計將為醫(yī)藥發(fā)展提供更好的循證研究證據(jù)。
臨床試驗新設(shè)計有效性的考量
適應(yīng)性設(shè)計在解決更多更復(fù)雜的臨床問題與需求時,也可能在實際操作過程中引發(fā)一些難點和問題:隨機分配組間不均衡、統(tǒng)計分析難度大、選擇偏倚及技術(shù)操作風險等。這就需要研究者在實際運用中采取規(guī)范、謹慎的科學態(tài)度進行綜合評估與考量:(1)遵循良好的前瞻性適應(yīng)性設(shè)計原則,適應(yīng)性設(shè)計的細節(jié)應(yīng)體現(xiàn)在方案里,實施中保持試驗的完整性和有效性;(2)期中分析時,確保分析時的樣本量足以做出適應(yīng)性決定,估計處理效應(yīng)時明確評估要點和科學性;(3)把控適應(yīng)性設(shè)計的靈活性,評估并控制Ⅰ類錯誤率,提高研究效力。
主方案中的設(shè)計考量點包括:(1)共用對照組。在同時評估針對單一疾病的多種藥物的試驗中,可以共用對照組(應(yīng)用目標人群目前的治療標準)。應(yīng)在試驗藥物和共用對照之間開展比較分析,而不是在實驗性治療組之間開展。(2)添加和停止治療組。主方案和統(tǒng)計分析計劃應(yīng)根據(jù)預(yù)先指定的期中分析或外部新數(shù)據(jù)的結(jié)果描述添加、擴展或中止治療組的條件。(3)生物標志物開發(fā)。評估生物標志物定義的人群的主方案應(yīng)解釋為何使用的生物標志物是合適的,并采用經(jīng)過分析驗證的體外診斷測試。
作者貢獻
熊海燕 論文撰寫。羅劍鋒論文修訂。王偉炳 課題構(gòu)思和設(shè)計,獲取資助,論文修訂。
參考文獻
詳見《復(fù)旦學報(醫(yī)學版)》2025年
合作咨詢
肖女士
021-33392297
Kelly.Xiao@imsinoexpo.com