美国试管婴儿:基于单次促排卵周期的累积分娩/活产率专家共识


本专家共识被中华生殖与避孕杂志2018年12月第38卷第12期收录


摘要

目前,如何评价辅助生殖治疗的成功尚存在争议,越来越多的学者呼吁将一次完整卵巢刺激周期的累积分娩/ 活产率作为一次促排卵的关键衡量指标。结合近年来国内外相关研究进展,本文对累积分娩/ 活产率的定义、临床意义、计算方法以及影响因素达成部分专家共识,以指导一次促排卵累积分娩/ 活产率的临床应用。


1、积累分娩/活产率产生的背景


体外受精(IVF)全流程是临床与实验室的完美结合,包括患者评估、临床控制性卵巢刺激、实验室多步操作(取卵取精、卵子/精子评估与选择、受精、胚胎发育)、最后进行胚胎移植和黄体支持,以获得成功妊娠。


对于IVF治疗全过程的评估应综合考虑多方因素,如:根据卵巢储备进行患者分类、不同促排卵方案的选择、实验室胚胎培养与评估、胚胎冻存技术、胚胎移植策略和黄体支持策略。自1978年世界第一例试管婴儿诞生,40年来辅助生殖技术(ART)发展迅速。


其中1984年第一例冷冻胚胎移植成功获得活产后,冻存剩余胚胎成为了一种可行的治疗选择。随着冷冻技术的发展和选择性单胚胎移植策略的实施,冻融胚胎移植不断增加,因此仅仅基于新鲜胚胎移植的成功率已经不能准确评估IVF的治疗结局。


因此评价IVF成功的指标不仅需要包括风险和安全以及IVF治疗的有效性指标,还应同时包含新鲜周期和冷冻周期治疗的结果,来评估一个完整治疗周期的最终结局(完整周期定义为一次控制性卵巢刺激后的新鲜胚胎移植周期及后续用完所有冷冻胚胎的冷冻周期),既往基于新鲜周期的评估指标可以作为阶段性的指标。


2、积累分娩/活产率的定义


关于累积分娩/活产率的定义尚未达成一致共识,且从目前已经发表的中、英文文献中对于累积活产率(CLBR)的说法也尚未统一,有一些学者习惯用累积分娩率。


国际辅助生殖技术监测委员会(ICMART)在2009年发表的ART词汇表4中首次对活产和分娩两个概念做了明确解释。活产是指受精产物从其母体完全取出或娩出(不论妊娠期的长短),且在与母体分离后存在呼吸或任何生命征象(如心跳、脐带搏动、随意肌的运动,不管脐带已经离断或仍然与胎盘连接)。分娩是指在孕龄超过20整周后,从孕母体内取出或娩出一个或多个胎儿。


同时评价ART治疗累积成功率的指标为至少有一名活产儿的累积分娩率(cumulativedeliveryratewithatleastonelivebornbaby),将至少有一名活产儿的累积分娩率定义为从一个启动ART周期或取卵ART周期获得的至少有一名活产儿的总分娩次数(包括新鲜胚胎移植、冷冻/冻融胚胎的后续移植ART周期)。


文中还特别说明了分娩单胎、双胎和其他多胎的妊娠按一例分娩计算。ICMART在2017年更新的ART常用词汇定义的文献中,又对活产和分娩做了补充解释,活产是指个体新生儿,如为双胞胎分娩代表两个活产;而分娩指无论是单胎、双胎亦或是多胎均记为一次分娩。由此可见分娩的定义更符合目前所发表文章中累积活产率中所描述的活产定义,因此建议使用累积分娩率作为ART治疗成功率的指标。


由于累积分娩率是一个累积成功率的概念,其纳入的患者抑或是周期数量范围、统计时间范畴往往高于单个治疗周期的阶段性指标,例如临床妊娠率、活产率等。因此,不同的利益相关者考虑到统计方法的便利性,对于累积分娩率的定义也存在不同的理解。


2016年欧洲人类生殖及胚胎学会(ESHRE)在HumReprod上发表了一篇文章,旨在统计多个国家IVF治疗累积分娩的情况。考虑不同国家的不同生殖中心治疗方案、移植策略等存在差异,提出了“近似累积分娩率”的概念,将其定义为同一年所有新鲜周期和冷冻周期的分娩数与取卵周期总数的百分比。


这一概念并不能作为每患者每促排卵周期的实际累积分娩率,只能作为大型学术组织统计某区域范围内或者国家层面统计IVF治疗的大致近似累积分娩情况。因此对于生殖中心或者临床医生而言,这种近似累积分娩率并不能真正代表实际治疗的累积结局。


从临床层面出发,对于累积分娩率定义也存在一些争议。有学者认为累积分娩率应定义为获得分娩的患者数与直至获得分娩所经历的所有移植周期数的百分比[7]。但是也有学者认为,这种方法评估了多个促排卵周期(包括新鲜和后续冷冻周期),且不方便确定起止时间。同一时间段内的患者有的是一个促排卵周期,有的是多个促排卵周期,因此,累积分娩率难以计算。更直观的定义是基于单个或者多个起始(或取卵)周期的累积分娩率。


目前,临床上普遍比较认可的是将单个完整促排卵周期累积分娩率作为整个IVF治疗过程的评估指标,其定义是一次卵巢刺激开始后首次获得分娩的患者数与取卵周期所有患者数的百分比。这一定义涵盖了一个完整IVF促排卵周期全过程的胎儿分娩机会,给予患者整个治疗的信心,同时能够帮助临床医生评估整个促排卵治疗的成功率和风险性,更具实践指导意义。


3、累积分娩率的指导意义


累积分娩率同时包含新鲜和冷冻胚胎移植后的成功分娩概率,更适合作为评估IVF成功的指标。“累积”意味着治疗成功数量的增加,对于IVF而言,意味着连续治疗后获得分娩的机会提高。


从国家层面来讲,不同生殖中心的冷冻策略、胚胎培养策略可能有所不同,而累积分娩率作为一个完整IVF促排卵周期的评估指标,可用于比较不同生殖中心的治疗质量。同时,可以参照基于国家层面累积分娩率大数据指导医疗保险政策的制定。


从生殖中心层面来讲,累积分娩率可以更全面地反映生殖中心的成功率、IVF治疗的疗效和花费,可作为生殖中心经济和诊疗方案策略制定的参考指标。


从临床医生层面来说,累积分娩率可以提供更客观真实的临床证据,提高ART安全性,减少患者流失,扩大医生影响力,且有助于全面评价促排卵方法和实验室技术。同时累积分娩率数据能够为医生制定治疗策略提供更好的数据支持,引导患者主动认同治疗方案,继续进行IVF治疗。


从患者层面考虑,选择IVF治疗的夫妇更关心的是一次促排卵可以获得成功分娩的概率。累积分娩率客观呈现一次完整周期治疗后的成功分娩机会,帮助患者对整个治疗过程获得活产的机会有合理预期,从而提升对生殖中心的治疗信任度和依从性。


4、积累分娩率的计算方法


基于不同的累积分娩率定义,其计算方法目前也存在一些争议。准确地计算累积分娩率,需要选择合适的“分子”和“分母”,同时还应考虑不同患者间新鲜周期及多次冷冻周期移植之间的时间间隔(表1)。


4.1分子和分母层面讨论


对于分子的讨论,争议相对较小。一般都是获得分娩的患者数/周期数作为分子,但有些研究将首个分娩的患者数/周期数作为分子,而有些研究将所有分娩数/周期数作为分子计算,考虑到夫妇因生育二胎带来的重复统计的影响,因此建议将首次分娩的患者数/周期数作为分子。


对于分母的选择,争议相对较多。有的计算方法认为分母应为直至获得分娩所经历的连续移植周期数,即包含多个取卵周期的新鲜胚胎移植和冷冻胚胎移植。而有的计算方法认为评估多次取卵周期的累积分娩率难以计算,且每个患者获得分娩所经历的取卵周期数不一致。


累积分娩率的计算需反映单个促排卵周期的效率,因此更直观的计算方法是基于单个起始(或取卵)周期的累积分娩率,起始(或取卵)周期是指一次卵巢刺激取卵后,包括新鲜周期移植和后续用完所有胚胎的冷冻周期移植在内的一次完整治疗周期。


另外,对于卵巢反应性较好的正常反应人群和高反应人群,建议统计单个起始(或取卵)周期累积分娩率。对于卵巢反应性较差的低反应患者,因其一次治疗获卵数较少,可能会累积多个刺激周期后才进行胚胎移植,或者选择的是非常规卵巢刺激方案,建议统计多个起始(或取卵)周期累积分娩率。关于多个起始(或取卵)周期累积分娩率的分子和分母有待后续进一步讨论。同时,从临床实践出发,不鼓励单纯为了提高累积分娩率的计算结果,进行不必要的胚胎全部冻存或累积。


基于起始(或取卵)周期的累积分娩率,根据不同的统计方法,又可分为两种方法:


①以患者人数为单位的累积分娩率=(新鲜+冷冻周期期间首次分娩患者数)/起始(或取卵)周期患者数×100%;


②以周期数量为单位的累积分娩率=(新鲜+冷冻周期期间有成功分娩的周期数)/起始(或取卵)周期数×100%。两种方法的不同之处在于分子的统计,以患者数量为单位,只统计首次分娩率的患者数,同一患者如多次分娩只计算一次;而以周期数为单位,能够获得分娩的周期都进行了统计,可能会出现同一患者多次分娩的周期数重复计算。


以患者数量为单位计算累积分娩率数据覆盖面积更大,对于ART疗效评估的宏观意义更大。对于政府组织而言,以患者数量为单位的累积分娩率可以为制定医疗保险政策提供更客观真实的临床数据,推动降低单次移植胚胎数目,提高ART安全性,但对于周期治疗的临床细节评估的意义较少,对于多次分娩仅能评价一次。


以促排卵周期为单位计算的累积分娩率,数据覆盖面积相对来说较小,大都以单个或几个中心进行统计。以促排卵周期为单位的累积分娩率可以直接评估每个起始(或取卵)周期的治疗有效性,对临床细节评估的意义更多,同时对于多次分娩可以多次计算。因此对于生殖中心来说,每起始(或取卵)周期累积分娩率更能直接反映周期治疗的水平、增加患者治疗信心。


另外,2016年ESHRE提出了“近似累积分娩率”的算法。以新鲜和冷冻周期获得分娩的患者总数为分子,同一年内所有进行IVF治疗取卵的患者总数为分母。但是这一结果并不能作为每患者/每取卵周期实际的累积分娩率,只能作为从国家层面或者某些学组统计多个地区/国家整体累积分娩率的近似算法。


4.2时间层面讨论


关于累积分娩率计算的另一个问题是与治疗或者周期数相关的时间层面问题,例如一次起始(或取卵)周期的治疗过程包含多少个移植周期?起始治疗和结束治疗的时间节点是什么?


累积分娩率的计算需要考虑患者进行冻融胚胎移植的时间。既往一些累积分娩率的计算未能考虑全部冷冻胚胎移植后的截止时间,因此得出的累积分娩率可能会低于实际值。且实际治疗过程中,有些患者从开始促排卵至最终用完所有冷冻胚胎的时间间隔可能为几年时间,因此对于每起始(或取卵)周期累积分娩率的统计计算带来一定的难度。


对于这些情况,建议对统计的时间进行合理限定,可根据不同的需求,设计一个预期的时间阶段,考虑本时间段内起始(或取卵)周期患者的累积分娩率。例如短期评估可考虑6个月;长期评估可考虑12个月亦或是更长时间。需要提醒的是,短期评估设为6个月,因为这个时间基本上只涵盖了新鲜周期移植结局,因此计算出的累积分娩率可能会偏低。


计算时间范围为1~2年,大部分患者可能会用完所有冷冻胚胎而且基本没有可能获得第二次或者更多次分娩,因此,排除中断治疗患者带来的偏倚所计算的首次分娩累积分娩率更符合实际。计算时间范围如果更长(>2年),患者可能进行多次促排卵周期的治疗,也可能获得2次或更多次的分娩,可能会对统计分子分母带来一定的挑战。


另外考虑到患者卵巢反应性的影响,建议正常人群和高反应人群计算时间范围为2年的累积分娩率,低反应人群因成功率较低可能需要更多促排卵周期治疗,可以计算更长时间范围内累积分娩率,如3~5年或者更长时间。综上,对于常规起始(或取卵)周期累积分娩率的统计或计算,建议随访时间为2年。


最后,基于以上对累积分娩率分子、分母以及随访时间选择的讨论,综合考虑生殖中心统计操作的便利性、临床医生对整个ART治疗细节的把控和患者对治疗过程的期望值3个层面,建议累积分娩率的计算方法为一次卵巢刺激取卵后新鲜周期以及用完所有胚胎冷冻周期的首次分娩患者数占起始卵巢刺激周期数的百分比,随访时间为2年。


4.3分析方法讨论


目前,累积分娩率的计算通常使用寿命表分析法,其中最常用的为Kaplan-Meier(KM)曲线,一般包含乐观估计和保守估计2种情况。


乐观估计是指假设中途退出治疗的患者与继续治疗的患者有相同的获得分娩的机会,而IVF治疗中的高流失率往往导致这一方法过高地估计了IVF的成功率。前面提到的每起始周期累积分娩率计算方法,也都是基于假设所有患者完成了一次完整IVF治疗,即包含在一次刺激取卵后,经过新鲜周期移植和后续的冷冻周期移植成功获得分娩的患者和用尽了所有胚胎后仍然没有获得分娩的患者。而在实际治疗过程中,有一部分患者并没有完成一次完整治疗,还有剩余胚胎就中断了治疗。且当继续治疗的样本数较少时,计算出的累积分娩率可能会出现偏大或偏小的情况,不能很好地代表大样本的累积分娩率。


另外,乐观估计可能存在患者选择偏倚,同时受到地区医疗政策的影响。我国大陆地区实施的辅助生殖治疗及促排卵用药均为自费项目,反复治疗失败后仍选择坚持治疗的患者可能经济实力更强,治疗依从性更高,相比放弃治疗的患者,可能得到更高的累积分娩率。


保守估计是指假设中断治疗患者获得分娩的机会为零,因此无论继续治疗的样本量多或者少,保守计算都会低估实际的累积分娩率。因保守估计主要受患者人群选择和时间范围的偏倚影响。高龄人群、低反应人群或者反复着床失败人群治疗成功率普遍较低,治疗脱落率较高,且统计时间范围越长,这一患者人群中断治疗数量越多。


因此,统计累积分娩率时,建议纳入的患者样本量尽量足够大且尽量涵盖合适比例的各类人群、同时随访时间适宜,这样才能使得累积分娩率计算结果更具可信性。对于>35岁的高龄人群出现中断治疗时,建议同时进行保守估计和乐观估计这两种“最好”和“最坏”的假设结果,样本量足够的前提下,实际累积分娩率应该介于两者之间。


另外,为了克服KM方法仅分析了分娩率这一单一终点的缺点,有文献建议可以使用竞争风险(CR)模型来计算累积分娩率。竞争风险模型可以同时分析面临多种潜在结局的生存数据,这些数据包括失效的时间跨度和导致失效的终点事件。


使用KM方法计算累积分娩率时,脱落仅为观察终点,未纳入分析,而使用竞争风险模型计算累积分娩率时,同时将分娩和脱落作为事件终点进行分析,即在整个研究期间,即使患者中断治疗,也在研究持续观察范围内。因此,对于脱落率比较高的人群,特别是脱落人群预后较差的情况,如果能够确定脱落原因,竞争风险模型能更加准确地计算累积分娩率。


5、累积分娩率的影响因素


影响累积分娩率的主要因素包括:年龄、体质量指数(BMI)、获卵数、卵子/胚胎质量、受精率、冷冻胚胎数、不孕原因。


一项大型回顾性队列研究纳入1099例年龄为18~40岁的女性,应用拮抗剂固定方案和重组促性腺激素(Gn)治疗,评估累积分娩率的影响因素。研究结果表明:年龄、获卵数、受精率是累积分娩率的显著影响因素。调整了年龄、移植时间、受精方式等因素之后,获卵数仍然是累积分娩率的独立影响因素。另外一项回顾性队列研究评估获卵数与临床结局之间的关系,并分析了累积分娩率的影响因素。多因素logistic回归分析结果显示:获卵数、BMI显著影响累积分娩率。另有一项回顾性研究评估选择性单胚胎移植(eSET)在高龄女性中应用的意义。


多因素logistic回归分析结果显示:对于年龄<37岁组,冷冻胚胎数目、优质胚胎数目、胚胎移植数量是累积分娩率的显著影响因素;对于年龄37~40岁组,eSET与多胚胎移植(MET)的累积分娩率相似;对于年龄>40岁组没有显示累积分娩率的显著影响因素。


另有一项纳入1050例患者的随机对照研究,分别对使用促性腺激素释放激素(GnRH)激动剂方案和GnRH拮抗剂方案治疗的累积分娩率影响因素进行Cox比例风险模型分析,研究表明,女性年龄、获卵数、BMI及不孕原因与累积分娩率具有显著相关性。


5.1年龄与累积分娩率的关系


年龄是影响女性生育能力的重要因素。随着年龄的增加,卵巢储备逐渐下降、对外源性促性腺激素的反应能力下降、获卵数目减少、卵母细胞质量(如非整倍体、染色体异常等)下降、优质胚胎率下降、胚胎着床率及妊娠率下降。


有研究提示,年龄是影响累积分娩率的直接影响因素,随着年龄的增加,累积分娩率显著降低,从<35岁的62.9%降至35~37岁的51.4%,38~40岁为34.1%,41~42岁仅为17.7%。Toftager等一项随机对照研究分析了不同治疗方案(GnRH激动剂方案和GnRH拮抗剂方案)中患者年龄与累积分娩率的相关性,并将患者按年龄分为<30岁、30~36岁、>36岁3个亚组,研究结果显示接受GnRH激动剂方案治疗的患者,随着年龄的增加,累积分娩率各亚组间比较差异无统计学意义(P=0.52),而接受GnRH拮抗剂方案治疗的患者随着年龄增加累积分娩率明显降低,差异具有统计学意义(P<0.01)。


5.2获卵数与累积分娩率的关系


获卵数是评估一次促排卵效能的关键指标。一次促排卵获得足够的获卵数,才能获得更多的可移植胚胎,进而,在新鲜胚胎移植之后,还会有更多的冷冻移植机会,增加一次促排卵后成功分娩的机会。Sunkara等基于400135个周期的分析也显示,对于不同年龄亚组(18~34岁、35~37岁、38~39岁、≥40岁)的患者,均是在获卵数15个时获得单个周期的最高分娩率。


综上所述,虽然一次促排卵的获卵数越多,整个治疗的累积分娩率越高,但在追求累积分娩率最大化的同时,还应考虑到卵巢刺激的安全性和新鲜周期移植的分娩率,因此平衡新鲜周期和累积周期成功率,建议将促排卵获卵数控制在10~15个范围内。


5.3可移植胚胎数与累积分娩率的关系


一项回顾性研究纳入11429例患者共20718个IVF周期,探究达到累积分娩所需的胚胎数。结果显示,一次促排卵获得的可移植胚胎数与累积分娩率呈正相关。因此合理获卵数范围内,提高一次促排卵的获卵数,可移植胚胎数越多,累积分娩率越高,获胚胎数超过15个,累积分娩率增加较缓慢。


5.4BMI与累积分娩率的关系


一项回顾性分析首次接受IVF长方案助孕治疗的1147例年轻且卵巢储备功能良好的不孕女性的临床资料,探讨年轻女性IVF-胚胎移植(IVF-ET)长方案周期累积分娩率的影响因素。


结果发现对于年轻且卵巢储备功能良好、首次行IVF长方案助孕治疗的患者,BMI是累积分娩率的重要影响因素,BMI≥24.2kg/m2组的累积分娩率、获卵数及可移植胚胎数显著低于BMI<24.2kg/m2组。BMI高者体表面积相对较大,对Gn的吸收率低于BMI正常者,且由于雌二醇(E2)代谢不足和性激素结合球蛋白降低,卵巢对Gn的反应性和敏感性下降,故BMI高者的Gn使用时间延长、Gn用量增加。


另一项随机对照试验纳入1050例受试者,将患者分为BMI<25kg/m2、BMI25~30kg/m2、BMI>30kg/m23个亚组,分别比较了GnRH拮抗剂和GnRH激动剂方案中不同BMI亚组的累积分娩率。


结果显示,接受GnRH拮抗剂方案治疗的3个不同BMI亚组患者的累积分娩率组间比较差异无统计学意义(P=0.30)。而接受GnRH激动剂方案治疗的患者,BMI>30kg/m2时累积分娩率明显降低,差异具有统计学意义(P<0.01)。虽然目前关于BMI对妊娠结局影响的机制尚无确切的看法,但是在一定程度上降低BMI有助于提高分娩率的看法已得到多数人的认可。


由此可见,年龄和获卵数是影响完整周期累积分娩率的主要影响因素,而女性患者年龄对属于不可抗力因素,同时年龄会直接影响获卵数。获卵数同时会受到卵巢刺激方案及不同Gn种类的影响,但是控制性卵巢刺激(COS)方案以及Gn药物是否属于累积分娩率的独立影响因素,还有待后续研究进一步证实。


6、总结


综合考虑ICMART对辅助生殖领域活产、分娩的定义以及目前已经发表文献对于累积活产率的描述,建议统一使用累积分娩率作为ART治疗成功率的指标。


累积分娩率定义为一次卵巢刺激取卵后新鲜周期以及用完所有胚胎的冷冻周期的首次分娩患者数占起始(或取卵)周期数的百分比,随访时间为2年。可借助KM寿命表分析法或竞争风险模型进行累积分娩率的统计。这一定义涵盖一个完整IVF促排卵周期的胎儿分娩机会,给予患者整个治疗的信心,同时能够帮助临床医生评估整个治疗的成功率和风险性,更具实践指导意义。


累积分娩率主要受患者年龄和促排卵周期获卵数量的影响,患者BMI、卵子/胚胎质量、受精率、冷冻胚胎数、不孕原因也对累积分娩率有一定的影响。IVF治疗过程中,在追求最大化累积分娩率的同时,还需考虑新鲜移植结局和卵巢过度刺激综合征(OHSS)风险,把获卵数控制在合理范围内。


参与本共识撰写及讨论修改的专家(按单位名称汉语拼音字母顺序排列):北京大学第一医院(徐阳);北京大学第三医院(李蓉、乔杰);北京协和医院(郁琦);成都市锦江区妇幼保健院(钟影);重庆市妇幼保健院(叶虹);空军军医大学唐都医院(王晓红);哈尔滨医科大学附属第一医院(卢美松);河北医科大学第二医院(郝桂敏);华中科技大学同济医学院附属同济医院(靳镭);华中科技大学同济医学院附属协和医院(高颖);南京医科大学第一附属医院(冒韵东);上海交通大学医学院附属仁济医院(孙赟);深圳中山泌尿外科医院(曾勇);首都医科大学附属北京妇产医院(王树玉);温州医科大学附属第一医院(黄学锋);新疆医科大学第一附属医院(腊晓琳);郑州大学第一附属医院(郭艺红);中山大学附属第一医院(徐艳文)


【孕文献】低分子肝素防治自然流产中国专家共识来啦

不明原因不孕症诊断与治疗中国专家共识(2019年最新发布)

专家共识:建议立法监管生殖目的的人类配子和胚胎基因编辑

中国高龄不孕女性辅助生殖临床实践指南(1)

中国高龄不孕女性辅助生殖临床实践指南(2)

中国高龄不孕女性辅助生殖临床实践指南(3)


{/block}