TCGA癌症临床数据库资源全面介绍---癌症研究领域的全谱!

2021-10-13 02:23 来源:长春妇科医院

2006年,乳腺食道癌线粒体所示谱(The Cancer Genome Atlas, TCGA)构想以多形得病态胶质母线粒体糙(GBM)、大肠鳞状线粒体食道癌(LUSC)和腺体浆液得病态囊腺食道癌(OV)开始为期3年的试点项目,2009年~2015年更进一步展开。到项目截止,TCGA互联数据的资讯分析工用上者已描绘了33种乳腺食道癌一般来说10,000余可有得病变的肿糙底物特性,并假设了很多肿糙底物免疫球蛋白。TCGA包含的均科最重要特性代请注意本土派化的数据的资讯得来。为确保正确适用这些具线粒体特性的海量均科数据的资讯,最近TCGA完毕一批重大成果,登载在CellPress旗下的期刊。

本文对4月底5日登载Cell上的一文来进行编译。文章阐述以OS(总猎食期)、PFI(无困难重重每条)、DFI(无得病每条)和DSS(结核得病之外活到)为四个主要均科结果起点的TCGA本土派乳腺食道癌均科数据的资讯人力(TCGA-CDR)规范数据的资讯库,并证明了了每种乳腺食道癌一般来说的起点适用决定。TCGA均科数据的资讯可从线粒体数据的资讯总计享三维空近(GDC)互联版订阅,所有的底物数据的资讯在订阅。均科数据的资讯和底物数据的资讯适用同样的条码结构,便于得病变的均科的资讯和样品底物数据的资讯为基础。

TCGA本土派食道癌数据的资讯库链请注意特性

所示1A为均科数据的资讯为基础和量化方法有及4个主要均科起点衍生和指标的范例,对33份初始登记和97份后续数据的资讯文件,总计33种乳腺食道癌一般来说111,60可有乳腺食道癌得病变的的资讯来进行了处理。请注意1为每个TCGA链请注意的基本特性。按原发肿糙样品根据底物特性选中每个链请注意,黏膜黑色素糙(SKCM)的原发和重从新分配炊两种一般来说都有,其它极多于数肿糙的原发与重从新分配一般来说也有数据的资讯分析。

所示1. 均科数据的资讯为基础和量化方法有及4个主要均科起点衍生和指标范例

请注意1. TCGA 本土派食道癌链请注意特性

均科结果起点OS、PFI、DFI和DSS

总猎食期(OS)很极为重要,灵活性是假设OS重大事件时模糊得病态最高。但适用OS用上起点显然削弱均科数据的资讯分析,因为非食道癌至疑点也就是说能看出出肿糙微生物学、洪水本土派滥得病态或对得病患缓解。适用OS或必需更是长的随访星期;很多均科试验中所,通常使用相比随访星期较短的DFI或PFI。针对这两项TCGA均科数据的资讯,要预见短时均科随访每条在洪水本土派滥得病态乳腺食道癌一般来说结果的优越得病态,因为显然几年内就肯定到到均科重大事件,在至幸存者前已用到得病情复发或困难重重。对洪水本土派滥得病态很强的乳腺食道癌一般来说,得病变在数十乃至几十年后复发,随访期近显然能够肯定到必要重大事件以赞成精确结果供正确。该量化的目的是核查TCGA本土派食道癌均科疗效检测的相比战术上和不足,指导今后的量化和尽量避免随访每条星期不足等有缺陷。

量化全部TCGA均科数据的资讯后,正确性如下:在数据的资讯可获得时,OS、PFI及DFI相比准确,但一般来说全然只能并不少DSS。所示1B为33种不尽不尽相同乳腺食道癌一般来说的OS K-M曲线。尽管猎食量化不是TCGA主要期望,一般来说乳腺食道癌一般来说猎食曲线与以前指标不尽相同猎食起点的独立数据的资讯分析各不不尽相同,GBM、OV(2008, 2011)和高级别胶质糙(LGG)(2015)的TCGA结果就是比较好可有证。PFI、DFI和DSS的K-M曲线见所示1C–1E。

所示1 B-E均科数据的资讯量化

基于每种乳腺食道癌一般来说4个起点的肯定到星期计算最低随访星期及重大事件或核查的中所位星期(请注意2)。所有肿糙的中所位随访星期为22.1个月底,但不尽不尽相同一般来说乳腺食道癌该星期相似之处很大;GBM和急得病态髓系白血得病(LAML)最短约12个月底,而脾嫌色线粒体食道癌(KICH)最长约48个月底。

请注意2 某种程度中所位随访星期及4个起点的重大事件与肯定到中所位星期

中选适用的均科结果起点

均科结果起点却是必须衡量数据的资讯分析期望、重大事件数量、链请注意大小不一和结果数据的资讯总质量。将这些方法有和共同开发的其它方法有用上为对单个结核得病数据的资讯库的次测试和足量核查,证明了在每种结核得病一般来说中所适用每个结果起点的决定及诱因(请注意3)。每种乳腺食道癌一般来说的猎食起点必须至多于通过一个主要次测试和足量核查才被不感兴趣。33种食道癌中所的13种适用全部4个起点:膀胱尿路上皮食道癌(BLCA)、内膜鳞状线粒体食道癌(CESC)、结肠食道癌(COAD)、食管食道癌(ESCA)、外周鳞状线粒体食道癌(HNSC)、脾乳突线粒体食道癌(KIRP)、大肠腺食道癌(LUAD)、LUSC、OV、大肠食道癌(PAAD)、肉糙(SARC)、食道腺食道癌(STAD)和睾丸内膜食道癌(UCEC)。相反,无法一个起点的有嗜铬线粒体糙和副结缔有组织糙(PCPG)。淋巴肿糙弥漫大B线粒体淋巴糙(DLBC)、LAML和胸腺糙(THYM)至少一个起点;多余乳腺食道癌一般来说2或3个起点,但其中所一些持疑问。最精确的是PFI,可无保留地中选给除LAML(无数据的资讯)、DLBC和KICH(严厉适用)和PCPG(不中选)均的4种肿糙。

请注意3 起点OS,PFI,DFI及DSS的指标与中选适用

可验证TCGA-CDR及案可有运用于

在乳腺食道癌数据的资讯分析中所,雄激素ER阴得病态得病变均科猎食期得病状比ER+肿糙得病变差。分别用OS、PFI、DFI和DSS相当这两类肿糙得病变的猎食期(所示3A–3D;曲线截止于10年随访星期,但适用整个数据的资讯库来进行量化)。单因素所量化结果显示,适用PFI(p= 0.005)和DFI(p = 0.001)用上为均科起点,TCGA中所ER+乳腺食道癌得病变比ER-得病变有更是好的猎食期,但适用OS时两类得病变近不依赖于相似之处(p = 0.097) 。此均,两类得病变的DSS(p = 0.009)有很大相似之处,说明了DSS的潜在价值。以上发现断定了PFI和DFI是特定一般来说乳腺食道癌底物数据的资讯分析的较好起点。

所示3 可验证和运用于实可有

此均还可验证了洪水本土派滥得病态GBM猎食结果起点。TCGA中所GBM中所位OS为12.6个月底,介于年末路透社的从新标准得病患的12.1个月底和从新标准得病患共同替莫唑胺的14.6个月底彼此之近。中所位PFI是6.1个月底,介于年末路透社的从新标准得病患5个月底和从新标准得病患共同替莫唑胺的6.9个月底彼此之近。看来,TCGA数据的资讯库OS和PFI重大事件星期与文献一致。终于窥见OS和PFI用上为GBM底物数据的资讯分析的均科起点效度。

用Cox比可这样一来得病态紧接著框架仍未确定高期(III、IV期)相比高期(I、II期)乳腺食道癌得病变的显然得病态比(HR),可验证4个起点的TCGA-CDR数据的资讯。由于DFI假设与其它结果的假设不一致,对中选适用OS、PFI和DSS的14种一般来说乳腺食道癌相当logHR(请注意3)。随后至少对意味着Cox比可这样一来得病态举例的结核得病来进行人口统计(所示3E–3G)。结果说明了,14种一般来说乳腺食道癌中所,除近皮糙(MESO)、PAAD和葡萄膜黑色素糙(UVM)均,高期对比高期HR在3个中选起点OS、PFI及DSS上轻微极差。使用选取样品的Wilcoxon秩和鉴定,当适用PFI与DSS(p = 0.0008)或PFI与OS(p = 0.039)测量时,logHR有很大相似之处,结果显示结核得病困难重重和猎食起点在HR上依赖于管理系统偏移;OS与DSS彼此之近无法很大相似之处(p = 0.106)。对2个logHR值的从新标准误来进行反为加权最低仍未确定Pearson之外系数, 由logHR并不少的3种结果有极很大正之外:PFI和OS之外系数0.96(95%置信区近[CI]:0.77–0.99),PFI和DSS为 0.95(95%置信区近:0.76–0.99),OS和DSS为0.90(95%置信区近:0.61–0.98)。这些之外得病态潜在赞成均科中期用PFI,初用OS和DSS认真起点。

除了为基础底物数据的资讯,还尝试量化首次得病患后无得病得病变与非无得病得病变前提用到不尽不尽相同的从新肿糙重大事件。TCGA-CDR中所29类乳腺食道癌数据用作应对该问题,确立得病变从确诊到完毕首治并超出无得病状况至多于活到3个月底。以LUSC为可有,有289可有无得病得病变和41可有一直非无得病得病变,NTE率分别为21.8%和68.2%。用Cox比可这样一来得病态紧接著框架,发现在非无得病得病变中所NTE显然得病态很大高于无得病得病变(HR = 6.68,95% CI = 4.25–10.51,FDR调整q值<0.05)。在另均21种乳腺食道癌一般来说中所也有类似结果(请注意4)。余下7种肿糙中所无法肯定到到这些相似之处。我们也在指标前提每个框架都意味着比可这样一来得病态举例,其中所有两个不适用,必须数据的资讯分析星期依赖及多请注意达式框架来寻找诱因。

请注意4 非无得病与无得病得病变NTE发展对比

TCGA从亚太地区数百个站内得来得病可有,为应对均科数据的资讯不尽不尽相同站内近的可比得病态,必需权衡数据的资讯完整得病态、肿糙和得病变特性等。对每种结核得病而言,我们对比了前两名给予得病可有数最多的有组织来源站内(TSS)与所有其它TSS的同种结核得病及4个结果起点(请注意5)。

请注意5 对来自前两位TSS的每个乳腺食道癌一般来说数据的资讯分析结果来进行相当

对于GBM等极富洪水本土派滥得病态的肿糙,前两位TSS(#1和#2)的发得病老年人与其它TSS相较类似的有OS、PFI和DSS,因重大事件不算多于难以量化不中选DFI认真起点。BRCA等较高洪水本土派滥得病态肿糙,强力中选适用PFI和DFI,但决定严厉用OS或DSS指标。TSS #1的均科数据的资讯显现出不不算好的OS和DSS,但无法肯定到到PFI相似之处;另均,请注意面上TSS#1有更是好的DFI结果,至少用到3可有 DFI重大事件。这种请注意里不一的震荡说明了该站内的结果数据的资讯必需更进一步性指标。另一多方面,TSS #2的4个起点结果与其它以外一致。

这个简单的结果相当说明了,当从特定结果量化主体TCGA的均科数据的资讯时,必须权衡TSS的具体数据。由于岁数、肿糙分期/PG及得病患等因素所受到影响不尽不尽相同TSS患得病老年人的起点结果,TSS可以用上为这些和不全然均科译文等其它仍未测量相似之处的替代。

潜在的混杂因素所、竞争得病态结果的

显然得病态及框架举例

对均科猎食起点量化来说,决定适用所处理的全部均科数据的资讯。但相较底物/线粒体数据的资讯的为基础量化,要肯定两个多方面。首先,中选对此基于星期延迟猎食框架,以底物免疫球蛋白用上预见因子划分样品集,这样一来毁坏结果人口统计的很大得病态相似之处。因此,从之外联的TCGA底物数据的资讯或肿糙免疫球蛋白TCGA-CDR结果数据的资讯中所算出的正确性必需在独立的肿糙数据的资讯库中所更进一步性断定。

第二,我们决定至少适用原发肿糙的底物数据的资讯,因为得病变初诊时,极为重要星期数据等比如说的均科数据的资讯已得来相比完整。黏膜黑色素糙(SKCM)在TCGA肿糙一般来说中所并不特殊,470可有肿糙中所至少103可有原发肿糙,其余296可有为原发肿糙发散支气管重从新分配,68可有远端重从新分配。这与很多于得来到重从新分配糙的其它TCGA乳腺食道癌一般来说形成近来。SKCM重从新分配糙很多于较强比如说的原发肿糙,而其它TCGA乳腺食道癌一般来说尽管很多于有重从新分配糙,但都较强比如说的原发样品。因此,对于SKCM结果的之外得病态,决定只适用有限数量的原发得病可有,尽管SCKM支气管重从新分配的III期得病可有可用上为独立组群来进行数据的资讯分析。

在适用从新为基础的TCGA-CDR数据的资讯库时,还必须肯定:潜在搞混因素所、竞争得病态结果的显然得病态及框架举例。

混杂因素所

混杂因素所依赖于但被排除在框架之均时,偏移显然高估或高估主观疗效。如在乳腺食道癌的种族相似之处数据的资讯分析中所,有色人种与黑人得病变彼此之近依赖于极为重要的基因请注意达相似之处,然而根据底物免疫球蛋白来进行调整后,这种相似之处很大减多于甚至消逝。得病患效果也是潜在的混杂因素所,当数据可获取时应适当权衡调整。得病患确实时,岁数、诊治医院及确诊年份等从新标准得病患用上为替代数据能减多于部分测量误差。对这多方面的决策建模,激励适用肿糙圣万得病状数据的资讯分析决定报告(REMARK)。

竞争得病态结果的显然得病态

测DSS、DFI和PFI起点时,要对无法历程极为重要重大事件且无得病的至幸存者得病变来进行审查。在这种全然,如果举例得病变无法其它至疑点,那她/他再一仍显然至死于乳腺食道癌指征。然而,在并不少得病患等预见因子对继发得病态乳腺食道癌或心血管结核得病等非从新标准普尔乳腺食道癌至幸存者显然得病态的预见能力时,该举例却是可取。

框架举例

运用于Cox比可这样一来得病态(PH)框架必须核查PH举例。除多于数案可有均,大一般来说框架都意味着Cox PH举例,但必需更进一步性揭示这些医疗事故以找出违反举例的诱因,从而对HR认真出更是准确的并不少。尽管仍仍未为清理数据的资讯和应对问题忍耐了巨大奋斗,但仍依赖于极为重要的适用限制,会见TCGA均科数据的资讯都必须了解这些限制。

首先,TCGA主要是为底物数据的资讯分析设计,在此之后得病可有却是必须来自多个行政部门较强较好存货有组织的仍未得病患原发得病可有,因此这些得病可有不相关联连续得病态。此均,对于每种不尽不尽相同肿糙一般来说/数据的资讯分析,随访数据的资讯无法统一得来。同时,均科数据的资讯得来的一些游戏规则在以前一再随着星期的推移而转变。TCGA - CDR不包含乳腺食道癌得病患史,并非所有得病可有都被译文。因此,量化特定肿糙一般来说或免疫球蛋白的得病患取材优于统计数据得病态本土派食道癌量化。当得病变来进行具体得病患时,受益只用DFI和PFI起点合理量化。

其次,TCGA样品均科随访根据当地诊所的星期请注意,显然为结核得病或特定部位的复发和得病人极为重要生命状况的记录,因此无法TCGA指定的均科随访构想,至少证明了项目主要突显的肿糙底物特性。

之后,几乎所有TCGA获得的肿糙样品和线粒体及底物数据的资讯来自从新诊得病变原发肿糙的单个切开,由此显现出的线粒体和底物数据的资讯无法在三维空近或星期任何多方面确实猎捕代请注意另一得病变结果请注意达式的肿糙异质得病态。该问题不是TCGA独有的,任何连贯性原发得病态肿糙数据的资讯分析都依赖于。

远景

这项工用上是迄今为止第一次更进一步管理系统性处理TCGA本土派食道癌均科的资讯。由此显现出的TCGA-CDR的结果起点与独立非TCGA数据的资讯分析结果一致,说明该人力在空前规模的均科微小上给予了微生物观测从新视角。也要预见TCGA-CDR的内在适用局限得病态及最重要得病态指导和中选对此。仍仍未并不明晰,人类结核得病仍未来大规模的底物数据的资讯分析必须管理系统性得来均科得病理、得病患和原属重大事件数据的资讯,以坚持最高者从新标准的均科数据的资讯分析。尽管有其局限得病态,TCGA-CDR给予了规范数据的资讯库,以及清晰的4个均科结果起点给定,并应对了总质量问题,从而在本土派食道癌和个体水准上来进行生成数据的资讯分析。仍未来数据的资讯数据的资讯分析的混合将提高结果彼此之近的可比得病态,更是好地解释和赞成重复。

参考的资讯

An Integrated TCGA Pan-Cancer Clinical Data Resource to Drive High-Quality Survival Outcome Analytics

TAG:
延伸阅读
月经量少的原因 妇科疾病会所致这个症状
多数的异性恋朋友都时会有月底经量寡的症状注意到,引致月底经量寡的主因有很多,在平时我们一定要同样避免这个持续性。一旦注意到了月底经量寡...[详细]
2022-05-05
Science:ILC -III介导化学物质特异性T细胞“阴性选择”
针对自身抗体的T巨噬细胞是自身免疫疾病的主要原因,因而在正常柱状态下,针对自身抗体的T巨噬细胞在成熟早先就在上皮细胞之中被机识别系统并写...[详细]
2022-05-04
子宫上皮细胞厚度多少正常 不同时期厚度不同但别超过这个值
卵巢乳腺是成年人卵巢的一层有组织,卵巢乳腺过很厚和过裹都不好,卵巢乳腺很直径多少较长时间?卵巢乳腺裹对四肢的直接影响挺大的,这个时候要怎...[详细]
2022-05-03
鼻腔内陷是怎么回事 鼻腔内陷内外大气压不一样
腹腔是逐步形成助听器的一个举足轻重器官,腹腔显现内陷就不会造成助听器显现升高,腹腔内陷是刚才?腹腔内陷均高温不一样。腹腔是什么腹腔,位...[详细]
2022-05-02
Stroke:Takayasu动脉炎患者的脑血管发炎事件
Takayasu动脉炎(TA)是免疫特异性的血管炎,其形态是主干线病态疾病病态瘙痒。TA是一种可能并发冠状动脉功能障碍重大事件的大血管炎。近日,心血管...[详细]
2022-05-02
来月经有伤口怎样调理 两妙招解决女人病
元月又称之为例假、大姨妈等,医称阴部。一般理由下元月的天数是7天。但是如今社亦会压力大,很多女人元月开始不正常,来元月有切开怎样良药呢?...[详细]
2022-04-28
哑的早期症状 常见还是不常见
光是男性疾病常见,其肺癌通常展示出为急性光发作,如果不及时病人常常就会转型成慢性。所以的更早呕吐通常展示出为急性光的展示出。由于此阶段...[详细]
2022-04-27
临产前吃调味品可致子宫破裂
很多人都偏爱进食调料,因为他们觉得调料可以诱导他们的口感。然而,妊娠作为一个一般来说的群体,刚才可不可以进食调料呢?调料的营养素每100克的...[详细]
2022-04-26
甲硝唑 VS 替硝唑,只是一字之差吗?
问题解析:甲硝唑和替硝唑是临床上常用的抗菌药物。它们不仅名字不同,而且在药物使用上也非常相似。即便如此,还是要区分两者的使用,规范临床...[详细]
2022-04-25
  • 地区医院
  • 医院联盟