全面(miàn)的基因組覆蓋範圍:檢測>853,307個CpG位點,全面(miàn)覆蓋CpG島、啓動子、編碼區及增強子
高質量的數據:沿用了450k芯片的Infinium技術,同時(shí)采用Infinium I及II探針設計,使檢測範圍最大化
分辨率高:單堿基分辨率,可以直接檢測到發(fā)生甲基化的準确位點
可重複性高:自身技術重複間的相關性以及與450K相同探針間的相關性R2 >0.98
起(qǐ)始模闆量低: 僅需 250ng,大大節約了樣品量
适用于FFPE樣品
樣本類型
動、植物組織、細胞等
每個樣品總量不少于2ug,最低濃度不低于50ng/ul,OD 260/280值應在1.7~1.9 之間,
基因組完整、無降解、無RNA污染。
A:進(jìn)入亞硫酸氫鹽轉化,手動方案至少需要500 ng,自動化方案至少需要1000 ng。
A:這(zhè)是一種(zhǒng)雙色測定。對(duì)于基于Infinium I Assay設計的Infinium HumanMethyation27 BeadChip測定,摻入的顔色取決于被查詢的CpG基因座之前的堿基。這(zhè)可以是綠色或紅色。Infinium HumanMethylation450 BeadChip測定包括Infinium I和Infinium II研究設計。在後(hòu)一種(zhǒng)情況下,從探針序列的3'末端(其是查詢堿基上遊的一個堿基)的單個堿基延伸將(jiāng)導緻紅色或綠色信号,這(zhè)取決于查詢位點是否未甲基化或甲基化。
爲了探索I期非小細胞肺癌(NSCLC)可利用的生物标志物,本案例采用 Illumina 450K甲基化芯片對(duì)444例非小細胞肺癌樣本進(jìn)行研究,發(fā)現了10000個甲基化差異位點。基于這(zhè)些位點進(jìn)行非監督層次聚類分析,可以將(jiāng)患者明顯區分爲預後(hòu)好(hǎo)壞兩(liǎng)類。
圖1. 非小細胞肺癌樣本的非監督層次聚類分析
本案例利用Illumina 450K甲基化芯片研究了多發(fā)性硬化影響的腦組織與正常腦組織的DNA甲基化差異,結果發(fā)現甲基化差異細微,但是差異是普遍存在的并且具有可重複性。通過(guò)RNA-seq研究發(fā)現,多發(fā)性硬化影響的腦組織相比正常腦組織,調節少突膠質細胞存活的基因,如BCL2L2和NDRG1是高甲基化的并且基因表達水平較低;而與蛋白水解加工相關的基因,如LGMN和CTSZ則是低甲基化并且基因表達水平較高。這(zhè)些結果表明基因甲基化程度的改變會(huì)影響腦組織對(duì)于損傷的敏感性。
圖2. mRNA表達水平與啓動子甲基化相關性分析
[1] Sandoval J, Mendez-Gonzalez J, Nadal E, et al. A Prognostic DNA Methylation Signature for Stage I Non–Small-Cell Lung Cancer. Journal of Clinical Oncology, 2013; 31(32): 4140-4147.
[2] Huynh J, Garg P, Thin T, et al. Epigenome-wide differences in pathology-free regions of multiple sclerosis- affected brains. Nature neuroscience, 2014; 17(1): 121-130.
在全世界分範圍内,每年因肝癌死亡的病例超過(guò)50萬人,是主要的因癌死亡病因之一。在過(guò)去的十年中,随著(zhe)影像學(xué)的進(jìn)步以及健康體檢的普及,越來越多的肝癌病人在患病早期被發(fā)現。但由于肝髒捐贈者的短缺,外科肝髒切除術仍然是治療早期肝癌病人的最主要方法。本研究建立了一種(zhǒng)預測早期肝癌病人術後(hòu)複發(fā)的模型。
1. CpG位點選擇
研究者首先采用焦磷酸測序技術驗證了450k芯片數據的再現性。通過(guò)分析66例病人的FFPE樣本和新鮮冷凍組織樣本發(fā)現,随機選擇的兩(liǎng)個CpG位點甲基化水平呈現出高度的一緻性。采用△β>0.15,FDR<0.01和p value<0.01這(zhè)一标準,過(guò)濾450K芯片結果,得到2550個差異CpG位點。随後(hòu),研究者爲了區分高風險和低風險的病人,采用LASSO和SVM-RFE算法分别得到了30個差異最顯著的CpG位點。
2. 探究可預測的标簽
通過(guò)比較兩(liǎng)種(zhǒng)算法得到的CpG位點,發(fā)現有14種(zhǒng)是同時(shí)被鑒定出的,46種(zhǒng)是不同的。通過(guò)分析46種(zhǒng)不同CpG位點,把66例樣本分成(chéng)複發(fā)和不複發(fā)兩(liǎng)個亞類。研究者随後(hòu)采用Cox回歸模型在訓練組中進(jìn)一步縮小了E-HCC病人的甲基化檢測位點。結果發(fā)現,cg20657849(SCAND3), cg19406367(SGIP1), 和 cg19931348(PI3)三個甲基化位點與E-HCC病人複發(fā)高度相關。
随後(hòu)研究者采用焦磷酸測序技術,分别在訓練組和鑒定組中量化這(zhè)一發(fā)現。爲了更好(hǎo)的研究這(zhè)三個CpG位點用來預測E-HCC複發(fā)的準确性,在訓練組中設定了一種(zhǒng)危險系數評分。(risk score = (0.104 ×SGIP1甲基化水平) + (-1.125 ×SCAND3甲基化水平) + (-0.085 × PI3甲基化水平))研究發(fā)現,-0.401爲risk score阈值。
3. 證實這(zhè)一标簽
爲了證實這(zhè)一模型的穩定性,研究者分别在一組内部樣本和兩(liǎng)組外部樣本進(jìn)行了檢測。在内部樣本中,該模型成(chéng)功的分類了68例複發(fā)高風險病人,73例低複發(fā)風險病人。在外部樣本中,同樣成(chéng)功分類了高風險和低風險病人。ROC分析發(fā)現,MSEH預測早期肝癌病人複發(fā)比三個CpG位點單獨檢測更有效。
4. 建立可預測的諾模圖
爲了建立臨床上适用的用來預測個體複發(fā)的模型,綜合考慮了協變量後(hòu),研究者用諾模圖建立了可以用來預測的模型。基于RFS的多變量分析,研究者生成(chéng)了一個諾模圖預測患者的5年生存率,通過(guò)三個校正點的檢測均得到理想結果。
本文通過(guò)分析早期肝癌患者甲基化芯片結果,得到三個與早期肝癌患者複發(fā)相關的CpG位點,并通過(guò)訓練組和驗證組優化了這(zhè)一預測模式。最終,研究者建立了一種(zhǒng)諾模圖,用來預測早期肝癌患者的術後(hòu)複發(fā)風險。
案例四:甲基化研究揭示鼻咽癌治療新靶點
在中國(guó)華南地區,鼻咽癌有較高的發(fā)病率。目前,鼻咽癌病人的治療方案主要取決于病人的TNM分期。但是,約30%的鼻咽癌
甲基化高級分析A. 甲基化與表達譜相關性熱圖,此類型的圖也可展示其他不同組學(xué)的相關性。B. 基因組、轉錄組與甲基化組變異通路圖,可在同一張圖上展示通路中的基因組、轉錄組與甲基化組等不同組學(xué)上的變異,以及多組學(xué)的變異對(duì)通路的影響。C. 關鍵基因的多組學(xué)相關性圖,以相關性圖的形式,同時(shí)展示關鍵基因在基因組、轉錄組與甲基化等多組學(xué)層面(miàn)上的相關性,共變異或甲基化狀态。
HYBRIDIZATION 雜交圖中橫軸是log2(信号值),縱軸是樣本名稱。紅色熒光表示未甲基化位點的log2(信号值),綠色熒光表示甲基化位點的log2(信号值)。結論:紅色熒光和綠色熒光的差值一般是2個數量級。陽性參照中綠色探針産生的log2(信号值) >12,标記實驗成(chéng)功。
樣本質控圖橫軸是log2(甲基化中位數值), 縱軸是(非甲基化中位數值),每個樣本的整體甲基化程度一個圓點表示,其在虛線右上角分布則表示達到質控的标準。結論: 本研究全部樣本達到質控的标準。