外顯子組(Exome)是一個物種(zhǒng)基因組中全部外顯子(Exon)區域的總和,該區域包含著(zhe)合成(chéng)蛋白質所需要的信息,涵蓋了與個體表型相關的大部分的功能(néng)性變異。外顯子組測序&目标區域測序是指利用特制的探針對(duì)感興趣的蛋白編碼區域DNA或某段特定序列進(jìn)行富集,随後(hòu)通過(guò)高通量測序技術對(duì)該目标區域進(jìn)行深度測序,發(fā)現特定遺傳信息,極大提高了基因組中外顯子&目标區域的研究效率,顯著降低了研究成(chéng)本。該技術可用于鑒定和研究孟德爾疾病,複雜疾病如癌症、糖尿病、肥胖症等的緻病基因和易感基因,進(jìn)行群體研究,如人類罕見遺傳變異,腫瘤突變基因研究等,幫助研究人員更好(hǎo)地解釋這(zhè)些疑難雜症的緻病機理。
高捕獲效率:采用捕獲效率更優異的Agilent Human SureSelect V6 kit(58M)進(jìn)行外顯子組捕獲。
可靠的基因突變鑒定方案:采用不同的針對(duì)性方案進(jìn)行遺傳病與腫瘤突變基因的可靠鑒定。
權威的突變鑒定軟件:采用權威的GATK,muTect,VarScan2等軟件更準确鑒定突變。
人的細胞,組織,全血,總DNA等
建議總DNA起(qǐ)始量:5 μg,最低1 μg,濃度≥50 ng/μL(Qubit定量)
A:基因組拷貝數變異是基因組變異的一種(zhǒng)形式,通常使基因組中大片段的DNA形成(chéng)非正常的拷貝數量。例如人類正常染色體拷貝數是2,有些染色體區域拷貝數變成(chéng)1或3,這(zhè)樣,該區域發(fā)生拷貝數缺失或增加,位于該區域内的基因表達量也會(huì)受到影響。如果把一條染色體分成(chéng)A-B-C-D四個區域,則A-B-C-C-D/A-C-B-C-D/A-C-C-B-C-D/A-B-D分别發(fā)生了C區域的擴增及缺失,擴增的位置可以是連續擴增如A-B-C-C-D也可以是在其他位置的擴增,如A-C-B-C-D。
A:相對(duì)于遺傳病而言,腫瘤組織樣品中突變位點的等位基因頻率較低,一方面(miàn)由于腫瘤細胞在腫瘤組織中的占比偏低,另一方面(miàn)則由于癌症發(fā)展後(hòu)期産生的突變僅存在于極少量的腫瘤細胞中,采用高深度測序可以盡可能(néng)全面(miàn)的檢測到與癌症發(fā)生發(fā)展相關的變異。通常推薦的外顯子測序深度爲,癌組織大于150x,癌旁組織/血液大于50x。
A:建議有效測序深度在100x以上。有文獻顯示外顯子組測序深度會(huì)影響變異檢出率,随著(zhe)測序深度的升高,變異檢出率增大,且達到一定深度時(shí),變異檢出達到平穩狀态。
心肌梗塞(Myocardial infarction,MI)是一種(zhǒng)在全世界範圍内緻人死亡的常見原因,表現爲一種(zhǒng)複雜的遺傳模式。當MI發(fā)生于人生早期(男性≤50歲發(fā)病,女性≤60歲發(fā)病),遺傳因素是主要的風險因素。之前的研究發(fā)現,LDL(low-density lipoprotein)基因上的罕見變異增加單個家庭中的成(chéng)員發(fā)生MI風險,而其常見變異與人群中的MI風險相關。該研究關注LDL基因上的罕見變異是否會(huì)增加人群在早期發(fā)生MI的風險。
研究人員通過(guò)結合外顯子組測序、基因芯片、靶向(xiàng)測序在大量疾病和對(duì)照樣本的篩選與MI相關的罕見變異(需要至少10000樣本量才能(néng)達到80%的統計功效)。研究人員再對(duì)篩選到的罕見變異(MAF<1%)進(jìn)行分組,包括Nonsynonymous、Deleterious(PolyPhen)、Deleterious(broad)、Deleterious(strict)和Disruptive組,采用Burden檢驗法對(duì)這(zhè)些罕見變異集合進(jìn)行關聯性分析找出與MI顯著相關的罕見變異,最後(hòu)通過(guò)計算OR值判斷這(zhè)些罕見變異導緻MI的風險。經(jīng)過(guò)分析發(fā)現MI患者的2個基因含有罕見變異的頻率顯著高于正常人。攜帶LDLR(low-density lipoprotein receptor)罕見非同義突變患MI風險比正常人高4.2倍,攜帶LDLR 無義突變患MI的風險高13倍。大約2%的早期MI患者LDLR基因含有罕見緻病突變。攜帶APOA5基因罕見非同義突變患MI的風險增加2.2倍。與非攜帶者相比,LDLR突變攜帶者的血漿LDL膽固醇較高,APOA5突變攜帶者的血漿甘油三酯較高。總結其它研究結果來看,脂蛋白甘油三酯以及LDL膽固醇代謝紊亂會(huì)增加MI患病風險。
圖1 (a)通過(guò)對(duì)9793例樣本進(jìn)行測序發(fā)現位于LDLR的罕見變異(包括MAF<1%的包括無義變異、可變剪切變異、移碼變異)。(b) 在不同罕見變異分組中患者的LDL膽固醇水平。
Do, R., et al., Exome sequencing identifies rare LDLR and APOA5 alleles conferring risk for myocardial infarction. Nature, 2015. 518(7537): p. 102-6.
與基因組比對(duì)(覆蓋度、測序深度)樣品比對(duì)率是指比對(duì)到參考基因組上的數據量占有效測序數據量的比值,反映樣本與參考基因組的相似性。測序深度是指比對(duì)到參考基因組的堿基總數占基因組的比值;覆蓋度是指被測到的該物種(zhǒng)基因組堿基總數占該物種(zhǒng)基因組長(cháng)度的百分比。
SNP分析SNP全稱Single Nucleotide Polymorphisms,是指在基因組上單個核苷酸的變異,形成(chéng)的遺傳标記,其數量很多,多态性豐富。基因組上單 個核苷酸的變異包括置換,缺失和插入。采用FreeBayes對(duì)各樣品比對(duì) 結果進(jìn)行個體SNP的檢測。
InDel分析InDel (Insertion-Deletion) 是指相對(duì)于參考基因組,樣本中發(fā)生的小片段的插入缺失,該插入缺失可能(néng)含一個或多個堿基。根據InDel在基因組中的位置,可以分爲編碼區序列的InDel和非編碼區序列的InDel。編碼序列中的InDel發(fā)生與編碼蛋白質的功能(néng)和氨基酸位點在結構和功能(néng)上的重要性有關。采用FreeBayes對(duì)各樣品比對(duì)結果進(jìn)行個體InDel的檢測。