全長(cháng)轉錄本測序基于單分子實時(shí)測序Pacbio Sequel平台,超長(cháng)讀長(cháng)可獲得mRNA全長(cháng)序列及完整結構信息。克服無參考基因組物種(zhǒng)轉錄本拼接短、信息不完整的難題,實現有參考基因組物種(zhǒng)研究可變剪切及融合基因等結構變異。
技術優勢
平台優,質量好(hǎo),性價比高。
基于小而強大的Pacbio Sequel平台,獲取mRNA全長(cháng)序列,
文庫構建時(shí)無需將(jiāng)轉錄本打斷,信息分析無需組裝,精準重構轉錄組全貌。
科學(xué)方案設計:從材料選取,建庫測序,到數據分析,每一步都(dōu)需要科學(xué)、缜密的設計,以保障高質量研究成(chéng)果.
技術路線
分析内容
樣本類型
由于是測全長(cháng),所以比二代轉錄組測序實驗對(duì)RNA質量的要求更高。
樣品量:總RNA>5 ug/文庫;總量>15 ug(3個文庫);
樣品純度:OD260/280≥1.8,OD260/230≥1.0,260nm處有正常峰值;
RNA 完整性:總RNA的RIN值≥8.0,28S/18S≥1.3;圖譜基線無上擡;5S峰正常
Q1:全長(cháng)轉錄組測序中,爲什麼(me)要建3個以上文庫?
A:全長(cháng)轉錄組采用單分子實時(shí)測序技術,通過(guò)構建啞鈴型文庫,以環形方式循環測序。測序時(shí),短片段文庫更容易落入零模波導孔。爲了避免測序過(guò)程中短片段文庫偏好(hǎo)性,保證不同長(cháng)度轉錄本的覆蓋度,因此,會(huì)構建3個或3個以上文庫。
Q2:全長(cháng)轉錄組是否需要打斷,拼接?
A:全長(cháng)轉錄本是包括從5`末端到3`-poly A tail的,包括mRNA全長(cháng)序列以及完整結構信息的完整轉錄本,片段集中分布于1-6kb,sequel平均讀長(cháng)在12kb左右,最長(cháng)的文庫都(dōu)可以測至少一遍,所以建庫前不需要打斷,後(hòu)期分析也無需拼接,得到的就(jiù)是完整的mRNA。
研究背景
高粱是世界上非常重要的C4作物,也是重要的耐脅迫的谷類,重要的研究非生物脅迫的模式生物。本研究以高粱爲研究材料,采用Pacbio的Iso-Seq策略,調研高粱轉錄組特征,改進(jìn)高粱基因集注釋。
研究結果
1. AS事(shì)件分析
本研究發(fā)現,有10,053個isoform經(jīng)曆了AS事(shì)件,其中隻有2,950個isoform和現有的基因模型吻合。Pacbio數據結果證實高粱轉錄組AS事(shì)件比之前的認知更爲普遍。同時(shí),文章對(duì)在Pacbio中的多isoform的基因做了RT-PCR驗證,證實了結果的可靠性。
2. APA事(shì)件分析
APA事(shì)件是在編碼區或3’-UTR區形成(chéng)isoform,提高轉錄本的複雜性。由于單分子測序技術利用Oligo dT引物合成(chéng)cDNA,poly(A)會(huì)出現在測序結果中。因此,單分子測序技術是研究APA的有力工具。本文發(fā)現在已表達的14,550個基因中,11,013個至少有1個poly(A)位點。
3. 新基因發(fā)現
原來的參考基因集有~34,500個基因。在該研究中預測到2171個可能(néng)的新基因。爲了鑒定這(zhè)些新基因是否在其他物種(zhǒng)中存在,我們使用BLAST中的tblastx和blastx分别比對(duì)到收集的植物cDNA序列和Swiss-Prot蛋白數據庫,共檢測到971個基因。爲了證明這(zhè)些新基因的表達,随機選擇7個基因并用RT-PCR驗證,證實了新基因的表達和剪切。
圖 Iso-seq和已注釋的不同可變剪切類型的比較
參考文獻
Abdelghany S E, Hamilton M, Jacobi J L, et al. A survey of the sorghum transcriptome using single-molecule long reads[J]. Nature Communications, 2016, 7:11706.