本發(fā)明提出了一種基于自適應(yīng)編碼順序的DNA測序質(zhì)量分?jǐn)?shù)無損壓縮方法,主要解決現(xiàn)有質(zhì)量分?jǐn)?shù)壓縮方法預(yù)測模型不夠準(zhǔn)確導(dǎo)致壓縮率偏低的問題。其實(shí)現(xiàn)方案為:1)通過兩個(gè)編碼壓縮塊P
1和P
2提取FASTQ文件中的質(zhì)量分?jǐn)?shù)數(shù)據(jù)和堿基數(shù)據(jù);2)計(jì)算第一編碼壓縮塊P
1所提取文件中每行質(zhì)量分?jǐn)?shù)的均值并進(jìn)行量化,得到M×1的行均值矩陣F;3)統(tǒng)計(jì)編碼字符的上下文信息、堿基信息和行均值信息,4)設(shè)置兩個(gè)標(biāo)識(shí)符C和D,并對(duì)3)統(tǒng)計(jì)的信息統(tǒng)一量化,以構(gòu)建編碼模型;5)用編碼模型驅(qū)動(dòng)自適應(yīng)算數(shù)編碼器,并采用蛇形編碼順序沿相關(guān)性最強(qiáng)的方向?qū)Φ谝痪幋a壓縮塊P
1進(jìn)行遍歷壓縮。本發(fā)明提高了壓縮效率,可用于基因數(shù)據(jù)的存儲(chǔ)與傳輸。
聲明:
“基于自適應(yīng)編碼順序的DNA測序質(zhì)量分?jǐn)?shù)無損壓縮方法” 該技術(shù)專利(論文)所有權(quán)利歸屬于技術(shù)(論文)所有人。僅供學(xué)習(xí)研究,如用于商業(yè)用途,請聯(lián)系該技術(shù)所有人。
我是此專利(論文)的發(fā)明人(作者)