搜索
您的当前位置:首页正文

gencode的v25 gtf和v29gtf gene差异的统计

来源:二三娱乐

下载数据

image.png

统计命令

less -S /public/reference/gtf/gencode/gencode.v25.annotation.gtf.gz|grep -v '#'|awk '$3=="gene"'|cut -f 1|sort|uniq -c >1.gene 
less -S gencode.v29.annotation.gtf.gz |grep -v '#'|awk '$3=="gene"'|cut -f 1|sort|uniq -c >2.gene
paste 1.gene 2.gene |awk -v OFS="\t" 'BEGIN{print "#gencode download gtf\n#Chr\tv25.gtf.gene_num\tv29.gtf.gene_num\tv29-v25"}{print $2,$1,$3,$3-$1}'|sed 's/^[ \t]*//g'|less -S
image.png

按类别统计差异

因为gtf里面包含很多pro_coding或者non_coding的gene ID,因此我们需要在统计的时候,根据第九列更多的信息,将gene进行再细小的分类,然后在统计一些v25,与v29版本的差异~~

Top