搜索
您的当前位置:首页正文

seq 转ID 遇到的问题

来源:二三娱乐
image.png

由上图可知,fq文件在进行比对时,他的顺序是发生了改变的。同时Sam文件中的序列和原始的fq文件中的序列是有一部分出入的,我不知道如何解决这个问题,如何将原序列和比对后的结果进行对号入座。
因为在ID转换过程中,这个序列信息是要作为唯一的ID,在各个文件中起到桥梁作用,不解决这个问题,后续的分析必然会损失掉一些数据。

Sam文件 原始seq数据无法精确比对
最终还是丢失了2万个基因的数据

此外,同一个序列信息可能match到多个gene——symbol,所以,我的意见是都要保留下来

image.png
Top