ReferenceSequence是 HTSJDK 库中的一个类,用于表示基因组参考序列的一个特定区域。它是处理参考基因组数据时的关键类,提供了对参考序列的访问和操作功能。
ReferenceSequence类概述表示参考序列:
ReferenceSequence类封装了参考基因组中某个 contig(染色体或 contig)的序列数据,包括序列的名称、起始位置以及实际的核苷酸序列。提供序列数据:
序列名称和位置:
getName():返回参考序列的名称(即 contig 名称)。getStart():返回序列的起始位置(1-based)。getEnd():返回序列的结束位置(1-based)。序列数据:
getBaseString():返回参考序列的核苷酸字符串(即序列本身)。例如,"ACGT"。getBases():返回参考序列的碱基数组。