created: 2022-05-23
GTF/GFF
GTF
- GTF (General Transfer Format)
- ゲノム上の位置に関するアノテーション情報
- GTFはGFFのversion2と同一
- tab区切り、空のカラムは.(ドット)で埋める
$1: | seqname | 染色体名やscaffold名、chrはなくてもよい |
$2: | source | featureを作製したprogram/data source名 |
$3: | feature | featureのタイプ名 |
$4: | start | featureの開始位置 |
$5: | end | featureの終了位置 |
$6: | score | 浮動小数点値 |
$7: | strand | +(fwd)|-(rv) |
$8: | frame | 読み枠(0|1|2),0なら最初の塩基がコドンの最初の塩基 |
$9: | attribute | featureの追加情報、セミコロン区切りのタグ値 |
GFF
- General Feature Format
- fileの1行目に##gff-version 3と記載する
- tab区切り, .で空のカラムを埋める
$1: | seqid | 染色体名やscaffold名、chrはなくてもよい |
$2: | source | featureを作製したprogram/data source名 |
$3: | type | featureのタイプ名, SOFAにあるtermまたはaccession |
$4: | start | featureの開始位置 |
$5: | end | featureの終了位置 |
$6: | score | 浮動小数点値 |
$7: | strand | +(fwd)|-(rv) |
$8: | phase | 読み枠(0|1|2),0なら最初の塩基がコドンの最初の塩基 |
$9: | attributes | featureの追加情報、セミコロン区切りのタグ値 |