Tomlab Blog

created: 2022-04-25

BED (Browser Extensible Data)

https://genome.ucsc.edu/FAQ/FAQformat.html

UCSC Geneme Browserで使用されてきたformat
header lines: begin with the word "browser" or "track"

前の3カラムは必須、後の9カラムはオプション
space/tab区切り

  $1 : chrom      染色体名やscaffold名、chrはなくてもよい
  $2 : chromStart 標準的な染色体座標(0基準)上でのfeatureの開始位置
  $3 : chromEnd   同上での終了位置
  ----------------------------------------------------------------
  $4 : name        feature下に表示されるラベル
  $5 : source      0-1000までのスコア
  $6 : strand      +(fwd)|-(rv)
  $7 : thickStart  強調表示されるfeatureの開始座標
  $8 : thickEnd    強調表示されるfeatureの終了位置
  $9 : itemRgb     色(RGB), R,G,Bのように,区切りで数値指定
  $10: blockCount  featureの内部にあるサブ要素の数(CDSに対するexon数など)
  $11: blockSizes  サブ要素のサイズ(数値を,区切りで指定)
  $12: blockStarts サブ要素それぞれの開始座標(数値を,区切りで指定)
  --- example ----------------------------------------------------
  browser position chr7:127471196-127495720
  browser hide all
  track name="ItemRGBDemo" description="Item RGB demonstration" visibility=2 itemRgb="On"
  chr7    127471196  127472363  Pos1  0  +  127471196  127472363  255,0,0
  chr7    127472363  127473530  Pos2  0  +  127472363  127473530  255,0,0
  chr7    127473530  127474697  Pos3  0  +  127473530  127474697  255,0,0
  chr7    127474697  127475864  Pos4  0  +  127474697  127475864  255,0,0
  chr7    127475864  127477031  Neg1  0  -  127475864  127477031  0,0,255
  chr7    127477031  127478198  Neg2  0  -  127477031  127478198  0,0,255
  chr7    127478198  127479365  Neg3  0  -  127478198  127479365  0,0,255