PLINKの使い方 3 〜集団の階層化〜

ゲノムワイドなSNPを用いて集団の階層化(補正)を行う。

参考論文


論文内でのIBSおよびIBDの定義
  • identity-by-state (IBS)は、均一の集団の中で個体同士を比較し、最も似ていない個体を同定するために用いる。
  • identity-by-descent (IBD)は、個体同士を比較し、最も似ている個体を同定するために用いる。

PLINKではidentity-by-state (IBS) の距離に基づいて凝集型完全連結クラスタリングを実行する。

1. IBS クラスタリング

  • コマンド
    • plink --file mydata --pheno pheno.txt --geno 0.05 --maf 0.05 --hwe 0.001 --cluster
  • アウトプット
    • plink.cluster0:クラスタリングプロセスの情報を含むファイル。無視して良い。
    • plink.cluster1:1行につき1クラスターに含まれるサンプルを表示。
    • plink.cluster2:1行につき1サンプルのクラスタリング結果を表示。
    • plink.cluster3:1行につき1サンプルと全サンプルとの対応結果を表示。

2. IBS/IBD推定

  • http://pngu.mgh.harvard.edu/~purcell/plink/ibdibs.shtml#genome

サンプル内におけるサンプルの重複や知られていない家族関係のコンタミネーションを取り除くため、全サンプルのペア(総当たり)のIBSとIBDを推定する。
とても似ているサンプル同士を明らかにするため、ランダムサンプルのペアから推定されるIBDより高いペアを同定する。

  • コマンド
    • plink --file mydata --genome
  • アウトプット
    • plink.genome
  • フォーマット
    • #1     FID1      Family ID for first individual
      #2     IID1      Individual ID for first individual
      #3     FID2      Family ID for second individual
      #4     IID2      Individual ID for second individual
      #5     RT        Relationship type given PED file
      #6     EZ        Expected IBD sharing given PED file
      #7     Z0        P(IBD=0)
      #8     Z1        P(IBD=1)
      #9     Z2        P(IBD=2)
      #10     PI_HAT    P(IBD=2)+0.5*P(IBD=1) ( proportion IBD )
      #11     PHE       Pairwise phenotypic code (1,0,-1 = AA, AU and UU pairs)
      #12     DST       IBS distance (IBS2 + 0.5*IBS1) / ( N SNP pairs )
      #13     PPC       IBS binomial test
      #14     RATIO     Of HETHET : IBS 0 SNPs (expected value is 2)
  • 集団のPI_HATの平均を別途求めて比較する。
  • 評価の仕方(追記:Proportion IBDのこと)
    • PI_HAT=1:同一人物か一卵性双生児
    • PI_HAT=0.5:第一度近親者(親、子、兄弟、姉妹)
    • PI_HAT=0.25:第二度近親者(おじ、おば、おい、めい、祖父、祖母、孫)
    • PI_HAT=0.125:第三度近親者(いとこ等)
  • 一般的にはPI_HAT > 0.1875を示すペアのうち1サンプルを取り除く。
    • cat plink.genome | awk '{if($10>0.1875) print $0}'

3. 近交係数の推定

集団内で祖先ジェノタイプを多く持つ(血が濃い)個体がいるかを検討する。
ホモ接合ジェノタイプの予測値と実測値から近交係数を算出する。
  • コマンド
    • plink --file mydata --het
  • アウトプット
    • plink.het
Share on Google Plus

About Piyoko

    Blogger Comment
    Facebook Comment

0 コメント:

コメントを投稿