DNAの多型とは

 ゲノム情報が注目される以前は、個人差といえば酵素型や血液型のような蛋白質の型が中心でした。このような個人差が、ある集団の1%以上に認められ、明らかな機能異常と関係せず、メンデルの遺伝形式をとって遺伝する時に多型(polymorphism)と呼ばれます。

 ゲノム解析が進むにつれてゲノムDNAの塩基配列にも個人差が多少ある(0・5%程度)ことが知られるようになり、ゲノム(DNA)多型として注目されるようになりました。ゲノムの多型が酵素型や血液型より広く利用されるようになった理由は、どんな多型であってもDNAを解析する一定の技術で調べられること、およびゲノム上広範囲に存在することです。

 まず1980年代に制限酵素断片長多型(RFLP)が見いだされました。1985年ごろには、数十bp程度まで(bpは塩基配列=ベースペアを指し、塩基配列の長さの単位)の塩基配列が縦列に反復し、この反復回数に個人差があるミニサテライト反復配列が注目されました。この配列は、変異の種類が多いのですが、分布はテロメア(染色体の末端部)の近傍に偏っています。

 1990年ごろには、さらに1〜4bpの配列が同様に縦列に反復するマイクロサテライト反復配列が個人の同定に用いられるようになりました。C(シトシン)とA(アデニン)の2塩基の縦列が1単位となるCAリピートはゲノム不安定性の検査にも使われています。

 1990年代後半になって、単一塩基多型(SNP)が注目されるようになりました。これは、ゲノムの1カ所がGもしくはAであるといったDNA多型で、ヒトゲノムには1000万カ所、すなわち平均して300bpに1カ所あることになります。

 2000年代になり、ヒトゲノムプロジェクトの完成とともに、ヒトの全ゲノムを解析するマイクロアレイ技術が発達してきました。この方法によって個人ごとのゲノムの解析も可能となり、ゲノムの個人差がますます明らかになってきました。その結果、ゲノムの数十kb(キロベース、1kbは1000bp)以上にわたる部分でも、個人ごとに量の差があることが判明してきました。このような部分はコピー数多型(CNV)と呼ばれます。

多型研究の応用

 ゲノム(DNA)の多型は、単一の遺伝子の変異が原因となるメンデル遺伝性疾患に関係する遺伝子(責任遺伝子)を単離する目的や、複数の遺伝子が関わると推定される疾患(多因子遺伝性疾患)において具体的にどのような遺伝子群が関与するかを見いだす解析に用いられます。SNP解析の初期の研究からは、神経疾患の責任遺伝子や発がんを抑える遺伝子が判明しました。またその研究とあいまってマイクロサテライト反復配列の研究も進み、特殊な3塩基配列が神経疾患の発症に関わることや、2塩基多型の不安定性を調べることで、がんのなりやすさを判定することができることがわかってきました。

 2003年に、ヒトゲノムプロジェクトによってヒトゲノムの全塩基配列がほぼ明らかにされたことから、疾患に関係するゲノム解析も急激に進みました。メンデル遺伝性疾患の患者さんやご家族の方の協力のもとで、ゲノムの多型を手がかりとした研究がなされ、疾患の責任遺伝子が明らかにされてきました。

 一方では血縁関係にない多数の患者さんと患者さんではない方々の協力のもとでゲノム全体にわたって多型などを調べるゲノムワイド関連解析(GWAS)がなされ、多因子遺伝性疾患に関連する遺伝子が次々と判明しつつあります。これらの解析には、多型の部位が多く解析が比較的容易なSNPが主として利用されます。CNVについてはいまだデータの蓄積が少なく、今後の研究が期待されています。

 またゲノムDNAから転写・翻訳されたRNAや蛋白質の解析をすることで、ゲノムや遺伝子が具体的にどの部位でいつどのようなはたらきをしているのかを知ることができます。細胞や組織で発現されるRNAや蛋白質を網羅するトランスクリプトーム(トランスクリプトは転写物、RNAのこと)、プロテオーム(プロテインは蛋白質のこと)解析が、この目的でなされています。

 ゲノム解析技術の躍進により、個人ごとのゲノムを解析することが費用・時間の両面から可能となる日も近いと思われます。これは疾患の解明に大きな力となる一方で、個人の一生変わらないゲノム情報が明らかにされることにもなるため、倫理的、法的、社会的な面からの検討が重要です。