不思議Labo

遺伝子ってなに?iPS細胞ってなに?

ヒトゲノム計画

ヒトゲノム計画でわかったこと

投稿日:10/09/2015 更新日:


Sponsered Link

ヒトゲノムの全体像

 

 国際共同グループは、21番と22番染色体については、長腕のほぼ全長(99.7%など)にわたって正確な塩基配列を決めました。これらの染色体の短腕は短く、短腕側にはリボソームの遺伝子を除くと、高度に反復した配列(Cバンド陽性部)だけで遺伝子はまったくありません。ヘテロクロマチンです。あらかじめそれがわかっていたので、短腕側の分析をしなかったのです。

 

 ゲノムは全体で32億塩基対ほどであることがわかりました。そのうちからヘテロクロマチンを除いた真正クロマチンは、29.5億 塩基対ほどです。

 

ゲノムの塩基配列はここまで読めた

 

 明らかになった塩基配列のうち、ほぼ1/3にあたる10億塩基対については、塩基配列の解析を極めて高い精度(99.99%)で行っています。同じ区間について10程度のクローンのショットガン法による塩基配列決定を行い、結果を互いに照合したのです。残りの2/3はやや低い精度(90%ほどの精度の概要配列、一部はさらに精度の低い前概要配列)の結果です。

 

 塩基配列の結果については、我が国の2機関が合わせて全体のほぼ6%のデータを出しています。報告書では参加した20機関を寄与の大きい順に配列していますが、理化学研究所のゲノム科学総合研究センターは全体の6番目、慶応義塾大学医学部の分子生物学教室は15番目です。ただしこれらの2施設は、21番と22番染色体の詳細な解析について、中心的な役割を果たしました。なお2004年10月には、ゲノムの全長にわたる正確な塩基配列は発表されました。

image1 (10)

ヒトゲノムにはさまざまな反復配列が含まれている

 

 解析の結果、ゲノムのほぼ半分をさまざまな程度に反復した配列が占めていることがわかりました。ヘテロクロマチン部の高度反復配列はゲノムの1割足らずですが、真正クロマチンに含まれる反復配列はその倍数になります。反復の程度が低い分散型の反復配列で、SINEとかLINE(short/long interspersed element)などと呼ばれるものです。前者の一部は反復の単位ごとに1カ所ずつAluIという制限酵素で切れる場所をもつので、Alu配列と呼ばれることがあります。ヒトに特有の配列なので、他の動物のDNAとの識別に使えます。

ヒトゲノムの内容

 これらはレトロウイルスの逆転写酵素の活性によって、もとのDNAの配列コピーがあちこちに入り込んだものだという説があります。レトロウイルスとは、一本鎖RNAをゲノムとし、それを逆転写酵素によって二本鎖DNAに変換して、感染した細胞のゲノムのほぼ21%、SINEが13%、レトロウイルスの特徴を残したレトロ転移因子が8%、その一部分だと思われる構造が3%です。

 

 レトロ転移因子は、レトロウイルスがもつ3種の遺伝子(gag,poj,env)をほぼ残していますので、割と最近(進化レベルで)レトロウイルスがゲノムに入り込んだのでしょう。不完全なレトロ転移因子は、入り込んだ時期がずっと古いために構造は崩れているものの、レトロウイルスの特徴がわずかに残っているものです。

 

 (CA)nなどのマイクロサテライトも、ゲノムの3%ほどを占めています。また、かなり大きな区間が、2回、3回など重複している部分も見つかりました。ヒトのゲノムは、かなり反復や重複が多いのです。

 

 解析が終了しているトラフグの遺伝子に、反復配列がほとんどないことがわかっています。フグは脊椎動物であるのに、ゲノムが哺乳類などに比べて小さいことから、研究の対象に選ばれたのですが、反復配列が少ないことが原因でした。遺伝子の数はヒトとあまり変わらず、21000ほどあるという報告がありました。

 

染色体上の遺伝子の分布

 

 遺伝子カタログには、20011年8月時点で20768種類の遺伝子が登録されていますが、そのうち19487種については、染色体上の遺伝子の場所がわかっています。X染色体上にはそのうち718種、Y染色体上には45種、ミトコンドリアにも65種の遺伝子が分布していますが、1から22番までの常染色体上には残る18659種の遺伝子が分布しています。同じ形と大きさの染色体でも、遺伝子の多いものと少ないものがあります。たとえば21と22番を見ると、前者には142種ですが、後者には323種の遺伝子が載っています。同様に13と14を比較すると、前者には240種、後者には409種の遺伝子が載っています。染色体上には遺伝子の密度の高い部分と低い部分があり、その割合が染色体によって違うのです。

 

 染色体を文染法と呼ばれるいくつかの方法で染めると、縦軸に沿って濃い部分と淡い部分が現れます。それぞれをバンド法と呼びますが、たとえばGバンド法で染めると、濃い部分には遺伝子が少なく、淡い部分は遺伝子密度が高いのです。前者には、SINEやィネなど反復配列も含まれています。上記の染色体のうち、13や21番は遺伝子密度が低いバンドが多く、14や22番は遺伝子密度が高いバンドが全体の多くを占めているのです。

 

 遺伝子がクローンかされていてDNAレベルの構造までわかっているものは、13000ほどです。残りはたとえばある種の聾唖が家系に繰り返し生まれたもので、関係する遺伝子があるはずだが、それ以上はわからないというレベルです。

 

 ところでゲノム解析の結果ですが、この段階では塩基配列によって遺伝子を拾い出すのは難しいです。アミノ酸の配列の情報を含む区間(ORF)とか、エキソンとイントロンの構造をもつなどで、遺伝子と推定される塩基配列をコンピュータープログラムで拾い出すのです。ただし、塩基配列が確定していないと、結果が怪しくなります。

Sponcsered Link

 

 しかも、遺伝子産物がタンパク質ではなく、RNAのままで働く遺伝子は見落とされる可能性があります。タンパク質合成(翻訳)の際にアミノ酸を運ぶトランスファーRNA(tRNA)など、産物がRNAである遺伝子はいくつか知られていますが、X染色体上の不活性化を支配するXIST遺伝子など、RNAのままで働く遺伝子が、ほかにもまだ隠されている可能性があります。したがって、2004年10月の「タンパク質の情報をもつ遺伝子は2万~3万5千」という推定は、最低でもこれくらいという数字です。

 

 これらは塩基配列から見て遺伝子だろうというレベルで、機能のわからないものが大半です。どのような病気や性質とかかわっているのかわからないので、遺伝子カタログには載っていません。遺伝子カタログと、ゲノムの解析で見つかった遺伝子らしい構造、両者の対応関係がすべての遺伝子について明らかになるまで、最終的な遺伝子数はわからないでしょう。

 

 ちなみに、2000年5月にはほぼ全長にわたって完成配列が発表された21番染色体についても、その後さらに解析が進みます。新たに遺伝子と同定されたものは当初発表から10%ほども増えたとのことです。やはり詳しい解析によって新たな遺伝子が見つかると考えて、間違いないでしょう。その後、20番染色体についても21番、22番なみの詳しい解析が終わりました。

 

遺伝子の全体像が見えてくる

 

 たくさんの遺伝子を比べることで見えてきた情報もあります。遺伝子の活動の調節にかかわる転写因子に変化が起きると、出生前に影響が出て奇形などが生じる、酵素の異常だと出生から1歳までに発病する傾向がある、遺伝子の種類によっては異常があっても50歳すぎになって症状が出る、などというのが例です。

 

 新しく見つかった遺伝子は30ほどです。ある種の難聴、全色盲、筋ジストロフィーのうち肢帯型、神経系萎縮などの原因遺伝子が例です。

 

 以外に少ないという印象だと思いますが、概要配列やそれ以下のレベルでは遺伝子の識別がそもそも困難ですし、完成配列でも見つかった遺伝子らしい構造が病気の原因だと特定するには、患者でその遺伝子の変化を証明しなければなりません。まだまだゲノム解析は終わっていないのです。喘息やアルツハイマー病の治療薬の開発に役立ちそうな遺伝子も見つかりました。ゲノム創薬のターゲットです。

 

DNAの個人差(DNS多型)

 

 DNA多型についても、さまざまな情報が得られました。SNP(一塩基多型)だけでも140万種類が見つかったのです。

 

 遺伝子をここのエキソンに分けて見ると、エキソンの85%ではすぐ近く(5kb以内)にSNPがあるというのです。この距離ではエキソンとの間でキアズマが起きる可能性はゼロに近いので(100万塩基対で1%)、SNPを使って異常が起きたエキソンの追跡をすれば、キアズマによる誤診がほとんどないのです。

 

 エキソンの内部にあるSNPも、6万種類ほど見つかったようです。これも診断の目的にはピッタリです。

 

 DNAの多型には、SNP以外の種類もあります。1~9塩基を単位とする繰り返し回数の多型であるマイクロサテライト多型(たとえばTATATAの繰り返し回数の個人差)、繰り返し単位が10から100塩基ほどのミニサテライト多型が例です。これらもSNPと同様に診断に使えますが、たくさんの種類が見つかっています。また、これらは個人識別の有効な手段となっています。

maikurosateraito

突然変異は男性に多い

 

 なお、今回のゲノム研究によって、突然変異は主に男性で起きていることなどがわかりました。

 

 女児が生まれる時点で、卵巣内の卵子になる細胞は、減数分裂のうち第一分裂の途中まで進んでいて、そこで排卵まで待つのです。30歳で排卵される卵子なら30年です。そのため染色体の対の分離に問題が起きやすく、ダウン症など染色体の数の異常じゃ、女性側が原因のことが多いのです。

 

 他方、精子になる細胞は思春期以降はずっと細胞分裂による増殖、減数分裂、排出を繰り返します。そのため分裂回数が卵子に比べてけた違いに多いのです。それが男性側で突然変異が多い原因でしょう。DNA複製にあたって一定の確率で誤りが起こることは「DNAとゲノム、遺伝子」で紹介しました。

 

ヒトの遺伝子は10万個?

 

 話は戻りますが、ゲノムあたりの遺伝子の数については、ずいぶん昔に突然変異についての研究などから、「10万以上ではありえない」という説が提出されました。

 

 DNAの複製に際しては、世代あたりで遺伝子10万個に1回ほどの頻度で、突然変異が起きます。遺伝子が30万個もあると、すべての子は親から伝わる以上に加えて、3個ほどの新しい突然変異を背負いこむことになります。環境異変原による突然変異も、これに加わります。これでは種として存続できないが、毎世代に1個以内ならなんとかなるだろう、ということで遺伝子数の上限としてできたのが10万という数字です。

 

 いつのまにか数字がひとり歩きして、ヒトの遺伝子は10万という話になったのですが、あくまで上限です。

 

 遺伝子の数がわかっているショウジョウバエと体の構造を比べて、ヒトのほうが何倍くらいかは複雑だから・・・、と遺伝子の数を推定することも考えられますが、複雑さが何倍という数字を、みなが納得する形で出すのは難しいでしょう。とりあえずは3万~4万ということになります。

Sponcered Link

-ヒトゲノム計画
-

執筆者:


comment

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

関連記事

いろいろな動物のゲノム

Sponsered Link 1つの遺伝子を使い回す    ヒトゲノムの概要版では、ヒトは3万~4万個の遺伝子をもつ、という推定になりました。全長が1mm足らずのセンチュウや、虫眼鏡がないと …

個人のゲノム解析

Sponsered Link 実現した個人のゲノム解析   これまでにご紹介したゲノム解析は、ヒトとして共通のゲノムの構造や特徴を明らかにするのが目的でした。ゲノムにはさまざまなDNA多型が …

ヒトゲノム計画の背景

Sponsered Link メンデルの法則からDNAまで    遺伝子研究の歴史をさかのぼれば、1865年のエンドウを使ったメンデルの法則の発見にたどりつきます。もっとも、メンデル(G.J …

ヒトゲノム計画〜ゲノム解析のアプローチ〜

Sponsered Link ヒトゲノム計画の発足    ヒトゲノム計画は米国では1990年の10月、わが国では1991年の4月に発足しました。いずれも1991年度ですが、米国の会計年度は前 …

遺伝地図とは何か

Sponsered Link 染色体上の遺伝子の位置関係を示す地図    ヒトゲノム計画の理解には、遺伝地図と物理地図についておおまかな知識が欠かせません。まず遺伝地図について、簡単に解説し …