ヒトゲノム計画の記事一覧


Sponsered Link

実現した個人のゲノム解析

 

これまでにご紹介したゲノム解析は、ヒトとして共通のゲノムの構造や特徴を明らかにするのが目的でした。ゲノムにはさまざまなDNA多型が含まれますが、これらは個人差でヒトとしての特徴ではないというイメージです。最近になって、ゲノム解析技術の進歩により、特定の個人についてゲノム全体の解析が可能になりました。もちろん、簡単な臨床検査のレベルではなく、大きな労力やコストがかかりますが、高名な学者や芸術家、政治家などのゲノムの特徴を調べることが可能になったのです。たとえば米国のスタンフォード大学では、5万ドルで個人のゲノム解析を引き受けているというのです。生存中の個人なら解析は可能ですが、すでに亡くなっている人については、凍結された状態で遺体の一部が残っていないと不可能です。いずれにせよ、ノーベル賞受賞者のゲノムの特徴などは、知りたいですね。一般の人々についても、心臓発作、さまざまな種類の“がん”、脳出血などのリスクがわかれば、予防につながる情報になりますが、かなり安くならないと普及は難しいです。


ヒトゲノム計画


1つの遺伝子を使い回す

 

 ヒトゲノムの概要版では、ヒトは3万~4万個の遺伝子をもつ、という推定になりました。全長が1mm足らずのセンチュウや、虫眼鏡がないと脚の数もわからないようなショウジョウバエ(以下ハエ)に比べても、2倍ほどの数字です。

 

 センチュウの体は、わずか1000個足らずの細胞でできています。細胞数が60兆個とされるヒトの体は、複雑さにおいてはけた違いで、機能まで考えたら遺伝子数に100倍の差があっても不思議ではないでしょう。一つの解釈は、ヒトでは1つの遺伝子を複数の目的に使っているというものです。

 

 たとえば、ハエでは雄になるか雌になるかは、同じ遺伝子のスプライシングの違いで決まります。上段のSxl遺伝子の3番目のエキソンには停止コドンがあるので、雌ではそれを外して1,2,4・・・8とスプライシングが進みます。雄ではそのまま1,2,3,4・・・8と進みます。雄の遺伝子産物は停止コドンのために機能を失いますが、雌の産物は次のtra遺伝子のスプライシングを雌型に変えます。それによってtra遺伝子の、停止コドンを含む第4エキソンを除去し、機能をもつ産物ができるのです。

 

 他方、雄ではそのまま1,2,3,4・・・と進むので、機能のある産物はできません。次の段階のdsx遺伝子でも雌と雄のスプライシングの違いが起き、最終的に雌と雄の性腺の分化が誘導されます。1つの遺伝子を使い回して複数の産物をつくるのは、十分にありうる話なのです。

 

 ハエなどに比べると、ヒトではずっと多くの遺伝子で、このようなメカニズムが使われているということです。このあたりはゲノムの塩基配列が最終的に高い精度で決まり、遺伝子がすべて明らかにされ、遺伝子産物の識別が進んで遺伝子との対応関係が明らかになるまで、結論をまたなければならないでしょう。

 

ヒトのゲノム、ハエのゲノム

 

 ヒトとセンチュウやハエとの比較では、発生の制御にかかわる線維芽細胞増殖因子が、ヒトでは30種類であるのに、ハエとセンチュウではそれぞれ2種類であったということです。細胞骨格にかかわるタンパク質も、ヒトではずいぶん複雑になっています。

ショウジョウバエ,スプライシング

 ヒトなど複雑な体制をもつ生き物では、たとえば上皮細胞も1種類ではなく、皮膚もあれば、口腔、食道や腸管、期間や肺、胆嚢や胆管、尿管や膀胱、尿道、血管の内腔など、きわめて多彩です。それらの構造をささえる仕掛けも、当然ながら複雑です。細胞間の情報伝達にかかわる遺伝子のグループも、ヒトで発達が目立つものの一つです。他方、細胞内の情報伝達にかかわる遺伝子については、ヒトとハエやセンチュウとの間に、ほとんど差がなかったということです。ヒトでは免疫など生体防御にかかわる遺伝子群の発達も目立ちました。

 

 ヒトで見つかった1262グループのタンパク質のうち、94種類だけが脊椎動物に特徴的なものだったのです。また、複雑な構造をもつヒトのタンパク質も、タンパク質の構造の基本単位であるドメインの種類は、ハエとセンチュウとほとんど差がなく、ヒトではより多くのドメインをさまざまに組み合わせることで、複雑なタンパク質をつくっていることがわかりました。

Sponcsered Link

 

 進化の過程で、まったく新しい遺伝子をつくり育てるのは、何億年もかかり成功率を低いでしょう。既存の遺伝子やその一部を組み合わせて、新しい機能をもつ遺伝子をつくるのは合理的です。

 

ヒトのゲノム、類人猿のゲノム

 

 脊椎動物ではマウスやチンパンジーなどでゲノムの概要がわかりました。

 

 そのうちで特に興味深いのは、脊椎動物の嗅覚にかかわる900ほどの遺伝子のうち、ヒトでは60%が壊れていた事実です。

 

 多くの動物にとって嗅覚は生きていくのに欠かせない機能ですが、猿人の時代から数百万年の進化の中で、ヒトは嗅覚を捨て、視覚や頭を使うことで生き延びてきたのでしょう。それをもつことが生存に有利でなければ、遺伝子は自然に壊れていくのです。

 

 類人猿やその他のサルに比べても、ヒトが高度な精神活動を行っていることは明らかです。他方、これまでにいくつかの遺伝子を調べたかぎりでは、ヒトとチンパンジーなどの類人猿の間では遺伝子の塩基配列の差が少なく、1~2%ほどでした。

 

 ただし、これまでの研究は、タンパク質を純粋な形で大量に集めやすいヘモグロビンとか、遺伝子が変化すると重い遺伝病になるような遺伝子でした。このような遺伝子が変化(突然変異)すると、その個体は重大な不利益を受けますので、突然変異が集団の中に定着するチャンスが低いのです。多くの種類の動物の間で、あまり差がないのは当然なのです。

 

 ゲノム計画が進んで、精神活動にかかわる遺伝子まで明らかになれば、差が見つかることが十分に考えられるのではないでしょうか。ヒトにもっとも近いチンパンジーのゲノム解析の結果も参考になります。

 

これから見つかる遺伝子

 

 ヒトの遺伝子の総数を3万と仮定すると、かなりの部分は機能がわかっていません。遺伝子カタログにでているのは2万ほどです。残りの遺伝子の中には、受精後の早い時期に働く遺伝子や、精神活動などにかかわる遺伝子がたくさんあると予想されます。

 

 前者のグループの遺伝子は、異常が起きると胎児(胎芽)が死滅して流産するため、これまで遺伝子の変化を調べる機会がなかったのです。後者のグループはこれまで、もっとも研究が遅れていた分野です。

 

 心の問題については「心と遺伝子」でもふれましたが、ゲノムの全体像が明らかになれば、研究が大きく進むでしょう。好奇心にかかわる遺伝子など、心の問題についての研究も動き始めています。

 

ハップマップ計画

 

 ヒトのゲノムにはさまざまな多型が含まれますが、SNPやマイクロサテライトなど多型のDNA、さらには染色体上のDNA多型の分布を明らかにすることが目的の「ハップマップ計画」が進められています。付近にある多数の遺伝子との位置関係にかかわる情報も得られるので、その領域にある遺伝子の伝わり方など、診断にかかわる重要な情報につながる可能性が大きいのです。DNA多型を使って、多くの病気の出生前診断などが実現するのではないでしょうか。


ヒトゲノム計画


ヒトゲノムの全体像

 

 国際共同グループは、21番と22番染色体については、長腕のほぼ全長(99.7%など)にわたって正確な塩基配列を決めました。これらの染色体の短腕は短く、短腕側にはリボソームの遺伝子を除くと、高度に反復した配列(Cバンド陽性部)だけで遺伝子はまったくありません。ヘテロクロマチンです。あらかじめそれがわかっていたので、短腕側の分析をしなかったのです。

 

 ゲノムは全体で32億塩基対ほどであることがわかりました。そのうちからヘテロクロマチンを除いた真正クロマチンは、29.5億 塩基対ほどです。

 

ゲノムの塩基配列はここまで読めた

 

 明らかになった塩基配列のうち、ほぼ1/3にあたる10億塩基対については、塩基配列の解析を極めて高い精度(99.99%)で行っています。同じ区間について10程度のクローンのショットガン法による塩基配列決定を行い、結果を互いに照合したのです。残りの2/3はやや低い精度(90%ほどの精度の概要配列、一部はさらに精度の低い前概要配列)の結果です。

 

 塩基配列の結果については、我が国の2機関が合わせて全体のほぼ6%のデータを出しています。報告書では参加した20機関を寄与の大きい順に配列していますが、理化学研究所のゲノム科学総合研究センターは全体の6番目、慶応義塾大学医学部の分子生物学教室は15番目です。ただしこれらの2施設は、21番と22番染色体の詳細な解析について、中心的な役割を果たしました。なお2004年10月には、ゲノムの全長にわたる正確な塩基配列は発表されました。

image1 (10)

ヒトゲノムにはさまざまな反復配列が含まれている

 

 解析の結果、ゲノムのほぼ半分をさまざまな程度に反復した配列が占めていることがわかりました。ヘテロクロマチン部の高度反復配列はゲノムの1割足らずですが、真正クロマチンに含まれる反復配列はその倍数になります。反復の程度が低い分散型の反復配列で、SINEとかLINE(short/long interspersed element)などと呼ばれるものです。前者の一部は反復の単位ごとに1カ所ずつAluIという制限酵素で切れる場所をもつので、Alu配列と呼ばれることがあります。ヒトに特有の配列なので、他の動物のDNAとの識別に使えます。

ヒトゲノムの内容

 これらはレトロウイルスの逆転写酵素の活性によって、もとのDNAの配列コピーがあちこちに入り込んだものだという説があります。レトロウイルスとは、一本鎖RNAをゲノムとし、それを逆転写酵素によって二本鎖DNAに変換して、感染した細胞のゲノムのほぼ21%、SINEが13%、レトロウイルスの特徴を残したレトロ転移因子が8%、その一部分だと思われる構造が3%です。

 

 レトロ転移因子は、レトロウイルスがもつ3種の遺伝子(gag,poj,env)をほぼ残していますので、割と最近(進化レベルで)レトロウイルスがゲノムに入り込んだのでしょう。不完全なレトロ転移因子は、入り込んだ時期がずっと古いために構造は崩れているものの、レトロウイルスの特徴がわずかに残っているものです。

 

 (CA)nなどのマイクロサテライトも、ゲノムの3%ほどを占めています。また、かなり大きな区間が、2回、3回など重複している部分も見つかりました。ヒトのゲノムは、かなり反復や重複が多いのです。

 

 解析が終了しているトラフグの遺伝子に、反復配列がほとんどないことがわかっています。フグは脊椎動物であるのに、ゲノムが哺乳類などに比べて小さいことから、研究の対象に選ばれたのですが、反復配列が少ないことが原因でした。遺伝子の数はヒトとあまり変わらず、21000ほどあるという報告がありました。

 

染色体上の遺伝子の分布

 

 遺伝子カタログには、20011年8月時点で20768種類の遺伝子が登録されていますが、そのうち19487種については、染色体上の遺伝子の場所がわかっています。X染色体上にはそのうち718種、Y染色体上には45種、ミトコンドリアにも65種の遺伝子が分布していますが、1から22番までの常染色体上には残る18659種の遺伝子が分布しています。同じ形と大きさの染色体でも、遺伝子の多いものと少ないものがあります。たとえば21と22番を見ると、前者には142種ですが、後者には323種の遺伝子が載っています。同様に13と14を比較すると、前者には240種、後者には409種の遺伝子が載っています。染色体上には遺伝子の密度の高い部分と低い部分があり、その割合が染色体によって違うのです。

 

 染色体を文染法と呼ばれるいくつかの方法で染めると、縦軸に沿って濃い部分と淡い部分が現れます。それぞれをバンド法と呼びますが、たとえばGバンド法で染めると、濃い部分には遺伝子が少なく、淡い部分は遺伝子密度が高いのです。前者には、SINEやィネなど反復配列も含まれています。上記の染色体のうち、13や21番は遺伝子密度が低いバンドが多く、14や22番は遺伝子密度が高いバンドが全体の多くを占めているのです。

 

 遺伝子がクローンかされていてDNAレベルの構造までわかっているものは、13000ほどです。残りはたとえばある種の聾唖が家系に繰り返し生まれたもので、関係する遺伝子があるはずだが、それ以上はわからないというレベルです。

 

 ところでゲノム解析の結果ですが、この段階では塩基配列によって遺伝子を拾い出すのは難しいです。アミノ酸の配列の情報を含む区間(ORF)とか、エキソンとイントロンの構造をもつなどで、遺伝子と推定される塩基配列をコンピュータープログラムで拾い出すのです。ただし、塩基配列が確定していないと、結果が怪しくなります。

 

 しかも、遺伝子産物がタンパク質ではなく、RNAのままで働く遺伝子は見落とされる可能性があります。タンパク質合成(翻訳)の際にアミノ酸を運ぶトランスファーRNA(tRNA)など、産物がRNAである遺伝子はいくつか知られていますが、X染色体上の不活性化を支配するXIST遺伝子など、RNAのままで働く遺伝子が、ほかにもまだ隠されている可能性があります。したがって、2004年10月の「タンパク質の情報をもつ遺伝子は2万~3万5千」という推定は、最低でもこれくらいという数字です。

 

 これらは塩基配列から見て遺伝子だろうというレベルで、機能のわからないものが大半です。どのような病気や性質とかかわっているのかわからないので、遺伝子カタログには載っていません。遺伝子カタログと、ゲノムの解析で見つかった遺伝子らしい構造、両者の対応関係がすべての遺伝子について明らかになるまで、最終的な遺伝子数はわからないでしょう。

 

 ちなみに、2000年5月にはほぼ全長にわたって完成配列が発表された21番染色体についても、その後さらに解析が進みます。新たに遺伝子と同定されたものは当初発表から10%ほども増えたとのことです。やはり詳しい解析によって新たな遺伝子が見つかると考えて、間違いないでしょう。その後、20番染色体についても21番、22番なみの詳しい解析が終わりました。

 

遺伝子の全体像が見えてくる

 

 たくさんの遺伝子を比べることで見えてきた情報もあります。遺伝子の活動の調節にかかわる転写因子に変化が起きると、出生前に影響が出て奇形などが生じる、酵素の異常だと出生から1歳までに発病する傾向がある、遺伝子の種類によっては異常があっても50歳すぎになって症状が出る、などというのが例です。

 

 新しく見つかった遺伝子は30ほどです。ある種の難聴、全色盲、筋ジストロフィーのうち肢帯型、神経系萎縮などの原因遺伝子が例です。

 

 以外に少ないという印象だと思いますが、概要配列やそれ以下のレベルでは遺伝子の識別がそもそも困難ですし、完成配列でも見つかった遺伝子らしい構造が病気の原因だと特定するには、患者でその遺伝子の変化を証明しなければなりません。まだまだゲノム解析は終わっていないのです。喘息やアルツハイマー病の治療薬の開発に役立ちそうな遺伝子も見つかりました。ゲノム創薬のターゲットです。

 

DNAの個人差(DNS多型)

 

 DNA多型についても、さまざまな情報が得られました。SNP(一塩基多型)だけでも140万種類が見つかったのです。

 

 遺伝子をここのエキソンに分けて見ると、エキソンの85%ではすぐ近く(5kb以内)にSNPがあるというのです。この距離ではエキソンとの間でキアズマが起きる可能性はゼロに近いので(100万塩基対で1%)、SNPを使って異常が起きたエキソンの追跡をすれば、キアズマによる誤診がほとんどないのです。

 

 エキソンの内部にあるSNPも、6万種類ほど見つかったようです。これも診断の目的にはピッタリです。

 

 DNAの多型には、SNP以外の種類もあります。1~9塩基を単位とする繰り返し回数の多型であるマイクロサテライト多型(たとえばTATATAの繰り返し回数の個人差)、繰り返し単位が10から100塩基ほどのミニサテライト多型が例です。これらもSNPと同様に診断に使えますが、たくさんの種類が見つかっています。また、これらは個人識別の有効な手段となっています。

maikurosateraito

突然変異は男性に多い

 

 なお、今回のゲノム研究によって、突然変異は主に男性で起きていることなどがわかりました。

 

 女児が生まれる時点で、卵巣内の卵子になる細胞は、減数分裂のうち第一分裂の途中まで進んでいて、そこで排卵まで待つのです。30歳で排卵される卵子なら30年です。そのため染色体の対の分離に問題が起きやすく、ダウン症など染色体の数の異常じゃ、女性側が原因のことが多いのです。

 

 他方、精子になる細胞は思春期以降はずっと細胞分裂による増殖、減数分裂、排出を繰り返します。そのため分裂回数が卵子に比べてけた違いに多いのです。それが男性側で突然変異が多い原因でしょう。DNA複製にあたって一定の確率で誤りが起こることは「DNAとゲノム、遺伝子」で紹介しました。

 

ヒトの遺伝子は10万個?

 

 話は戻りますが、ゲノムあたりの遺伝子の数については、ずいぶん昔に突然変異についての研究などから、「10万以上ではありえない」という説が提出されました。

 

 DNAの複製に際しては、世代あたりで遺伝子10万個に1回ほどの頻度で、突然変異が起きます。遺伝子が30万個もあると、すべての子は親から伝わる以上に加えて、3個ほどの新しい突然変異を背負いこむことになります。環境異変原による突然変異も、これに加わります。これでは種として存続できないが、毎世代に1個以内ならなんとかなるだろう、ということで遺伝子数の上限としてできたのが10万という数字です。

 

 いつのまにか数字がひとり歩きして、ヒトの遺伝子は10万という話になったのですが、あくまで上限です。

 

 遺伝子の数がわかっているショウジョウバエと体の構造を比べて、ヒトのほうが何倍くらいかは複雑だから・・・、と遺伝子の数を推定することも考えられますが、複雑さが何倍という数字を、みなが納得する形で出すのは難しいでしょう。とりあえずは3万~4万ということになります。


ヒトゲノム計画


ヒトゲノム計画の発足

 

 ヒトゲノム計画は米国では1990年の10月、わが国では1991年の4月に発足しました。いずれも1991年度ですが、米国の会計年度は前年の10月に始まるのです。

 

ただしそれより前に、ヒトゲノム計画の実施が技術的に可能かどうかについて、予備的な検討が行われました。1990年の4月には、1991年度から1995年度までの第1期の5年間に何をすべきかをまとめた計画書が発表されました。

 

 第1期の目標がは、①平均2~5cM間隔のSTS(sequence tagged site:塩基配列のわかった場所)により構成した遺伝地図の作成。②STSをほぼ10万塩基対ごとに配置した物理地図をつくる。③1塩基あたり50セントいないのコストで大規模な塩基配列の決定ができるよう、技術開発や改良を行う。④連続した10万塩基対の長さのDNAにつき、塩基配列の決定を行う。⑤実験動物としてはマウスについて遺伝地図をつくり、1~2本の染色体について物理地図の作成を始める。⑥計画により発生する大量のデータを処理するために、データベースの設計やソフトの開発を行う。⑦倫理面に対応するため、問題点の洗い出しや対応の方針を決める。⑧人材育成のために、年間600名程度に対し教育・訓練を行う、などとなっています。また、年間2億ドル程度の予算が必要とされました。

 

わが国のゲノム計画

 

 わが国においても、1989年~90年にかけて文部科学省科学研究費による「我国におけるヒトゲノム解析の推進に関する研究」(班長:松原健一、当時大阪大学教授)が行われました。ゲノム解析の推進にあたって、わが国における関連分野の現状の調査、必要なインフラストラクチャーの整備を行い、研究グループの育成、グループ間の連携の推進などの提言と、関連する事項を、1990年10月と1991年3月の2回にわけて報告しています。

 

 1991年度からは松原班長のもとに「ヒトゲノム解析研究」が発足しました。1996年度からは榊佳之(当時東京大学医科学研究所教授)を班長とする「ゲノムサイエンス:ヒトゲノム解析に基づくバイオサイエンスの新展開」班引き継がれました。ヒトゲノムの構造解析、ゲノム機能解析、ゲノムの生物知識情報などの班に分かれて、全国の70を超える施設が協力する態勢とましました。

 

 注目したいのは、ヒト以外の生物のゲノム解析に、かなりの重点を置いたことです。大腸菌、枯草菌、出芽酵母、センチュウ、ショウジョウバエ、マウスなどです。ヒトゲノム解析で機能のわからない遺伝子が見つかったとき、他の生物で同じような構造の遺伝子を選らんで、それを壊して影響をみることができます(ノックアウトマウスなど)。遺伝子らしい構造があるが機能がわからない状況では、このようなアプローチが欠かせません。ヒトの遺伝子を壊して個人への影響をみることはできませんので。

 

 班研究終了後には、各研究室や研究者がそれぞれ、特定の遺伝子の機能や構造、染色体上の特定の部分の遺伝子や多型の分布など、ゲノムにかかわるさまざまな研究を行っています。また、ゲノムに興味をもつ研究者が大幅に増えたことで、研究が大きく進みました。

 

ゲノムを解析する

 

 ゲノム解析の進め方を見ていきましょう。まず、どの染色体のどの部分を調べるのかを決め、付近の遺伝地図をつくります。続いて付近の構造を再現するように、YACやBACなどの大きなクローンを使って、コンティグをつくります。物理地図です。それができたら、それぞれのクローンの全長に対応する小さなクローンのコンティグをつくり、最終的には塩基配列まで明らかにします。

 

 ただし、必要に応じてクローンの染色体上の位置がわからないと、全体が見えません。そこで染色体レベルの情報や解析技術も、おおいに使われました。染色体に濃淡のバンドを染め出す分染法、特に精度を高めた高精度分染法、特定のヒト染色体を1本だけ含むマウスやハムスターの雑種細胞や、放射線のて照射によってヒトの特定の染色体の一部分だけを含む雑種細胞をつくる(放射線雑種細胞)技術などが例です。遺伝子や、その他のDNA断片の染色体上の位置を確認するための、FISH法も使われました。蛍光標識した遺伝子などが、染色体のどの部分に付着するかをみる方法です。

 

 先天異常の患者にまれに見つかる染色体の相互転座も役に立ちました。相互転座は、染色体の腕が互いに入れ替わっただけですから、染色体には実質的な増減はできていません。したがって、症状がないことが多いのです。ただし、まれには異常を生じることがあります。相互転座にあたっての2カ所の切断点のいずれかに、たまたま原因遺伝子があったのです。そこで原因となる遺伝子が2つの切断点のどちらかにある、とわかります。

 

 遺伝地図をつくるためには多数のDNA多型が必要です数十塩基が反復したミニサテライトに続いて、CAの2塩基が反復した(CA)nなど(CAがn回反復)、マイクロサテライト多型(2塩基から数塩基ほどを反復単位とする反復配列)がたくさん見つかりました。

断層的ショットガン法

 また、米国ユタ州のモルモン教徒は、家系を非常に大事にして記録を残しているため、彼らの協力で大きな家系のDNAを集めることができました。それらを含めて多数の家系のDNAを集めたフランスの機関が、結果を同機関に知らせるという条件で、家系のDNAの提供をはじめました。

 

 その結果、多数のDNA多型が遺伝地図上にマッピングされました。1987年までに位置がわかった多型は400ほどでしたが、1994年にはすでに5800ほどのマイクロサテライト多型が、染色体上にマッピングされたのです。

 

 特にフランスのCEPH(ヒト多型解析センター)とジェネソン(フランス筋ジストロフィー協会などが設立した組織)のグループは(CA)n多型に絞って遺伝地図づくりを進め、この時期までに3000ほどの(CA)n多型の位置を決めました。さらに1996年までには5264の位置を決めたのです。

 

 ゲノムの全長は30億塩基対ですから、平均すると60万塩基対ごとに、多型の位置が決まったことになります。遺伝地図上の距離でいえば0.6cMですから、ずいぶん高い精度の遺伝地図ができたことになります。まさに遺伝地図づくりの主役です。

 

物理地図の完成

 

 YACクローンが連続したコンティグをつくり、ゲノムをカバーする物理地図をめざしての研究でも、フランスは大きな役割を果たしました。YACクローンは100万塩基対までの長さがありますから、0.5~1.0cMほどの間隔の遺伝地図があれば、コンティグをつくれるのです。完成によって世界の研究者たちは、調べたいと思う病気の遺伝子がどの染色体のどの位置にあるのか、遺伝地図上の場所さえわかれば、その場所のYACを手に入れて、原因遺伝子に迫ることができるようになりました。もちろん、ゲノムの解析にとっても、YACコンティグは欠かせません。

 

ゲノム解析をスピードアップした技術ゲノム研究に取り組んだ米、英、日、仏の(あとから独と中も加わった)合わせて20の研究グループは、全体の遺伝地図からYAC(その後、より安定なBACの使用が増えた)クローンによるおおまかな物理地図、さらに細かい物理地図と段階を追って、解析を進めました。「断層的ショットガン法」です。

 

 1999年3月には、塩基配列はゲノム全体の15%ほどしかわかっていませんでした。しかし、その後の15か月ほどの間に、90%まで解析が進んだのです。高速で塩基配列の解読ができるキャピラリー(毛細管)方式の登場で、解析のスピードが大きく上がったことがこの結果につながりました。従来の板状のガラスに挟んだゲルを使う電気泳動では、高い電圧をかけると発熱によりガラスが割れるなどの事故が起きるため、低い電圧でゆっくり泳動するほかなかったのです。ガラスの毛細管はごく細いために相対的に放熱が大きくなり、高電圧が使えるので大幅なスピードアップが実現しました。開発したのは、日本の企業です。

 

 なお。ベンター(C.Venter)に率いられた米国のセレーラ・ジェノミクス社は、ゲノム全体のDNAをまとめて短く切り、その断片の塩基配列を片っ端から調べてコンピューター上で連結する「ホールゲノムショットガン法」を選びました。

ゲノム解析のアプローチ


ヒトゲノム計画


DNAの長さに基づく地図

 

 物理地図は、物として実体のあるDNAをベースにつくる地図です。長さの単位は、何千塩基対(以下、1000塩基対を1kbと表示、キロベース)とか、何百万塩基対(100万塩基対を1Mbと表示、メガベース)です。

 

 染色体レベルの解析で、遺伝子やDNA多型の位置を決めるのも、一種の物理地図ですが、通常はクローン化したDNAを集めて染色体上の配列を再現するように並べた、コンティグを意味しています。

 

物理地図をつくる

 

 たとえば1番染色体の全長にわたる物理地図をつくるとしましょう。まず、ヒトの1番染色体を含むマウスなどの細胞(雑種細胞)をつくります。ヒトとマウスの細胞を融合した雑種細胞では、ヒトの染色体が徐々に失われ、時には1本だけが残るので、そのような細胞ができるのです。そのDNAを抽出して、YACなどに挟み込んだライブラリーをつくります。ヒトのDNAは他の動物と簡単に識別できますので(含まれる反復配列が違う)、ヒトの1番染色体に由来するYACクローンを拾い出すのは簡単です。薬品処理によってヒトの細胞核をバラバラにし、染色体1本だけを含む微小核を得て、雑種細胞をつくる方法もあります。

 

 ヒトのクローンそれぞれについて、制限酵素による切断店の分布、あるいは特定の塩基配列の有無などを調べ、部分的に重複している複数のクローンがあれば、互いに連結したものとみなします。そのような操作を繰り返すことで、次々にクローンをつなげ(コンティグをつくり)、染色体の全長をカバーすまで延長していくのです。

 

 2つのクローンの間に重複している場所がないと、相互の位置関係はわかりません。重複している場所さえあれば、互いの位置関係がわかります。YACなど長いDNAのクローンほど、地図づくりに有利なのです。

image1 (9)

 1992年ごろから、最近人工染色体(BAC)も使われるようになりました。クローン化できるDNAの長さはYACより短いのですが、挟み込んだクローンが安定であるなどのメリットがあり、最近はこちらが主力です。

 

 短い区間を詳しく調べるためには、YACやBACのクローンをさらに小さいコスミドなどのベクターにクローン化し、塩基配列の解析に進むこともできますし、BACクローンなら、そのままショットガン法で塩基配列を決めることもできます。


ヒトゲノム計画