これまでは技術的な制約から難しかったサンプルに含まれるすべてのDNAを高速に解読する技術が次世代シーケンサの実用化で可能となった。化石に残されたDNAの分析も進んでいるが、ここでは現在の都道府県民のDNAを解読し、県民相互の類似性や特徴を明らかにした分析結果を紹介しよう。 多人数の遺伝情報を比較する場合、ゲノムの中にある「一塩基多型(SNP)」と呼ばれる部位の違いが重要になる。ヒトの全ゲノムには32億文字の文字列(塩基配列)が並んでいるが、99.9%は全人類で共通である。違いがあるのは残りの0.1%で、その多くを一塩基多型が占めている。一塩基多型の部位では、9割はAなのに1割はGというように1文字だけが異なっている。ゲノム全体の数百万か所に散らばって存在する一塩基多型をリストアップして文字列の違いを比べれば、どのヒトどうしが遺伝的に近いグループに属するかが見えてくる。東京大学の大橋順教授らは男女に共通する常染色体ゲノムの中にある18万3708か所の一塩基多型を用いて都道府県民の遺伝子パターンを解析した(注)。 (注)この記述は図録の資料名に記載した日経サイエンスの記事による。なお、東京大学のホームページでは同研究の概要が以下のように紹介されている(渡部裕介・一色真理子・大橋順「都道府県レベルでみた日本人の遺伝的集団構造」、2020/10/14)。 ヤフー株式会社が提供するゲノム解析サービスHealthData Labの顧客11,069名の138,688か所の常染色体SNP(@)遺伝子型デー タを用いて、日本人の遺伝的集団構造を調べた。まず、個体レベルで主成分分析(A)を行い、琉球人(主に沖縄県)と本土人(主に沖縄県以外の46都道府県)が遺伝的に明瞭に分かれることを確認した。なお、本研究に用いたデータにはア イヌ人は含まれていないと考えられる。 @ 単塩基多型(SNP):ヒトのDNAの塩基配列(A/T/G/Cの4種類の塩基による並び)を比較すると0.1%程度の違いがある。塩基配列の違いを多型 といい、1つの塩基の違いによる多型を単塩基多型(single nucleotide polymorphism; SNP)とよぶ。 A 主成分分析:多数の変数(多次元データ)から全体のばらつきをよく表す順に互いに直行する変数(主成分)を合成する多変量解析手法の 一つ。主成分分析によって次元を削減することで、データ点を可視化することができる。本研究では、個体単位の解析では遺伝子型を、都道府県単位での解析ではアリル頻度を変数として用いた。 冒頭の図は、この研究の中で行った主成分分析の結果を平面上に示したものである。 ソフトウエアが統計的に見出した第1主成分と第2主成分をX軸、Y軸に展開しているが、研究者に委ねられた解釈としては、図に記載された通り、第1主成分は、縄文人に近いか渡来人に近いかという特徴であり、第2主成分は地理的な近さの特徴である。 第2主成分は、第1主成分以外の各都道府県民の遺伝的な類似性であり、相互の通婚密度によるものと考えられる。そして、日本が南北に長い列島であるという特徴から第2主成分は南北方向の地理的な位置と解釈できる配置となった(日本が四角い内陸国だったら各地は同心円的に並んだかもしれない)。 全体のレイアウトは、沖縄と九州を除くと、右上がりの傾向線上に都道府県民が分布していることが明瞭である。すなわち、日本列島上を南北方向にだんだんと縄文人的な要素が弱まり、渡来人的な要素が強まっていく傾向にある。そして九州は右下がりの傾向に転じ、沖縄はさらに右方向にシフトし、縄文人的な要素が一気に強まる。 第1主成分による地域分布を図示すると以下の通りである。近畿、四国、北陸で渡来人的な要素がもっとも強いことがうかがわれる。弥生時代に最初に渡来人が上陸したと考えられている九州北部地域は思ったほど渡来人的要素が濃くない。近畿、四国、北陸は、古墳時代以降、昭和戦前期に至るまで持続的に海外移民を受け入れたので、渡来人的要素が強くなったのかもしれない。 他方、ある種の地域区分仮説は余り当てはまらないことも明らかとなる。私は北前船経済圏の影響の大きさを主張しているが、期待したような日本海側の県の地域ブロックを越えた近親性は認められないようだ。もっとも、東日本の縄文度が太平洋側に濃い点、また東北における山形の東北との近さ、あるいは北陸と近畿の遺伝的な近さは日本海側地域の相互交流の深さをあらわしているとも言えよう。 次に、各地方ブロックにおける特徴を整理した。意外なのは福島より山形の方が関東に近い点、埼玉が関東より中京圏に近い点、四国の中で愛媛が関西に最も近い点、山口は中国というより九州である点などである。
(2022年7月30日収録、8月2日東北の記述見直し)
[ 本図録と関連するコンテンツ ] |
|