混雑統計はどこまで信頼できるのか?東大・ゼンリンデータコムによる福一20km避難区域内人口見積。

 今日、新聞各紙が報じた東京大学大学院理学系・理学部によるリリース。着色は、筆者による。

2013/5/9
福島原発事故時の20km避難区域内外の人の流れの携帯電話の位置情報を用いた見積

  • 発表者

早野龍五東京大学大学院理学系研究科物理学専攻 教授)
足立龍太郎((株)ゼンリンデータコム 営業戦略室)

  • 発表のポイント

 福島第一原子力発電所事故による初期被ばくの解明には、放射性物質、特に放射性ヨウ素の拡散シミュレーションと、各地点における滞在人数、双方の把握が欠かせない。

 これまで、福島第一原発事故時の住民の避難行動については、避難住民の聞き取りないしはアンケート調査が唯一の方法であった。

 携帯電話の位置情報が事故時の人数分布推定に使えることに気づいた東京大学の早野龍五は、ゼンリンデータコムの協力を得て、20km避難区域内外の人の流れを可視化し、放射性ヨウ素の影響が最も多かったと思われる時期の福島第一原発周辺地域の人数分布を、客観的に推定した。

  • 発表概要

 東京大学大学院理学系研究科物理学専攻教授 早野龍五は、携帯電話の位置情報が、福島第一原発事故時の原発周辺地域の人数分布の把握に使えることに着目し、ゼンリンデータコムの協力を得て、グローバル・ポジショニング・システム(GPS)付き携帯電話の利用者から許諾を得て取得した位置情報を、個人特定できないよう統計化した「混雑統計®」データを用いて解析した。

 「混雑統計®」データによれば、事故前の20km圏内の人数は約76,000人、放射性ヨウ素濃度が最も高かったと考えられている3月14日深夜から3月15日深夜にかけての人数は、最大でも約2000人と推計された。しかし、ここに放射性ヨウ素の影響を受けやすい幼児がどれだけいたかは、このデータだけからは分からない。

[以下、略]

  • 発表内容

(1) [略]

(2) 研究内容(具体的な手法など詳細)

 GPS付き携帯電話は最近広く普及している。ゼンリンデータコムでは、許諾を得て取得した位置情報を統計処理し、観光流動・交通流動等の分析に用いているが、今回、このデータが福島原発事故時の原発周辺地域の人数分布の把握に使えることに着目した早野は、ゼンリンデータコムの協力を得て250mメッシュ内の1時間毎の人数推計値を求め、特に避難区域となった20km圏内にいた人数を客観的に推計した。

 なお、福島県内における当時のデータ取得率は約0.7%であり、人数の推計誤差(国勢調査結果との比較から求めた)は、ある領域内の人数が10,000人と推計された場合で約20%、1,000人の場合で約50%である。

 「福島県内における当時のデータ取得率は約0.7%」とあるのは、正確には、国内シェアのおよそ半分を占めているNTTドコモ契約者のうち、福島県在住者の人でオートGPSの設定をオンにしている人、という意味である。*1

 NTTドコモオートGPS設定者1人は、150人の福島県民を代表している、ということになる。

 福島県のドコモケータイ利用者が100人いたとして、そのうちオートGPS設定をオンにしている人は、1人いるかいないか、という程度である。

 すると、20km避難区域内に「最大でも約2000人と推計」しているその元は、10人強程度のNTTドコモオートGPS設定者に過ぎない。

 20km避難区域内には、被災した一般の「被災市民」とは別に、震災や原発事故の対応に当たっていた少なからぬ「災害対応者」(東京電力、消防署、警察、その他自治体、自衛隊など)もいたと思う。

 推計の元になった10人強程度のNTTドコモオートGPS設定者。「被災市民」と「災害対応者」と切り分けた上で推計したのだろうか?

 福島県では100人に1人いるかいないかという設定者比率が低いオートGPS。「被災市民」という人口集団と「災害対応者」という人口集団との間では、偏りもある気がする。すなわち、後者の方がオートGPSを使っていたりするのではないだろうか。

 災害対応者の中には技術者筋の人も多いだろうし、その分、オートGPS設定者である可能性は高くなるだろう。福島県外在住の技術者筋の人が災害対応のための応援要員として20km避難区域内に乗り込んでいたら、そのような人たちも「150人の福島県民を代表している」格好になっているかもしれない。*2

 もともと、混雑統計は、どれだけ信用できるだろうか?

 混雑統計は、 混雑度マップという名前で、いつでもどこからでもウェブで閲覧することができる。

 混雑度マップの初期画面では、「スカイツリー周辺の混雑状況」として東京都心近郊の混雑状況を表示してくれる。これだけを見れば混雑度マップ(すなわち混雑統計)は、まったく、もっともらしいものとして、見受けられる。

 しかし、混雑度マップをドラッグして、郊外に目を転じてみよう。

 確実に人が住んでいるメッシュに対して ゼロ人推計 をすることが少なからずある。

 以下は、その例である。(混雑度マップの画面をキャプチャの上、はてなフォトライフの編集機能で一部修正。以下の画像も同様。)

 私鉄沿線、東急田園都市線市が尾駅(神奈川県横浜市)のその南にあるお寺(世尊院)を含む 250m四方メッシュ。

 上の赤四角の500mメッシュ(250mメッシュが4つ組み合わさっている)には、人口がいないことになっている(2013年5月11日(土)22-23時)。

 赤四角のメッシュの左隣にある棒グラフは、その500mメッシュの過去24時間の人口推移を表している。これを見ると、その日は一部の時間を除いて、人口は存在していないことになっている。人口が存在したのは、午前3,4,5時、午後1時だけである。

 ちなみに、この赤四角メッシュに対応する500mメッシュを2010年国勢調査地域メッシュ統計(500mメッシュ)(総務省統計局)で見てみると、その人口は286人(「常住人口」*3)となっている。(「政府統計の総合窓口」の画像。オリジナルには存在しない赤四角は、はてなフォトライフの編集機能で追加。)

 参考に、Google Mapで見たこのメッシュに対応する地域の航空写真も添える。(Google Mapオリジナルには存在しない赤四角は、はてなフォトライフの編集機能で追加。)

 混雑統計は、人口密集地域では有用だろうけれども、都心近郊でさえこうなってしまうのに福島第一周辺の人口を混雑統計を用いて語ることは、本当にできるのだろうか?してよいのだろうか?

 もちろん、早野・足立論文が言うように、回収率の低いままのアンケート調査だけに頼ることなく、利用可能なビッグデータを活用を試みることは、取り組みとして正当なものである、と、私も思う。そうは思うものの…。

 早野・足立論文の人口推計が、もし、災害対応者や、県外から応援要員として投入された人たちを含めて、オートGPS設定者のことを過剰にカウントしていたら…、20km避難区域内人口が2000人という結論までも、過剰に推定していることになるかもしれない。

*1:早野・足立論文Estimation of the total population moving into and out of the 20 km evacuation zone during the Fukushima NPP accident as calculated using “Auto-GPS” mobile phone dataProceedings of the Japan Academy, Series B Vol. 89 (2013) No. 5 p. 196-199

“Auto-GPS” is a subscription-based service offered by NTT DOCOMO, INC., ... In Fukushima, about 1-in-150 residents (i.e., about 0.7%) subscribe to this service.

*2:早野・足立論文によれば、個別の携帯端末を区別する情報 unit identification number (uid) は使用されていないことになっているので、この人口推計において、携帯端末の出自が福島県内のものか県外のものかの識別は行われていないはずである。

*3:調査時に常住している場所で調査する方法(常住地方式)による人口