新型コロナウイルス関連のニュースで「去年比で外出している人の数が○○%減少」といった事をよく聞きます。この統計、実はほとんどがNTT docomoの「モバイル空間統計」という統計システムを利用しています。
モバイル空間統計とはどういったものなのでしょうか。
モバイル空間統計はdocomoユーザーの位置情報を集めたビッグデータ
モバイル空間統計とは、NTT docomoがdocomoユーザーの位置情報を集めたビッグデータです。主に人口密度分布統計、動態統計、そして今後の人の流れの予想することに利用します。
個人情報を守りつつ有益なデータの収集する
モバイル空間統計では、プライバシーを保護しながら統計に役立つ有益な情報を集めています。
統計では、誰がどこにいるのかの情報は大事ではありません。そのため、モバイル空間統計ではまずユーザーに対して非識別化処理を行います。具体的には、契約者の生年月日を40代男性といった抽象的な情報へ変換します。
また、詳細な位置情報は必要ないため、GPSではなく、その人がどの基地局に接続しているのかという情報を利用します。そして、年齢層、性別、国籍別(主にdocomoローミングの外国人観光客)にそれぞれの基地局に接続している台数を数えます。そこに、地域別のdocomoの普及率による補正をかけ、その地域にどのような人がどれだけいるのかという推測値を作成します。これを、集計処理といいます。
最後に秘匿処理を施します。数人程度しかいない地域では誰がそこにいるのかかんたんに特定できるため、その地域の情報を削除します。
これらの手法によってプライバシーを保護しつつ、統計に利用できる時間別、地域別、年齢別、性別別、国籍別データを収集しているのです。
※dポイントクラブで実施されるアンケート情報を利用した詳細なデータも提供されています。
NTT docomo公式の動画です。
モバイル空間統計は様々な分野で利用される
モバイル空間統計のデータは政府機関、報道機関、研究機関に売られ、政策立案、研究等に利用されています。(余談ですが一説には数百万から数千万円するそうです。)
例えば外国人観光客が日本入国後にどのようなルートで観光をしているのかを追跡することで、地域創生を目的とした観光政策の立案が出来ます。
モバイル空間統計のデータを利用した情報の一例
さらに、新型コロナウイルスの影響で昨年比でどれだけ人手が減ったのかをかんたんに推測することが可能になります。こういった情報が報道機関によって共有されているのです。
こういったビックデータの情報収集はau、Softbankや、NAVITIMEといった企業も実施しています。(auはコロプラへ委託、Softbankは完全子会社のAgoopで実施している。)新型コロナウイルスの影響で注目されるようになった空間統計、これらの情報がどういった推論を導き出すのか注目です。
Source : NTT docomo, モバイル空間統計
この手法、このサービスに限らずビッグデータのスクリーニングの基本中の基本です
どのような項目を取りどう識別するか、深堀りすると面白いです
せっかくの連休ですし頭の体操でもどうですかw