東京財団政策研究所「経済データ活用研究会」メンバー
法政大学経営学部教授
平田 英明
オルタナティブ・データとは
オルタナティブ・データ(以下、AD)は、この数年間で急速に一般的にも知られるようになった。辻中(2020)によると、ADとは財務情報や経済統計のような伝統的に利活用されてきたデータ(以下、TD:トラディショナル・データ)ではなく、POSデータ、クレジットカードデータ、位置情報、衛星画像などこれまで活用されてこなかった代替的なデータを指す。TDは、基本的には政府や企業などによって、いわば公式に発表されるデータを指す。これに対して、ADは、何らかのビジネスに関連する副産物として作られることが多い。つまり、元はビジネスユースのデータが、経済分析やビジネス分析に資するために活用されている。ちなみに、わが国には先駆的なADの事例がある。それは、コマツ(株式会社小松製作所)によるKOMTRAXである(詳しくは坂根(2015)を参照)。これは同社が製造している重機等にGPSやセンサーを付け、そこから送られてくる情報で世界中の同社製品の稼働状況等のデータを収集する仕組みである。このデータを集約して、地域レベルで見た経済活動状況または稼働率を把握できるというアイデアが10年以上前から実現していた。
ADは、実務的な優位性が高く、投資家やエコノミストにも高い利用ニーズがある。ここで実務的な優位性とは、①データの速報性、②高い更新頻度(日次、週次のデータ)、③データの確定性の高いこと(改訂がないこと)、④TDでは把握できない情報把握ができること、といった要件を指す。これらのうちのいくつかを満たすだけでも、TDに比べて経済予測等をする上では大変に有用な情報となりうる。今回の新型コロナウィルスの経済への影響を見ていく上で、特に先進国でADが積極的に利用されたのは、刻々と変わる状況を把握したいという分析目的とADの実務的な優位性が合致したことが主因であろう。
オルタナティブ・データの利用実態
今回の論考のために、新型コロナウィルス問題の本格化以降の経済分析において、どの程度ADが実際に活用されているのかを調べてみた。例えば、本年4月に公表された国際通貨基金(IMF)のWorld Economic Outlook (IMFのフラッグシップレポート, WEO)では数個の図表での利用にとどまっていたが、6月に公表された世界銀行のGlobal Economic Prospects(世銀のフラッグシップレポート, GEP)の場合、全図表に用いられているデータ出所全127のうち、広い意味でのAD関連は20~30程度にのぼることがわかった。発表タイミングの違いは、問題の世界的な深刻化を踏まえてADのニーズを高めた可能性が示唆される[1]。
GEPの活用しているADを出所タイプ別に分類してみると、大きく三種類に分けられた。一つ目はオンラインのサービス関連のデータ、二つ目は大学関係、三つ目はその他の非営利団体等によるデータである。以下では前者の二つについて簡単に考察してみたい。
まずオンラインサービス系のデータとしては、Google、OpenTable、HomebaseといったIT関係の企業の提供するデータが活用されている。例えば図1:Figure. 1.1.C. Change in global activity indicators in 2020では、大気汚染の度合い、家計のリクレーション目的の移動状況、飛行機のキャンセル度合い、レストランの予約状況、といったデータを用い、新型コロナウィルスの世界的な感染拡大後の経済活動の落ち込み状況を示している。この中では特に、飛行機やレストランの落ち込みが激しいことが示されている。
図1:Figure. 1.1.C. Change in global activity indicators in 2020
Source: Air Quality Open Data Platform; Airportia; Google; OpenTable; World Bank.
また、Homebaseという米国の中小企業向けの労務管理等のソリューションを提供するIT企業による、自社のクライアント企業のデータを用いた業種別の労働時間の図表もGEPでは用いられている(Figure1. 4. A. Reduction in Hours Worked)。Figure1.4.A. を直近まで延長した図2によると、業種間で労働時間の減少度合いが大きく異なることが一目瞭然である。わが国の中小企業でも、似たような業種別の差が存在したことが予想されるが、このようなデータがないため、検証不能である。ただし、例えばHomebaseの取引先が、一体どの程度の中小企業をカバーしているのかの詳細はわからない[2]。このため、このデータが中小企業全体の状況をどの程度を反映したものなのか、判然としないといった問題点がある。またこれは総じてAD全般に言えることであるが、長期間のデータが(現時点では)取れないという都合から、今回のGEPでの分析では、ADについては、新型コロナウィルスが始まる前の時点(例えば昨年末など)のデータと比較したり、前年同時期と比較したり、ケースバイケースの対応をしている。経済データは絶対値で見ることにも意味があるが、なんらかの比較を通じて見た方がデータの傾向がわかりやすい。そのため、各ADのデータの特徴や制約を踏まえつつ、世界銀行もかなり苦労しながらADを活用していることがわかる。
図2 米国の産業別労働時間
注:World Bank (2020) のFigure 1.4.A. Reduction in hours workedをHomebase社のデータ用いて9月12日分まで更新した。数値は7日間移動平均。2020年1月4~31日と比べた労働時間の変化率。
次に大学系のADのデータソースについて紹介しよう。ニュースでも頻繁に登場したJohns Hopkins大学(JHU)による新型コロナウィルスの感染状況のデータは世界中の感染状況が一覧できるという意味で、極めて秀逸である。ただし、このデータは同大学自体が集計しているのではなく、各国で集計されたデータをJHUが集約して紹介しているものである。JHU以外にも、Yale大学やOxford大学が、新型コロナウィルスに関連した各国の金融関連の情報や政府の政策対応に関する情報を日々集約して公表している。このようなデータは、高い頻度で更新されているため、結果的にAD的に活用されている。しかし、各大学(正確には各大学の研究所等)がデータ・ベンダー(データベースの販売業者)のような役回りを、アカデミックな視点から無償で行っている取り組みととらえるべき性格のものである。すなわち、大学系の取り組みでは多くの場合、様々なデータを比較可能な形で集約・加工し、データの定義なども丁寧に紹介しながら、情報をオープンにしている。
オルタナティブ・データ時代の課題
以上見てきたように、ADにも一次統計的なタイプもあれば、加工統計的なタイプもある。TDも存在する中で、利用者からすると、どれを使うべきなのかという判断はなかなか難しい。一昔前であれば、経済統計に関する紹介の書籍をガイドブックに、目的に資するデータを探せばよかった。しかし、これからの時代、ADも使う必要に迫られるユーザーたちにとって、紹介が包括的に行われていないという難しい時代になる。すでに、このような課題は専門家の間では意識されており、様々なデータベンダー企業が、TDに加え各種のADを利用できるようにデータベースの拡充を進める動きが見られる。TDと同じようにADが手軽に活用できるならば、そのデータベースの利便性が高まるためである。
以上を踏まえると、残念ながらADは現時点においては万能とは言い難い。利用する上では、分析の目的に資するデータかどうかを考えた上で、そのデータの特徴をきちんと理解して分析に用いないと、不適切な分析を行ってしまうことにつながりかねない。筆者の知る限りにおいては、データの定義等に関する情報開示がまだまだ曖昧なケースが多い。その意味でも、ADをTDと同レベルで扱う時にはかなりの注意を要する。むろん、分析の内容によっては、TDでは分析できなかったことが可能になることもある。分析の問題意識と利用可能なADの特徴を利用者が適切に把握し、分析していく必要が出てきた時代だと言える。
なお、筆者が非常に懸念するのは、ADの大半が民間の企業から提供される点である。企業にとってデータを提供するメリットがある場合は、データが売れる場合、データが他者に知られても当該企業のビジネスに負の影響を与えない場合、データの公開がその企業にとってメリットがある場合、この三つに限られる。もちろん社会のために役に立つ、という問題意識でデータを提供する場合もあろうが、その場合も自社にとって不利益となるのであれば、データを開示することはないだろう。この点を踏まえると、データが企業によって都合よく修正されてしまうリスクを懸念せざるを得ない[3]。筆者はADを毛嫌いしているわけではなく、むしろその可能性に大きな魅力を感じている。しかし、この問題を解決するような仕組み(例えば、ADに関するスクリーニング(第三者によるチェック)の仕組み)が存在しない限り、(特にアカデミックな研究者にとっては)TDに取って変わるメインストリームのデータとなることは難しい。TDの欠点や課題は多々あるが、関係者の長年の苦労と変革の努力のおかげで、TDの作成プロセスの客観性・中立性は、ADのそれよりも数段優れている[4]。それ故に、現段階においてADはTDの補完的な役割が期待される存在だと言えよう。
本稿の作成に当たっては、安冨紘生氏(東京大学)にリサーチ・アシスタントとしてデータ収集等で協力を仰いだ。記して感謝したい。
参考文献
World Bank (2020) Global Economic Prospects (June 2020)
坂根正弘(2015)「建設機械に革命をもたらした「KOMTRAX(コムトラックス)」誕生の足跡」
辻中仁士(2020), 「COVID-19でにわかに注目を集めるオルタナティブデータ ~オルタナティブデータで捉える経済(1)」『経済セミナー』、2020年9月号、pp.52-57
平田英明(2019)「毎月勤労統計調査問題についての経済統計メーカーの視点~統計、複数の目で点検を」東京財団政策研究所『政策データウォッチ』6
リガーレ(LIGARE)(2020)「Google、国別の移動量データを公開 新型コロナ対応に活用期待」
[1]実際、世銀の用いているGoogleのデータの一部は3月下旬から公表されはじめたため、WEOではタイミング的にも利用できなかった(LIGARE, 2020)
[2]Homebaseによると60,000企業以上、100万人の時間給従業員をカバーしていて、飲食や小売のシェアが多いとのことではあるが、詳細は開示されていない。
[3]2012年に問題が表面化したいわゆるLIBOR問題のように、データを報告する民間金融機関が虚偽の情報を申告するケースは現実に発生している(ただし、LIBORはADではない)。
[4] TDに関する諸課題については、例えば平田(2019)参照。
平田 英明 法政大学経営学部 教授
1974年東京都生まれ。96年慶応義塾大学経済学部卒業、日本銀行入行。調査統計局、金融市場局でエコノミストとして従事。2005年法政大学経営学部専任講師、12年より現職。IMF(国際通貨基金)コンサルタント、日本経済研究センター研究員などを歴任。経済学博士(米ブランダイス大学大学院)。