日本のデータ流通・連携はなぜ進まないのか?――産業データにまつわる「誤解」
今後のイノベーションと社会生活の向上において、重要視されているデータの利活用。その一方で、その安全性や権利をいかに担保するかが議論されている。プライバシーなど個人に関する「パーソナルデータ」に限らず、企業が収集・保有する産業データの連携にもそうした課題はつきまとう。データ提供者や利用者、被観測者が抱く懸念・不安をどのように解消し、データの利活用を進めれば良いのだろうか。フリージャーナリスト、翻訳家である高口康太氏を聞き手に、データ社会推進協議会会長も務める東京大学大学院 情報学環 越塚登教授にお話を伺った。
データの流通が前提となる未来の社会
「データは21世紀の石油」。誰もが一度は耳にしたことがあるフレーズではないだろうか。出典となったのは、2011年の世界経済フォーラムのレポート「パーソナルデータ:あらたな資産カテゴリの出現(Personal Data: The Emergence of a New Asset Class)」。個人が生み出すデータの流通が新たな産業につながる未来を描いている。
「データは21世紀の石油」というフレーズは幾度となく引用されるようになった強烈なパワーワードだが、11年が過ぎた今もその未来像にどれだけ接近できたのかはイメージしづらい。というのも、データの利活用そのものは盛んに行われているが、その流通には大きな課題を抱えているからだ。
一般的にデータとはなんらかの手段によって取得された属性や状態を指す。それを解釈し、使いやすいように加工した状態が情報と呼ばれる。データを加工して情報にするだけではなく、なぜ流通させることが必要なのか。日本政府が2016年に提唱した未来社会像「Society 5.0」(ソサイエティ5.0)の説明がわかりやすい。ソサイエティ5.0とは狩猟社会、農耕社会、工業社会、情報社会に続く新たな社会を意味する。
今までもデータは使われていたが、それは人間が収集し分析することでしか活用できなかった。新たな時代では、AIによって自動的にデータが収集、情報としてリコメンドされるように変わるのだ。
ただ、AIによる自動的なデータ収集や解析を実現するためには、データの流通が前提となっている。私たちが今生きている社会においてもデータは活用されているが、サイロ化(断片化)、つまりバラバラな状態だ。AIやロボットの技術が発展しようとも、データの流通が実現しなければ意味がないのだ。
AIやロボットが勝手に働いてくれる社会がまだまだ先であることは仕方ないが、もっと卑近なところでデータの断片化に歯がみすることは多い。例をあげるならば、会議の設定だろうか。スケジュール管理ツールを導入している企業では参加予定者の空き時間を確認して誰もが参加可能な日程を設定することは簡単だが、ひとたび社外の人間とのスケジュール設定になると、昔と変わらず「いくつか候補時間をいただけますでしょうか」の世界が待っている。経営方針や予算管理、調達などを統合したERP(基幹システム)を導入した企業でも、外部への発注でファックスが必要になることも少なくなくない。
早くデータ流通が実現してほしいと願いつつも、一方で気にかかるのが個人情報流出などの不安だ。
これからのデータ連携はどうあるべきか、そしてデータの流通に関する不信感をどう払拭して未来社会を築けばよいのか。この問題に詳しい東京大学大学院情報学環の越塚登教授のインタビューを通じて考えたい。
「データで何ができるのか?」を知ることが第一歩
――越塚教授監修の『気象データ分析の行動化とビジネス利用』(NTS、2022年)を拝読しました。気象データはどのような分野で活用が可能かを多方面から探った内容ですが、農業への活用などわかりやすい事例だけではなく、意外な活用法があることが印象的でした。
一例をあげると、ファッション・リコメンド。気候天候にあわせて、今ニーズが高いコーディネイトをオススメするというものですが、個人の好みというデータと組み合わせて、パーソナライズした提案を行った事例や、医療保険のデータと組み合わせることで偏頭痛の発生予測モデルを構築するなど、「こんなことまで」という驚きがありました。
越塚:データ活用には、「エビデンスに基づいて判断したほうが、より効率が良く質が高い」という考えが根本にあります。すでにさまざまな活用法が生み出されていますが、まだ普及していないのが現状です。それはなぜか。2つ、大きな理由があります。「使い方がわからない」、これが第一の問題です。
例えば、スマートシティ。取り組みを進めているある街で会議を開き、具体的に何をやろうかと議論したところ、地に足がつかない空中戦のような話ばかりになってしまいました。これでは埒があかないので、データで何ができるかではなく、今一番気になっている課題を教えてくださいというと、「タバコのポイ捨て」というトピックが出てきました。ただ、こんなことはスマートシティやデータとは無関係の話だと思って意見をださなかった、と。
ですが、実際にこれはデータが使えそうな典型的な課題なのです。
アメリカで活用されているAIに「プレディクティブ・ポリシング」(予測警備)があります。過去の犯罪データ、通報記録、その日のイベントなどの情報をAIが分析することで犯罪が発生する可能性が高い地域と場所を予測するものです。実際にその場所を警官がパトロールすることで犯罪の発生件数が減らせました。英ロンドンでは救急車の配置にAIを使っています。出動要請が多い場所を予測して先に配置しておくわけです。
タバコのポイ捨てもデータさえそろえば同様の手法が使えるはずです。ポイ捨てが多い場所と時間を予測して、スタッフによる注意喚起や喫煙所の整備で被害を軽減できるでしょう。これを導入するためには、それだけのデータを揃える予算があるかという問題の前に、まずデータによってポイ捨て対策ができるという知識が必要になるわけです。
――データを使って課題を解決する、その立て付けを考える人材が不足しているわけですね。
越塚:そのとおりです。データがたくさんあれば自然と問題が解決するという誤解が広がっていることもある。そんなことはありません。データは神様ではないのです。課題解決に適切なデータがあれば、鋭敏に“気づく”ことができるだけなのです。
例えば車の保険料。どんなに安全運転をする人でも、年齢があがると保険料が上がるのがこれまでのやり方でした。そこで、年齢が高くても安全運転している人の保険料を安くするといったことをやりたいのですが、その人の運転が安全かそうでないかなんてどうすればわかるのか、とお手上げ状態になってしまいます。ですが、IoT(モノのインターネット)によって、1台1台の走行データが取得できるし、いまでもカーナビに走行データを送っています。ここで、IoTやカーナビのデータから、保険料のことを鋭敏に気づくことができるか、がポイントです。
個人情報の課題は「感情」のケア
越塚:データで何が解決できるのか、わかっていても実行できないケースもあります。それが第二の課題である、データの不足です。データ活用の話になると、企業や自治体からは「データはたくさん持っている」という声がすぐあがります。ただ、本当にそうかというと、必要なデータがすべてそろっていないケースが結構多いのです。
例えば、ソリューションを組むのに100種のデータが必要だとすると、そのうち1種類でも欠ければソリューションはできないのです。そして、そのラスト・ワンピースがプライバシーの問題がからむ個人情報や計測が難しいデータであることが多々あります。
他のわかりやすい例で、農業のデータ活用があります。農業栽培用の温室では、温度管理などのデータはしっかり記録されているので、一見ソリューションが組みたてやすいように思います。しかし、最終的な収穫物の出来がどうだったのかというデータがないことがネックとなっています。
――必要なソリューションを組むためにデータがそろっているかという視点が重要になると。ないデータはどうにか計測するしかないわけですが、他者が持っているデータを流通する仕組みをどう整えるかがもう1つの課題です。もっともイメージしやすい個人情報については長らく議論されていますが、人々の不安は拭えません。
越塚:個人情報に関してはすでにルール作りが進展しています。法制度だけではなく、感覚も含めた課題が大きいのです。法律に違反していないケースでも反発を受けて炎上してしまう、今までは認められていたことが急に批判されるといった、予測できないトラブルが続いているため、企業はどう手を出していいのかわからない。
海外ではプライバシー・インパクト・アセスメント(PIA、プライバシー影響評価)と呼ばれる仕組みを取り入れている場合もあります。個人情報を活用するプロジェクトを行う際にその影響を評価し、関連するステイクホルダーと事前に議論し、同意を獲得するという手法です。
産業データ流通を阻む「誤解」
――データの流通というと、個人情報ばかりに注目が集まりますが、企業が保有する産業データの流通も課題です。デジタル庁の「プラットフォームにおけるデータ取り扱いルールの実装ガイダンス Ver1.0」では以下のような懸念があると紹介されていました。
大きく分けると、外部に提供したデータが目的外の使われ方をされるのではないか、流出されないようにちゃんと機密を守る体制があるのか確認できないというデータ保護の不安、そして貴重なデータを提供しても正当な報酬が得られないのではないかという利益面の不安があります。
越塚:産業データの流通が進まない理由は複合的です。第一に「データは石油だ、宝だ」と言われると、そんな貴重なものならなおさら外に出せないという考えになってしまう。石油はモノなので所有できますが、データは簡単にコピーされてしまいます。データには所有権はなく、コントロール権だけがあると言われるゆえんです。一度流通させればコントロールできないとなると、慎重になってしまう。
第二にデータの流通だけでは対価を生むことが難しいという点です。例えば、日本で取り組みが進むデータ流通の制度に情報銀行があります。通常の銀行はお金を流通させることが仕事であり、預かったお金を使って直接事業を行うことは認められていません。しかし、情報銀行は自らデータを使ったサービスを行うことが可能な方式です。データ流通だけではビジネスとして成り立たないとの判断からです。
そして第三に、データの活用の水準がまだ低いという点です。今は特定のデータがすぐに何らかの答えやソリューションに直結するような単純な手法ばかりで、データを知った者勝ちみたいになっている。すると、結局データを持っているか持っていないかでしか差別化できていないため、データが流通してしまうとその企業は優位性を失ってしまう。ただ、この先データをどう活用するかという、アルゴリズムやノウハウの方で競われるようになれば、データを囲い込んでおくインセンティブは失われるでしょう。
これらをまとめると、データは専有できないという前提を共有した上で、どうビジネスを作るかが求められるのではないでしょうか。
データ活用の進展は長期戦
――お話をうかがっていると、データ連携が実現する未来はまだはるか先にある、日本は取り残されているという印象を受けます。
越塚:日本の立ち後れにはいくつかの理由があります。1つには、日本が「良い国」だからデータの活用が進まないということもあると思います。
――「良い国」、ですか?
越塚:例えば、海外でサプライチェーンマネージメントでのIoT(モノのインターネット)、データ活用が進められた背景の1つに「シュリンケージ」(Shrinkage)があります。製造した商品が輸送され、卸業者を経由して、小売店に届く。そのあいだに在庫が少しずつ減っていくことを意味します。事故による破損などもありますが、盗難も大きな問題でした。シュリンケージによって失われる在庫は全体の20%に達するという報告書もあります。
データの活用によってこの損失を減らすことができれば、企業にとっては大きな利益になります。これがデータ活用推進のための原資となったわけです。ところが日本はデータ活用を進めなくても、シュリンケージはさほど大きな問題とはなっていない。もともとうまくいっていたわけです。そうすると、あえてリソースを費やしてまでサプライチェーン管理にデータを活用する動機が失われます。
この原資の問題はほかの場面でもつきまとってきます。いわゆるDX(デジタル・トランスフォーメーション)にしても、日本企業の取り組みが遅いのには理由があります。DXとはつまるところ省人化です。需要に応じた供給が実現できていない場合には、雇用を増やさずに供給を拡大できるため導入には支障はありません。
逆に需要と供給がつりあっている場合にはDXに取り組んだ場合、従業員を減らすことにつながります。このケースでも雇用削減に躊躇がない欧米企業はDXに踏み込めますが、雇用維持を至上命題とする日本企業には難しい。
――やはり突破口が見当たらないのでは。
越塚:私は楽観的です。長年、データに関する研究を続けてきて、データの活用は一歩ずつしか進まないと体感しています。皆さんはどうしても情報技術の延長線上にデータを考えてしまうので、数年でゼロから世界的なサービスが立ち上がるようなIT企業の速度感を期待してしまう。
ですが、データの活用にはコンセンサスが必要ですし、個人データに関する感覚的な問題に配慮する必要もある。問題ごとに個別のソリューションを見つけなければならない。一気に拡大できないわけです。
出遅れているかもしれませんが、個別分野で1つずつ取り組まなければならないデータ活用では日本の強みが生きてくる展開もあるのではないでしょうか。製造業や物流の現場を科学的な見地から、つまりはデータを活用しながら改善していくというのは日本が得意としてきました。
日本からはGoogleやAmazonが生まれていないという悲観論も聞かれますが、彼らビッグテックが持っているデータは世の中全体からみればごくごく一部に過ぎません。データ活用の進展は長期戦、いま悲観視する必要はありません。
越塚登
東京大学大学院情報学環教授、ユビキタス情報社会基盤センター長。
1966年生まれ。東京工業大学助手、東京大学大学院助教授などを経て、2009年より現職。研究テーマはIoT(Internet of Things)やコンピュータ・ネットワークなど。特に、越塚登研究室ではデータの利活用によって産業分野や社会にイノベーションを起こすための研究を行っている。
高口康太
フリージャーナリスト、翻訳家
フリージャーナリスト、翻訳家。1976年、千葉県生まれ。千葉大学人文社会科学研究科(博士課程)単位取得退学。二度の中国留学経験を持つ。中国をメインフィールドに、多数の雑誌・ウェブメディアに、政治・経済・社会・文化など幅広い分野で寄稿している。独自の切り口から中国・新興国を論じるニュースサイト「KINBRICKS NOW」を運営。著書に『現代中国経営者列伝』(星海社新書)など。