【花粉情報】ツイッターで花粉の飛び具合がかわかる?!AIによる「つぶやきでみる花粉症話題度マップ」

スギやヒノキなど花粉飛散情報は、気象庁などの専門機関が科学的手法を用いて計測し発表しています。その花粉予報は花粉症に悩む人にとってかかせないもの。しかし、いつも花粉予報と自分の体感が一致しているかというと、違和感を覚える日があるのも事実。人間はひとりひとり体質が異なるので、それは仕方ありません。そこで、私たちが実際に体感している花粉飛散状況をリアルに確認することはきないものかと探していたところ、とてもユニークな調査マップが見つかりました!

「つぶやきでみる花粉症話題度マップ」とは?

http://mednlp.jp/kafun/より

それは、「つぶやきでみる花粉症話題度マップ」

ツイッターに投稿されているつぶやきから「花粉症」に関するものだけを集めて、発言時に付与された位置情報やプロフィールで公開されている場所名などから、そのつぶやきの位置を都道府県単位で特定し、日本地図に重ねて表示したものです。

つまりこのマップは花粉症の症状に関するつぶやき数を表示したものですが、ここから花粉飛散状況を推定できます。そう、「花粉症のつぶやきが多い=花粉が沢山飛んでいる」ということです。

このシステムの研究開発は、奈良先端科学技術大学院大学(NAIST)ソーシャル・コンピューティング研究室の荒牧英治特任准教授と若宮翔子博士研究員がすすめています。

先生方にもう少し詳しくシステムについてお話をお聞きしました。

 

AIによる自然言語処理でマップの精度を向上

 

 

ツイッターの中から花粉症に関するつぶやきを集めるということですが、具体的にはどのように行うのですか

 ツイッター上に発生した特定ワード、今回でいえば「花粉症」ですが、それに関するつぶやきを、24時間365日抽出するプログラムを作成して収集することができます。

 膨大な数になりそうですが、その中には花粉症というワードがあっても必ずしも症状には関係していないつぶやきも含まれていそうですね。

 

はい。そこでつぶやきを「ポジティブ」、「ネガティブ」に分別します。例えば、花粉症というワードは入っていても症状に関する内容が全くないもの、発言内容が本日または前日の内容であることを目安としてそれより古すぎるもの、などは「ネガティブ」としてつぶやきから除外します。

収集された発言を瞬時に分析して仕分けしていくのですね。

 

そうです。AI(人工知能)を使って自然言語処理(人間が日常的に使っている自然なことばをコンピュータに処理させる一連の技術であり、人工知能と言語学のひとつの分野です)を行っています。例えば、「吐き気」という症状がツイートに含まれていても、花粉症以外の原因によるものと推定される時はその発言は「ネガティブ」にするなど、ルールを策定して細かく分析処理しています。

 

症状や時間に加えて、もう一つ重要な判別基準が場所の特定です。つぶやきが本人の症状に関するものであれば、その人のプロフィール位置や発言の位置情報が花粉症発症場所になります。しかし、例えばお友達の花粉症のことに触れたつぶやきであれば、そのお友達が本人の近くにいると推定されない限り、「ネガティブ」として除外します。

 相当高度な分析ですね。

はい。これで本当の花粉症症状のつぶやきだけが取り出され、その結果、このデータが花粉症予防や治療のために患者さんや医療関係者に役立つものになると考えています。

 

花粉症以外にも活用できそうですね。

 

その通りです。私たちの研究室では、自然言語処理を中心とした情報技術を用いることで、医療を始めとした実社会の変革を出口とした研究課題に取り組んでいます。例えば、「インフルくん」というインフルエンザ流行予測も行っています。

インフルエンザは国立感染症研究所が毎週患者数を集計していますが、この数字とインフルくんの数字にはっきりした相関関係があるので、つぶやき分析で感染症の流行予測ができると言ってよいのではないでしょうか。

2020年の東京オリンピックの時にはたくさんの外国人の方々が日本を訪れると思いますが、ツイッターなどのソーシャルメディアの発言内容をチェックしていれば、これまで日本にはなかった新しい感染症流行の早期発見ができるかもしれません。

 

驚きました。今日はとても勉強になりました。「つぶやきでみる花粉症話題度マップ」をチェックして花粉飛散状況の参考にしていきます。ありがとうございました!