ふと、コロナの感染者数の推移と検索キーワードの相関があるのか見てみたくなり、以下2サイトからデータをダウンロードして、グラフにしてみました。
コロナ感染者数データのダウンロード
全国の日毎の感染者数のデータになります。(1月16日〜2月26日)
以下ページの”データのダウンロードはこちら”から。
ダウンロードしたものは、以下のようなものです。
検索キーワードのトレンドデータのダウンロード
“コロナ”、”在宅勤務”、”旅行”というキーワードのトレンドデータを以下からダウンロードします。
こちらは、日毎ではなく、週毎のデータになります。
ダウンロードしたものは、以下のようなものです。
スプレッドシートでグラフ化
それぞれダウンロードしたデータをスプレッドシートにコピペもしくは、挿入します。
検索キーワードの推移データが週単位になっています。一方、感染者数は、日単位になっているため
感染者数のデータを週単位にまとめていきます。
※週単位にデータを切り出す方法がわからずとりあえず手作業でまとめています。間違えないように、範囲の指定の行数を先に左側に出して検算するようにしています。
2020-03-01だと、B46:B52が日毎のデータで、4列目に、=sum(B46:B52)の式を設定しています。
↑の加工で、週単位になったので、検索キーワードのデータと並べていきます。
スプレッドシートでは、「データ探索」という便利機能があります。
データ探索機能を使用すると、表の書式を提案してくれたり、グラフや分析結果を自動で表示してくれます。
上記のスプレッドシートでこのデータ探索を適用してみます。スプレッドシートの右下にボタンがあります。
クリックすると、グラフの例サンプルが出てきます。分析までしてくれています。
グラフにオンマウスすると、グラフ挿入のアイコンが出てくるのでこちらをクリックします。
スプレッドシート内に、グラフが追加されます。
検索キーワードのオーダと感染者数のオーダが異なる為、検索キーワードの線がほぼ水平になっています。
そのため、検索キーワードについては、右軸のメモリで表示させるように変更します。
グラフをダブルクリックすると、グラフエディタが起動します。
メニューの系列を押して展開します。
右軸ベースで表示したいカラムを選択して、右軸に変更します。
上記の変更で、グラフが以下のようになります。
検索キーワードの列については、全て右軸に設定します。
コロナ感染者数の線だけ見やすくする為に、線の太さを変更します。
グラフの完成です。
第1波、第2波、第3波と感染者数の波は大きくなっていますが、コロナ、在宅勤務のキーワード検索はその波の大きさが回数を経るたびに、減っていってます。
また、波が落ち着いているときは、旅行が増えています。(GOTOキャンペーンの影響もあるのかな)
第3波が減り始め、旅行が少しあがり出しているのがわかるかと思います。
ああ、旅行行きたい。