チームシャイニーでコロナ感染者の予測をしてみました

チームシャイニー
Google Colaboratory

緊急事態宣言が出て1週間経ちました。緊急事態宣言の効果が出るのは2週間後と言われていますが、この1週間の結果を踏まえて予測を出してみました。前回は1年後まで出したのですが、今回は3カ月先まで出してみました。見え方による違いもあるんでしょうが、4月の予測が7500人から8500人に増えてます。単純に考えても、毎日の感染者数が1000人単位で違うので「そりゃそうだよね」って感じだと思います。ちなみに、訓練データは日付と感染者数だけなので、説明変数を増やすと結構変わるかもしれません。

Google Colaboratory

緊急事態宣言が出て3週間程経ちました。テレビでも、その効果は図になって分かり易く示されています。昨日のニュースでは緊急事態宣言を1ヶ月遅らせた時に、感染者数が約7800人に戻るまで3カ月の違いが出ると言っていました。ただ、これはワクチン接種を考えていません。

さて、チームシャイニーではProphetを使って簡単に感染者予測をしていました。これによると、3月下旬には8000人に達しそうです。

何が違うんだろうと思い、図の日付を見てみると、テレビの方では10月からになっています。まずは、これを合わせてみます。しかし、これでも4月には8000人に達します。

11月からでも、12月からでも同じ感じでした。これが1月からになると4月には感染者がいなくなります⁉

緊急事態宣言の影響は当然あるのですが、1月からいきなり感染者が増え、緊急事態宣言により感染者数が減り続けているので「そりゃそうだよね」って感じですね。1次関数の傾きで考えてもそうなるのは理解できると思います。

じゃあテレビで良く見られる、緊急事態宣言まで減っていって、その後増えるラインはどのように書けるのか?というのは正直良く分かりません。感染症の数理モデルでSIR モデルというのがあるので、それも試してみると良いかもしれません。今は時系列データの一般化線形モデルだけだと思うので。

このように、コロナの日々変化していくデータを通して、データサイエンスの理解を深めていきたいと思います。

今回のソースコードは単に上の図を示すためのものをシェアしました。早いとこ、ちゃんとした資料としたいです。

Google Colaboratory

緊急事態宣言が1ヶ月伸びました。緊急事態宣言以降、感染者数が減り続けていたので、今回はどのくらいになったのか予測してみると5月までに6000人まで下がりました。前回の予測が4月に8000人なので、緊急事態宣言は確実に効果がある気がします。これでワクチン接種も始まったら、より明確になるかもしれません。東京オリンピックがどうなるかは分かりませんが、ワクチンには期待したい所です。他の国では既に始まっているので、そこの予測して比較するのも良さそうです。

ただ、予測した図を感覚的に見ていると単に感染者数の平均値をプロットしている様な感じがします。使い方が間違っているのか、何にしても僕の勉強不足なのは否定できません。資料のリンクにあるものだけでも十分に見て反映していきたい所です。

コメント