けものフレンズ1話のニコニコ動画コメント数推移で去年を振り返ってみる。
私は過去の思い出に引きずられやすい人間です。
回収したデータに関する情報
・ コメント最小時刻: 2017-01-13T12:00:46+09:00
・ コメント最大時刻: 2018-01-02T01:15:44+09:00
・ コメント数: 2,183,234 コメント
・ コメント数のうち、属性「content」を持つもの: 2,101,538 コメント
・ コメントユーザー数: 260,925 人
コメントは下記のようなJSON形式で取得することができる。
{ "content": "\u6765\u305f\uff01", "premium": 1, "anonymity": 1, "date": 1484276446, "thread": "1484126967", "vpos": 1673, "no": 1, "user_id": "u8MuDQ6Z3v91-ohPEeib9lfrjCY", "date_usec": 322818 }
contentの値にコメントが設定されている。 contentを持たないものは、削除されたということなのかは不明だが、そんな感じはする。
user_idはおそらくオリジナルユーザーID+何かをハッシュ化したもの。コメントユーザー数は重複を省いたuser_idの値の数で算出。 本当に同一ユーザーが発言すれば、同じuser_idになるかは調べていない。 また、user_id属性を持たないコメントが81,696件ほどあった。何かは不明。
とりあえず、それがオリジナルユーザーIDのみでハッシュ化されたと仮定すれば、一人あたり約8回発言したことになる。 実際はマルチポストとか工s......ゲフンゲフン。そこまで調べてないので本当のところどうなのかは不明。
一人あたりの発言数
本当に等しく発言しているのか気になってしまったので、去年を振り返る前に、そっちを見てみる。
次のグラフは、x軸にコメント回数, y軸にx軸に対応する回数のコメント行ったユーザー数によるヒストグラムになる。
......わからん
発言回数が100回以下のユーザに限定して再描画
発言数が8回未満のユーザー数は217,993人で総コメントユーザー数に対して83.5%、その総コメント数は448,006回で総コメント数に対して21.3%を占める。
逆に言えば、約2割のコメントユーザーによって、約8割のコメントが構成されている。自己啓発本でお馴染みの80:20の法則。
余談だが、一番発言しているユーザーのコメント数は4,927回。 発言数Top5の発言内容を要約すると、コツメカワウソ、みんみ教、みんみ教、コツメカワウソ、ニュース速報。
発言者に偏りがあるので、コメント内容を扱う際はそのあたりを考慮して正規化したほうが良さそう。
コメント数の推移
けものフレンズ1話配信から、いつ、どのくらいコメントが投稿されたかを見てみる。
まずは表で、月ごとの流れを見てみる。
下の表は月別コメント数合計及び平均となる。 平均は小数点第1位を四捨五入、1月のみ分母を18.5(日)にして算出。
月 | 合計 | 平均 |
---|---|---|
1 | 13,881 | 750 |
2 | 179,787 | 6,421 |
3 | 338,312 | 10,913 |
4 | 265,242 | 8,841 |
5 | 293,368 | 9,463 |
6 | 231,367 | 7,712 |
7 | 249,282 | 8,041 |
8 | 265,193 | 8,555 |
9 | 182,104 | 6,070 |
10 | 74,772 | 2,412 |
11 | 39,373 | 1,312 |
12 | 47,540 | 1,534 |
次のグラフは、x軸に日付(日単位)、y軸にx軸に対応する日付に投稿されたコメント数による折れ線グラフとなる。 また、背景が半透明の青い部分は、バースト検知(ほかの日と比べてコメント数が非常に多いと判定)されたことを表す。
バースト検知には(つかってみたかったので)NYSOLのmburstコマンドを利用した。パラメタは分布にポアソン分布を指定して、あとはデフォルト。
......(底のほうが)ぜんぜんわからん!
y軸最大値を20,000にした版も用意。
各月に関する考察(という名の思い出振り返り)
1月
まだブームになる前。
このあたりにコメントした人は、単純に興味を持った人や、アプリや漫画版からのファンという想像ができる。 アップロードから1週間は多くコメントがつくが、それからは見ての通り。それが普通なのだが......2月
初頭頃、この世界観にいち早く飲み込まれた人たちによる、某所での会話の一部や、ブログでのレビューがインターネット上に広まる。 それがウケたのか、はたまた純粋に興味をもったのかは定かでないが、話題となり、多くの人にこの作品を見るきっかけを作り、2/8前後から異常なほどのコメントがつき始める。 伝説の始まりである。3月
コメント欄が実況会場化して以降、低くても3,000強ものコメントが毎日つき始める。 あるものは現代社会と打って変わった優しい世界観に脳みそを溶かし続け、 あるものは垣間見えるディストピア感や謎に惹かれ考察を続ける中、突如爆弾が投下される。11話である。 俗に「けもフレ11話ショック」と呼ばれる事件である。 その衝撃は、グラフをみての通り。 連日15,000オーバーのコメントで先の不安を隠すかのような賑わいを見せる。「監督を信じろ」、これが3/29まで続く。 そして最終話放送の3/29には58,644ものコメントがつく。そこにはあふれかえる「ありがとう」の文字。4月
4/5の12.1話「ばすてき」公開、4/14のMステ出演、4/15の「ダーウィンが来た」でのサーバル特集、4/22以降の東武動物公園とのコラボに合わせるよう、コメント数が10,000を超える。 これ以外にも様々なマーケティングが予定され、けものフレンズブームが出来上がる。5月
コメントの平均値は3月に次いで高い。 この時期以降にはめまぐるしい数のコラボがあり、グラフのどこがなにのイベントに対応しているのか判断が困難。 5/11には再放送、5月内で最ピークの5/27には一挙生放送&ライブビューイングがあり、再度盛り上がりを見せている。6月
6月にはバースト検知こそ少ないものの、6/30にJRAとのコラボサイトがオープンするなど、まだまだブームが続く。 私はこの頃、不眠や抑鬱症状にかかりはじめ、記憶がないので余り思い出せない。余裕が持てなかったことにつらみを感じる。(日記要素)7月
アライさんがカープの危機を救い、少しずつコメント数も落ち着きつつある中、7/24に2期制作予定の情報が流れ、再びコメント欄が盛り上がる。 7/30と7/31にはTwitchでけものフレンズ一挙放送が行われ、海の向こうの人達のIQを下げたとか。 また、「ごちうさ」というコメントが目立ち始め、再生回数で対抗意識を燃やす。8月
目を引くのは8/24。この日に、けものフレンズ1話は、公式配信でも、アニメカテゴリでも初の1000万再生を突破する。 8/14日には夏休みの子供に向けて、再放送が行われることに。そこでも一時の盛り上がりを見せる。 8/29にはミサイル発射によるニュースによって、視聴者は再放送予定の12話が放送されず生殺しにされることを懸念するが、テレビ東京はけもフレ放送を決行。 テレビ東京ありがとうで盛り上がる。9月
9/18にMステ再出演、9/19にどん兵衛コラボ動画公開などで再び盛り上りを見せた矢先に、核が投下される。 俗に「9.25けもフレ事件」と呼ばれる例のアレが起きる。 9/26にコメント数27,734と、過去2位を記録。 最終話放送から半年もたった時のコメント数であることも考慮すると、ショックと呼ぶにふさわしい。 真偽こそ定かではないが、大人達の争いがあることを仄めかしたことに間違いはない。 けものが身なりを潜め、獣が浮き彫りになった。10月以降
第一次けもフレショック以降の動きとは一変し、9月末のピーク以降、コメント数はもともと落ち着きつつあったとはいえ下降気味になり、10月中旬頃からは初回配信時のコメント数を下回る。 また、コメントが完全に下火になる前の10/12にはグレープ君の......やめよう、つらい(´;ω;`)年末年始
3つほど大きな山が見える。 1つ目は12/23のTwitterトレンド大賞での受賞によるコメント、2つ目は12/27の公式による1期監督の降板報告、そして3つ目は、12/31に発見された1期監督、キャラクターデザイナー間での相互フォロー状態解除。 年内中に片付いた点は良いと思う、どんな形であれ、
去年はけもフレに始まりけもフレで終わる一年。 個人的にも、数年ぶりにアニメみて見ようと思ったり、ものすごく続きが見たくワクワクしたり、見る抗鬱剤となったりで非常に楽しませていただきまして。 あの件で色々ぱっかーんしたのは無念。 監督は監督で、けもフレはけもフレでまだ何かしようという動きはあるみたいなので、それぞれ楽しみにまってます。
久々にデータで遊んでみて、1動画のコメント数推移だけで色々情報を読み取れて面白かった。(こなみかん)
今回使ったバースト検知では、系列データ全体で1つの分布を仮定していたため、10月以降の動きが取り出せなかった。 (詳しい数式はNYSOL公式サイトにあるドキュメントにかかれているのでそちらを参照) もう少し調べるなら、あからさまにデータの発生頻度が違うところで区分けして使うとか、 Kleinbergのバースト検知みたいにデータ生成の背景にある分布の変化に強いものを使うとかしたほうが良さそう。