スポンサーリンク

2014年01月27日

サーバー移行前後のギャップ

昨年の元日に投稿した年頭所感?「アクセス変遷と将来予測」という記事で、このブログの2013年以降の投稿記事数の予定やアクセス数、および記事あたりアクセス数の予想を公表しましたが、その頃にオフィシャルブログのサーバーが移設されて、データの均質性が失われてしまいました。

これが昨年の年頭に目論んだ、投稿記事数の予定とアクセス数の予想で、
予定とフンドシ・・
2012年までは実績値、2013年以降は予想値を示します。

それから1年の月日が流れた後に、2013年分の実績も加えてプロットし直してみると、
・・は前から外れる
投稿記事数はほぼ予定通りに減らせたものの、アクセス数の方は全く似ても似つかない(というか、煮ても焼いても食えないほど)マズい結果になりました。

 
この原因はひとえに、サーバーの移設に伴ってアクセス数が減ったことに因っているものと解釈するのが妥当でしょう。
アクセス数をカウントし始めた2005年5月9日以来(足かけ8年間)のアクセス数を藤色でプロットしましたが、変動が大きいので平滑化した線(紺色)を眺めてみると、一昨年の年末に大きなギャップが生じています。(回帰曲線は3次関数)
年末ジャンボギャップ
これを見せるために1年間のデータが蓄積されるまで待っていたとも・・ただし「減った」というのは見当違いで、それまで不自然に増えていたのが「元に戻っただけ」だろうと考えました。
他にも、突然にアクセス数が急上昇しているように見える時期が何ヶ所かありますから。

それらのタイミングを境にして何らかの補正を施せば、ギャップが目立たなくなってスムーズに繋がるのではないかと思えます。
そこで、2006年から2012年までのアクセス数にある係数を掛けてみて、スムーズに繋がるような係数を探しました。

何種類か試行錯誤した後、2006年から2012年までの補正係数として、それぞれ 1.0、0.8、0.6.0.5、0.4、0.4、0.4 を採用して補正した結果を示します。
体形補正下着のような効果
これなら不自然なく連続しているように見えます。
仮にこれらの補正係数が正しいとすると、近年は真値の2倍以上の大きな値に水増しされていたことになります。

 
ならば次の段階として、それらの係数を用いて年間のアクセス数も補正してみてはどうか、と考えを発展させた結果が下図で、
データ改ざんではない
ちょっと補正し過ぎたかも知れませんが、滑らかな変化になりました。

2014年と2015年の予想値は改めて設定し直しましたが、今年は記事の投稿間隔を7日程度に設定しており、玉置宏の如くご無沙汰する予定です。

 
ついでに、投稿した記事の文字数も調べてみました。
文字を一々数えるのは大変なので、原稿を保存したテキストファイルのバイト数(の半分)を目安にします。

全角と半角の文字が混じっているから半分よりは多いかも知れないけれど、画像のファイル名とかリンク先のURLなども原稿に含まれているので、両方の効果を打ち消せば大雑把に半分だと捉えて構わないと思います。

年間に打った文字数と、記事一題あたりの文字数の変遷を見ると、
原稿用紙にして4~5枚か
これは補正の必要が無い(誤魔化せない)数値だし、特に不自然な変化は見られません。


最近困ったのが、昨年11月26日号の週間アクセスランキングで、アクセス数が正しくない上に、アクセス数と順位との関係が乱れています。

面倒だから翌週の集計作業と一緒に直すのかと思ってたら、いつま~で待っても直らない・・♪犬の~お巡りさん 困ってしまって ワン ワン ワワン・・。


posted by 雁来 萌 |22:35 | ブログシステム | コメント(0) |

スポンサーリンク

スポンサーリンク

コメントする