カレンダー

プロフィール

作者の雁来 萌(かりき もえ)は、休日になると弁当と単語帳を持参して、札幌市東区にある「北海道コンサドーレ札幌・東雁来グラウンド」(通称:カリキ)で過ごしています。 コンサドーレの次代を担う(かも知れない)若者達が、しゃかりきにボールを追っている姿を眺めて癒されています。 性別:非公開 年令:非公開 特技:非行かい? 職業:占い師、トイレ評論家 住居:熊が出没する札幌市中央区 過去記事のリストを「記事一覧」カテゴリに載せています。 コメント欄に「今後の投稿予定」を記してあり、随時更新します。 オフィシャルブログ内であれば、このブログをリンク集に加えるのはご自由で、問い合わせも不要です。 深夜・早朝のコメント投稿はご遠慮下さい。

最新のエントリー

月別アーカイブ

リンク集

カテゴリー

コメント

検索

内職的地下工作中

2009年01月31日

最近は記事をあまり書かないで、いたずらをしています。

ブログの記事を、一括してダウンロードするプログラムを作ってみました。
保存したい文章を、コピーしてテキストファイルに落とすことは手作業でも可能ですけど、記事の番号を一つずつ打って表示するのは大儀なので、あるだけ全部の記事を連続的に保存してしまうツールを作りました。


これがあれば、自分が書いた記事を全て保存することが出来ます。
私の場合は既に自分の記事を全て保存してあるので、あまりメリットはありませんが・・例えば、「この話は過去に書いたことがあったかなぁ」とか、「いつ頃書いた記事だったかなぁ」などと記憶が曖昧になった場合に、検索して見つけることが出来ます。
ブログポータルにも検索窓はありますけど、あまり役に立つ道具ではなさそうだし。

さらに例えば、他の作者の記事を全て保存したいような場合にも、一々探して画面に表示させる手間が省けます。
既に「スタッフブログ」のポータルに表示されなくなってしまった「コンサ社長日記」や「カドテツブログ」とか、もしかしたら見えなくなってしまうかも知れない人気サイトとかも、保存しておいて後でゆっくり読み返すことができます。

今のところ、文章だけは簡単に保存できますが、行頭のスペースが落ちてしまう不具合や、アルファベットにスペースが挟まったりすると途中で文章が切れてしまう不具合もあります。

もしかしたら、画像の保存も工夫すれば自動で出来るかも知れませんけど、文章のどの部分にどの写真が貼られていて、ファイル名や写真の説明はどうなってるかも確かめるとなると、やっぱり手作業の部分が避けられないようです。

※「そのプログラムを提供して下さい」というご要望には沿えかねます。注文が殺到して対応しきれない恐れがありますから。


他にも、「飼い犬につける薬」とかいうシリーズを始めたいと思ってはいますが(笑)、集中して執筆する余裕がありません。

ドールズの2次募集の申込用紙を印刷したのは秘密だ。


アクセスランキングの怪

2008年10月09日

今週(10月07日号)の週間アクセスランキングの数値が変でした。
当日の昼前にアップされた時には、1位のアクセス数【16495】が2位のアクセス数【16696】 より少なくなっていたので、夕方になって1位が【26022】に修正されました。

何を根拠にして修正されたのかは不明ながら、これにて一件落着・・ではありません。
なぜなら、前回まで3週続けて、1位の「しまふく寮通信」のアクセス数が【16495】になっていました。(つまり今週は、連続4回目の【16495】になるところだった)
4回目が間違っていたのなら、3回目も間違っていたのかも知れないし、2回目も、1回目も・・

偶然が重なって非常に稀な現象が実際に起こったのか、あるいは集計プログラムの不具合なのか、それとも人為的な操作を加えているのかは、知る由も有りません。


純粋に数学的な興味から、昨年3月以来の毎週のアクセスランキングを調べていますけど、他にも不思議に見える現象に遭遇したことがあります。

具体的に何を調べているのかというと、1位から50位までのアクセス数の減衰の仕方(順位とアクセス数との関係)であり、それぞれの順位のサイト名はどうでもよくて、数値だけを見ています。(サイト名は途中で変更されることもあるし)

週毎のアクセス数は、試合の有/無やホーム/アウェイなどによっても変わり、それはそれで興味深いけれども収集が付かなくなるので、大まかな傾向を把握するために、全部の回の平均値を並べてグラフに表示します。

分布グラフ

ピンク色のデータを大雑把に言うと、
 (アクセス数)=20000÷√(順位)
のような回帰式で表される分布をしています。
しかし、1位のアクセス数はこの回帰式(水色)より多めに外れ、4位~10位あたりは少なめに外れてしまい、上位の方のデータ値は近似が良くありません。

次に、アクセス数を順次積算していった値を黒丸で表示してみると、
 (アクセス数)=27000×(順位)の0.6乗
のような関係になっていて、こちらの曲線(赤)は良くフィットしています。

このような結果を基に、アクセス数と順位とを支配している関係は△△分布である・・とか言いたい訳ですけど、まだそこまでは解析できていません。(知識と洞察力が不足)

仮に、元々のデータに人為的な操作が加えられていたとすると、このような解析は無意味になってしまいます。
万一、「オフィシャルブログへのアクセス形態から見るコンササポの情報収集行動」のようなテーマで卒業研究をしてる人がいたとしたら、その解析の努力が無駄になってしまいかねません。

数値を公表する以上は、正しい値を提供して欲しいと思うところです。



定刻更新所の調査

2006年04月07日

※この記事は、決してブログを毎日更新することを勧めるものではありません。
私なんぞ、3・4日に1回更新するのがやっとですから。(←自慢することか?)
 

ここのブログサイトの更新状況を少し解析(?)してみました。

オフィシャルブログページの最新更新順のリストには、新しいものから50件ずつ表示されているので、更新順リストの最終ページまで見れば、サイトの総数(全てのコーナー)は分かります。
毎回見に行くのは面倒なので、エクセルのマクロを組んで、更新順リストの各ページを読み取り、サイト名順とか更新順とかで並べ替えるツールを作って利用しています。

少し踏み込んで、各サイトの更新頻度はどの程度か?という野次馬根性から、最終更新日時順に並べたデータ列を棒グラフにしてみました。(資料は4月5日の13時30分現在の値)
図の横軸(X軸)は更新順位で、左端が最新のサイトになります。
縦軸は、日時を数値に直した値で、2005年11月1日の0時を0に取り、1日経つ毎に1ずつ増えていくので、4月5日は156日目にあたります。

更新日時の順列
図 更新順に並べた更新日時の分布(2006.4.5現在、計720サイト)→拡大

左半分の傾斜はかなり緩やかですが、右寄りのX=430あたりから傾斜が急になり、X=540あたりからは再び緩やかになっています。
この曲線は・・・陸地→大陸棚→大陸斜面→深海部 と遷移する、海底水深断面図に似ている気がします。現象として、どんな類似性があるのか考えてみると面白いですが、それは各自の演習問題と・・。

【特徴】

  • 左側の傾斜が緩やかな部分は、最終更新日時が近いサイトが多いのだから、割と頻繁に更新してるサイトが集まってる、ということを示しています。
  • 傾斜がきつい大陸斜面の部分は、更新日時に開きがあるので、たまにしか更新しないサイトが並んでる、ということでしょう。
  • 最後の、深くて緩やかな部分は、勢いでブログを開設したものの、その後は更新していない、ということかな?

この図から、「最近24時間内に更新されたサイト数は130ほどである」ことが分かりました。総サイト数720の内の18%にあたります。
この数字がそのまま「毎日更新してるサイト数」ではなくて、「毎日更新してるサイト数」+「2日ごとに更新してるサイト数÷2」+「3日ごとに更新してるサイト数÷3」+・・・となっているはずです。
もちろん、曜日の違いによる変動とか、試合結果による更新意欲の変動などは考慮せず、平均されていると仮定します。1日に何度も更新しても、最終時刻だけしか残らないという不都合もあります。

さらに、「24時間前から48時間前の間に更新されたサイト数は40ほどである」ことも分かりました。
この数字は、「2日ごとに更新してるサイト数÷2」+「3日ごとに更新してるサイト数÷3」+・・・となってるはずなので、130-40=90 が、毎日更新してるサイト数になります。

以下同様に、2日ごとに更新してるサイト数=20、3日ごと=15・・・が求められました。


【蛇足】

今回のように、大きい方から順にデータを並べる手法は、「確率雨量」を求める場合にも使いますが、グラフの形はまるっきり違います。

「確率雨量」とは・・例えば100年に1回の頻度でしか起らないような大雨は何mmになるのか?を推定することで、その値を「100年確率雨量」と呼びます。
逆に、去年降った○○mmという雨量は、150年に1回しか起らない稀な現象であったので、「再現期間は150年であった」というように使います。

自分が生きている間に洪水が起こってその災難に遭ってしまったら、50年に1回でも300年に1回でも同じことですが、堤防やダムの高さを設計する場合などに利用する値です。



ここがヘンだよ、このブログ

2006年02月17日

使い勝手に色々と不満はありますが、毎日更新する訳じゃないし、有料ブログでもないので我慢しています。
投稿した記事を修正しているうちに、意外な落とし穴があることに気が付きました。
 

書きかけの記事を「非公開」の状態でエントリーしておけば、自分以外からは見えないと解釈するのが普通だと思いますが、実際には第三者からも見えてしまう場合があります。

具体的には、記事のURL: "www.consadole.net/アカウント名/article/" の次の数字を適当に打ち込むと、非公開のはずの記事でも公開記事と同じ形式で表示されてしまいます。
トップページやサイドバーに表示されないだけであって、「見れない」のではないようです。
例えば、この記事は "34" 番目ですが、試しに "35" を打つと、非公開にしてある記事が見えるでしょ?

さらに、いったん投稿してから削除した記事も、「世の中から無くなった」のではなく、実際にはサーバーに(ある期間?)残っていて、番号を適切に打てば見えてしまいます。

つまり、他人には見られたくない?失敗や秘密も、見られてしまう可能性があるんですね。
まさかいないでしょうけど、非公開だから見えないはずだと思って、備忘録のつもりで大事な情報を書いておくのは、不用心です。

見られたら困る記事がある場合、記事を呼び出して修正し、非公開の状態のまま再投稿しておくのが良いかと思います。
あわてて削除しちゃうと、かえって厄介な事態になるかも知れません。それっきり自分でも手が付けられなくなってしまい、しかもファイル自体は残存していて、見られる恐れがあったり。
鍵を持たずに外出し、オートロックが掛かってしまったようなもんですね。