2010年02月21日

オフィシャルブログのバックアップ方法(2)

オフィシャルブログのバックアップ方法(1)の続きです。

データのエクスポート機能やバックアップ機能がないオフィシャルブログで
サイトをまるごと保存してバックアップを取る方法をご紹介しています。

フォルダダウンロード
左上にサイトのディレクトリ構造が表示されています。
「www.consadole.net」を選択して右クリックするとメニューが表示されますので、
「フォルダダウンロード」をクリックします。

フォルダダウンロードの設定ウィザード
「フォルダダウンロードの設定ウィザード」が表示されますが、
まずは左上のディレクトリ表示でダウンロードするフォルダを指定します。

ダウンロードするフォルダの選択
ここがこのソフトでバックアップを取る際の肝です!

個々のオフィシャルブログのトップページは
www.consadole.net/個々のアカウント/
なんですが、実は画像は別のディレクトリにあります。
www.consadole.net/account/個々のアカウント/images/
の中に画像があります。

普通、サイトまるごと保存ソフトはサイトのトップページより下のディレクトリのデータを保存します。
しかし、サイトのトップページより上のディレクトリにあるデータを保存できるソフトでなければ、
このオフィシャルブログの画像は保存できないのです。

そのため、最初にサイトを探査する際の設定で
「下のキーワードを含むアドレスをサイトに加える」にチェックを付け、
ご自分のブログのURLのアカウント部分の前後に「/」を付けて(当ブログなら「/consadb/」)
入力する必要があったのです。

それから、最低限必要なのは「各エントリーのページのHTMLソースと画像データ」であって、
「各月のアーカイブ」「各日ごとのページ」「RSSやATOMなどのデータ」
「カテゴリー毎のページ」まで保存しているとデータ量が無駄に増えるだけです。

そこで、保存する必要のないディレクトリ
「atom」
「category」
「daily」
「monthly」
「rss」
のチェックを外します。
もしまるごと全て保存したのであれば、チェックは外さずそのままにしておきます。

フォルダダウンロードの設定ウィザード1
保存するディレクトリの指定が終わったら、「次へ」をクリックします。

フォルダダウンロードの設定ウィザード2
このまま「次へ」をクリックします。

フォルダダウンロードの設定ウィザード3
このまま「次へ」をクリックします。
特に「ローカル環境に最適化するため、リンクを書き換える」の
選択は外さないようにしてください。
これを外してしまうと、保存した後に保存したデータをブラウザで確認する際、
ご自分のパソコンにある保存した画像ではなく、ブログの画像を表示してしまいます。

フォルダダウンロードの設定ウィザード4
ここで、保存するデータ量を確認できます。
当ブログの場合、300弱のエントリーで5MB超ありました。
このまま「次へ」をクリックします。

フォルダダウンロードの設定ウィザード5
保存するフォルダを指定します。

フォルダダウンロードの設定ウィザード5-1
ここで新規にフォルダを作成することもできます。
保存するフォルダを指定したら「完了」をクリックします。

ダウンロード中
ダウンロードが開始されます。
ここで、ダウンロードするファイルにアクセスしますので、
最低でもエントリー数分はアクセス数が増えることになります。

ダウンロード完了
ダウンロードが完了すると、確認ダイアログが開きます。
「はい」をクリックすると、保存したフォルダが開きます。

サイトデータの保存
このままソフトを終了しても問題ありません。
もし、せっかく探査したサイトデータを保存しておきたいということであれば、
「保存」アイコンをクリックしてください。
ここで保存されるのはディレクトリ構造やファイル名など「サイトデータ」であって、
HTMLソースや画像などのデータそのものではありません。
後で読み込んでサイトデータを確認することはできますが、
再度バックアップを取る際には必要ありません。

本当は、次回はこのサイトデータを読み込んで差分バックアップ
(更新されたデータ、追加されたデータだけをバックアップ)できると良いのですが、
それはできませんでした。

保存されたデータ(例)
保存されたデータはこんな感じのフォルダ構造で保存されています。
「www.consadole.net」フォルダ以下が保存されたデータです。
それより上位のフォルダは、保存した場所によって異なります。
トップページは「個々のアカウント」(私の場合は「consadb」)フォルダ内の「index.html」になります。
各エントリーのページは「article」フォルダ内に「1.html」「2.html」のように
エントリー番号が付いたファイル名で保存されています。

ダブルクリックすると、ブラウザが立ち上がってページが表示されます。

アラート
ブラウザで表示させるとこのようなアラートが表示されると思いますが、
これは広告などを表示するスクリプトが含まれているからです。
右端の×をクリックして閉じていただいて結構ですが、
他のページに遷移するたびアラートが表示されます。

アラートをクリック→アクティブコンテンツのブロック→ブロックされているコンテンツの許可
をクリックして、スクリプトの表示を許可すると、
どのページに遷移してもアラートは表示されなくなりますが、
インターネットに接続されている場合は広告などが表示されます。

画像は、あなたのパソコン内に保存された画像が表示されているはずです。
また、リンクは保存したページへのリンクはパソコン内に保存されたページへのリンクに書き換わっています。
外部サイトへのリンクや、保存していないページへのリンクは書き換わっていませんので、
インターネットに接続されている場合は、ネット上のそのページへリンクしています。



繰り返しになりますが、以下の注意事項をご理解いただいた上でお試しいただくようお願いします。


注意事項

※復旧は、保存されたHTMLファイルからテキストをコピペし、画像も1つ1つアップロードし、
 文字装飾もやり直し、1つ1つエントリーを上げなおすという「手作業」になります。
※「ウェブサイトをまるごと保存するソフト」は少なくとも1回以上バックアップをする全てのページに
 アクセスしますので、アクセス数が少なくとも総エントリー数以上増える事になります。
 当然、アクセスランキング入りしてしまうほどアクセス数が増える可能性もあります。
 「WebsiteExplorer」でバックアップを取る場合は、最低でも
 エントリー数×2+カテゴリー数+エントリーが存在している月数+エントリーが存在している日数
 という、結構なアクセス数になってしまいます。
 あまりこまめにバックアップを取ると、ランキング入りを目標とされているブログ主さんに
 ご迷惑をお掛けしますので、月1回ぐらいにとどめておいた方が良いかもしれません。
※ソフトのインストール、ご利用に関してトラブルが発生しても、当方では責任は取れません。
 あくまでも自己責任で判断・使用していただくようお願いします。


posted by しゅみっと |14:05 | コラム | コメント(0) | トラックバック(0)

トラックバックURL
このエントリーのトラックバックURL:
http://www.consadole.net/consadb/tb_ping/299
コメントする