内部リンク切れを起こさずに FC2 ブログを WordPress サイトに移行する際の手順です。
ブログ記事番号を合わせることで、FC2 ブログからの個別記事へのリダイレクトも可能なようにします。
ある程度プログラムや HTTP、HTML の知識がある人向けで、説明を端折っている部分もあります。
スクリプトプログラム等もダウンロードできるようにしていますが、環境に合わせて修正が必要となるので最終的には自己責任でご利用ください。
WordPress のバージョンは 3.3、3.4 で試していますが、Movable Type and TypePad Importer のバージョン (0.4) の方が重要です。
これ以降の説明はホスト名として実際に私が行った blogger323.blog83.fc2.com (FC2) と hetarena.com (WordPress) を使用します。
以下の条件で移行を行います。
-
http://blogger323.blog83.fc2.com/blog-entry-NNN.html を https://hetarena.com/archives/NNN に対応させます。(追記: 他のパーマリンク形式が良い人はコメント欄参照。)
-
FC2 にこれまでアップロードしたファイルは https://hetarena.com/oldimages/ の下に置きます。
手順の概要は以下の通りです。
-
FC2 ブログでエクスポートした記事と sitemaps.xml を使用して、各記事に ID (先述の URL 内の NNN の部分) を付与したエクスポートデータを作成します。
-
記事中の内部リンクの変換を行います。
-
Movable Type and TypePad Importer を一部変更し、ID を読むようにしてから記事をインポートします。
-
画像の引越し、FC2 のリダイレクトの設定を行います。
インポートするデータの作成
実際の手順では先の 1. 2 を合わせてプログラムで処理しました。
FC2 ブログの記事をエクスポートし、UTF-8 に変換して blogger323.txt として保存します。
続いて http://blogger323.blog83.fc2.com/sitemaps.xml をファイルとして保存します。
こちらの perl スクリプトをダウンロードし、先の 2つのファイルと同じディレクトリに置いて以下を実行します。
perl fc22wp.pl blogger323.txt > blogger323_wp.txt
これで「ID: 」の行が足され、更に内部リンクの変換が行われます。
perl のスクリプトについて簡単に説明すると以下の処理をしています。
-
blogger323.txt の「DATE:」行を sitemaps.xml の「<lastmod>」の日時とマッチさせ、記事番号の含まれる「ID:」行を挿入する。
-
blog-entry-NNN.html を archives/NNN に変換
-
blogger323.blog83.fc2.com を hetarena.com に変換
-
http://blog-imgs*.fc2.com/b/l/o/blogger323/ を /oldimages/ に変換
使い捨てで書いているので使用する際は「blogger323」、「hetarena.com」の含まれている行を適切に修正し、処理内容を確認してから使用してください。
まあ、短いプログラムなので見ていただければ perl を知らなくても何をしているか想像がつくと思います。
インポートの実行
WordPress に標準でついてくる「Movable Type and TypePad Importer」(Version 0.4) を使用しますが、そのままだと「ID:」行を読んでくれません。
そこで movabletype-importer.php に以下の修正を行います。
(wp-content/plugins/movabletype-importer/ の下にあるファイルにこのパッチファイルを当てても良いですが、WordPress 管理画面の「プラグイン編集」から修正するのがお手軽です)
--- movabletype-importer.php.orig 2011-01-15 09:53:03.000000000 +0900
+++ movabletype-importer.php 2011-08-02 20:22:59.000000000 +0900
@@ -388,6 +388,10 @@
$slug = trim( substr($line, strlen('BASENAME:')) );
if ( !empty( $slug ) )
$post->post_name = $slug;
+ } else if ( 0 === strpos($line, 'ID:') ) {
+ $post_id = trim( substr($line, strlen('ID:')) );
+ if ( !empty( $post_id ) )
+ $post->import_id = $post_id;
} else if ( 0 === strpos($line, 'STATUS:') ) {
$status = trim( strtolower( substr($line, strlen('STATUS:')) ) );
if ( empty($status) )
import_id はまともに公式解説されていないパラメータなのですが、更新のときは $post->ID に、新規のときは $post->import_id に記事 ID をセットして wp_insert_post を呼ぶと希望通りの ID で記事が更新/作成されます。
安全を期すならば blogger323_wp.txt をインポートする前に記事ID の大きなダミーデータを 1つ作成してインポートしておきます。
import_id で指定した番号の記事が存在すると既存最大 ID + 1 の番号が振られて記事が作成されてしまうのですが、こうしてダミーデータを入れておけば万が一既に記事が存在していたとしてもダミーデータの後ろの番号で作成され、続く記事のインポートに影響を与えません。
そのほかもろもろ
他にもいくつか実行しておくべきことがあります。
- WordPress でパーマネントリンク設定を行って archives/NNN 形式を選んでおきます。
- FC2 にアップロードされているファイルをダウンロードして WordPress ディレクトリの下の oldimages の中に置きます。
ダウンロードするファイルが多い場合は何かツールを使うなりしてダウンロードしましょう。
(私は HTML からリンクを取り出して wget を回すスクリプトを書いたような気がします)
-
RSSフィード読者向けに FC2 側に移転告知エントリを一つ書いておく必要があると思います。
FeedBurner を使っていれば、Original Feed URL を変更することで読者の手を煩わせることなく引き続きフィードを提供することができます。
しかし、この場合もリーダー上で既読情報等がリセットされるようなので告知をしておいた方が良いでしょう。
-
どこまでやるかという問題になるのですが、ここまでの手順で救えるのは個別記事 URL です。
カテゴリーやタグつき記事に対してのリンクが記事中に大量に埋め込まれている場合、それらへの手当ても必要かも知れません。
一つの手として Redirection プラグインを使う方法を紹介しておきます。
Redirection プラグインでは正規表現も使えるので、例えば「/\?tag=(.*)」→「/?s=$1」みたいなルールを作るとかつてタグで指定していた単語での検索結果を表示するようになります。
-
WordPress サイトの準備が整ったら FC2 テンプレートに meta refresh でリダイレクトする設定を入れます。
あと rel="canonical" の <link> タグも入れておいた方が良いでしょう。
最後の FC2 テンプレートの件については説明が必要ですね。
まずはリダイレクトは以下の記述を <head> セクションに追記します。
(実際は改行なしで書いています)
<meta <!--index_area--><!--/index_area--> http-equiv="refresh"
content="0;URL=https://hetarena.com/<!--permanent_area-->
<!--topentry-->archives/<%topentry_no><!--/topentry--><!--/permanent_area-->" />
リダイレクトの設定についてはこちらの記事を参考とさせていただきました。
続いて <link> タグですが、以下の記述を同じく <head> セクションに追記します。
<!--permanent_area--><!--topentry-->
<link rel="canonical" href="https://hetarena.com/archives/<%topentry_no>" />
<!--/topentry--><!--/permanent_area-->
ところで
hetarena.com を立ち上げてからこれまでは FC2 ブログを Twitter のつぶやきアーカイブ用に使っていたのですが、最近、WordPress のカスタム投稿タイプを使えば hetarena.com 側でアーカイブしてもブログ記事と混ざらないことに気づき、FC2 ブログの方は閉鎖することにしました。
そんなこともあってこんな記事を書いてみたのでした。
ちなみにつぶやきアーカイブはこちらです。
コメントいただいたので、ちょっと追記
実行例を挙げておきます。
まずコマンドプロンプトを開きます。
アクセサリの下にありますが、スタートメニューで cmd.exe と入力してもコマンドプロンプトを実行できます。
まずディレクトリを作成します。まあ、ここはエクスプローラーで実行しても良いですが。
C:\Users>blogger323>mkdir c:\temp
C:\Users>blogger323>cd \temp
C:\temp>
強調部分が入力するところです。
ここまでで C:\temp フォルダができているので必要なファイルをそこに入れます。
そして perl コマンドを実行します。
C:\temp>perl fc22wp.pl blogger323.txt > blogger323_wp.txt
これで C:\temp フォルダの中に blogger323_wp.txt というファイルができます。