旧サイトのdrupalデータ移行

| コメント(0)

頭の痛いdrupalのデータ移行、CMS(コンテンツマネージメントシステム)に移行した当時から思っていたことがそのまんまになってしまった。

drupalにするまえはa-newsとかmovabletypeの静的コンテンツを出力できるblogツールを使っていたが、これからはCMSだべ!とGPLのdrupalに乗り換えた。乗り換えつつ....これ引越しするときめっちゃ大変じゃないか?とこそっと思っていた。思っていた通り大工事が必要みたい。

そもそも世の中の人blogブーム去ってsnsブームですけれど過去のコンテンツどんどん捨てていってますよね。引っ越しましたリンクをつけて新しいサイトへ...気のきく人だとコンテンツごっそり移転してますけど。

今回drupalのコンテンツをなんとかmysql無しで閲覧したい(古いdrupal-5.23はmysql4.0系で動いていて、今の128bitでは動かせない、mysqlを4.1に上げれば...と思ったらめちゃ難しそう、とても趣味の片手間では出来そうにない)。すると静的コンテンツにするしかない。

調べたら方法は2つ

  • コメントやフォーラム(うちは使ってない)を無効にしてwget(または類似するツール)を使い再帰的にサイトを取得する
  • html_exportという開発中のモジュールを使って静的コンテンツを出力する

とまぁこれしかないみたい。

簡単なwgetやってみました...みごと。みごと撃沈。リンク切れ多数。ページが少なければ手修正していく気にもなるけれど800ページもあったらやってられない。

html_exportはdrupal5.x系への開発はとっくに止まっていて、中途半端なhtml_export 5.x-1.0というバージョンしか使えない、それしかないから仕方ないのでインストールして利用してみると...まぁまぁの結果。だがしかし!致命的に駄目なところはページ下部にあるページ遷移が駄目なんです。

oshii.png

1ページに表示されるコンテンツを10に設定したからだいたい80ページくらいある。ここは...1ページづつ手作業で取得して...メンテナンスかな(T T)。

コメントする

このブログ記事について

このページは、powerpcが2013年6月22日 09:58に書いたブログ記事です。

ひとつ前のブログ記事は「Java勉強 final いやはじまったばかり...」です。

次のブログ記事は「空気清浄機のモジュール分離はやっぱり駄目だった!」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。