Wednesday, January 18, 2006

Blogger のエンコードを UTF-8 に変更 [blogger]

私は,自宅でもオフィスでも使用しているメインマシンが UN*X 系 (自宅は NetBSD, オフィスは Gentoo Linux) ということもあり,習慣的にテキストは euc-jp にすることが多い.Blogger も最初の設定でエンコードを euc-jp にしたのだが,前回のトラックバック文字化け事件 があったり,今後はネットで外部に公開する文章は unicode になっていくのかなと思ったり,そもそも Blogger の初期値が UTF-8 なので様々な tips サイトも UTF-8 前提で書かれていることが多かったりということがあり,Blogger のエンコードを UTF-8 に変更した (というか戻した).

これをやって始めて分かったことだが,Blogger は外部公開用と内部保存用の文字コードがあるわけではなく,ユーザー設定の文字コードでそのままデータをエンコードしているようだ.つまり途中で文字コードを変更すると,サイトが全て文字化けしてしまう.設定を変えたら内部データも一緒に変換してくれればいいのに,この仕様はちょっと不親切だ.
まだエントリー数も少なかったので,データを手動で再アップロードをすることで回避はできたが,コメントだけはどうしようもなかった

せっかくコメントを下さった shin さん (しかも Peace Pipe の始めてのコメント!),申し訳ありませんでした.

日本の Blog サービスを使っているわけではないので,ある程度文字化けやエンコーディングの問題は覚悟していたが,そもそも今回は Blogger の初期値を変更しなければよかった…というお粗末な話である.

【2006/01/19 追記】
下記コメントにあるように,クリボウさんに「コメントの修正方法」を教えて頂いた.他人のコメントを修正できてしまうのが良いかどうかは置いておき (っていうか良くないと思うが),今回は非常に助かった.
クリボウさん,ありがとうございました.


2 comments:

kuribo said...

どうも、クリボウです。
コメントの編集については、コメントを編集するにはコメントエディターについてという記事を書いたことがあります。
エンコード変更による文字化けにも有効ですので、よければご覧下さいませ。

toshi said...

クリボウさん,素晴らしいです.
まさに「そのものずばり」の内容ですね.

おかげで該当記事のコメントを修正することができました.
どうもありがとうございます.