« クッションが判らん | トップページ | バンク・キス »

2019年5月 3日 (金)

サイトマップの文字コード

今までにも、このブログのサイトマップを Google に送信しようとしたことは有るのですが、ことごとく失敗に終わっています。何かヒントは無いかと検索もしてみたのですが、解決には至っていません。

実は、このブログとは別に FlatTable 公開用のサイトを開設しているのですが、今までは、そちらのサイトはサイトマップの作成方法を知らなかったこともあり、サイトマップ無しのままでした。しかし、クロールの効率化になればと思い、最近になってその方法を調べてサイトマップを作成してみました。サイトマップには幾つか種類が有るようですが、最も簡単なテキスト形式(.txt)のものにしました。これは必要な URL を1行に1つずつ記述するだけなので簡単です。

作成して、いざ送信。しかし、結果は「取得できませんでした」。このブログのサイトマップと同じ結果です。ファイルの条件は、文字コードが UTF-8 で、拡張子が .txt なのですが、そのサイトマップは Shift-JIS で作成していました。これは、知らずにやった訳ではなくて、どうせ使用する文字は ASCII 限定なので、 Shift-JIS も UTF-8(BOM無し) も同じデータのはずだから、敢えて Shift-JIS で作成したのです(エディタのデフォルトが Shift-JIS)。しかし「取得」に失敗したので、ファイルを UTF-8(BOM有り) で作成し直して再度送信したら、今度は「成功しました」。

かつて、 FlatTable の公開にあたり、 .htaccess ファイルを BOM 有りの UTF-8 で作成したら SVG ファイルを正しく扱ってもらえなかったことが有ったので、今回も BOM 無しが良いと考えたのですが、それが間違いだったようです。

FlatTable のサイトマップ送信が成功したので、当ブログのサイトマップがどうなっているか調べてみました。サイトマップを直接ダウンロードすることは出来ないので、一旦、サイトマップにアクセスし(ブラウザに表示)、それを「名前を付けて保存」しました。得られたファイルの文字コードは Shift-JIS でした。このココログが改悪される前ならば、 BOM を追加したファイルをサイトにアップロードすることも出来たのですが、改悪された現在、その手段が有りません。一応、サポートに報告はしたのですが、どうなることやら・・・。

と、ここで話しは終わらず。ブラウザ(Chrome)経由で「名前を付けて保存」したファイルは、元のファイルと同じになるとは限らないようです。幾つか、同じ手順で保存したファイルを見てみると、ファイルによって文字コードがマチマチです。それも、元のファイルとは文字コードが違うこともあります。したがって、ココログのサイトマップが Shift-JIS だったのは、ブラウザ経由の「保存」だったからなのかも知れません。

ついでに、もう1つ。(Chrome では)テキストファイルをブラウザに表示させて、それを「保存」しようとしたら失敗しました。出来ないんですか?

訳の分からんことだらけ。

P.S.:ココログは、以前のように、任意のファイルを任意のディレクトリにアップロード出来るようにして欲しいものです。今回のこともそうですが、 MathJax の設定ファイルをココログに置いているのに、それのメンテナンスも出来ません。ココログのバカ~!←大好きって意味だよ

« クッションが判らん | トップページ | バンク・キス »

ウェブログ・ココログ関連」カテゴリの記事

パソコン・インターネット」カテゴリの記事

コメント

コメントを書く

(ウェブ上には掲載しません)

« クッションが判らん | トップページ | バンク・キス »