toinamiの日記β このページをアンテナに追加 RSSフィード

2006-06-09 (Fri)

[][]RSSが壊れるブクマらへん 16:17 RSSが壊れるブクマらへん - toinamiの日記β を含むブックマーク はてなブックマーク - RSSが壊れるブクマらへん - toinamiの日記β RSSが壊れるブクマらへん - toinamiの日記β のブックマークコメント

はてなアイデア は、http://b.hatena.ne.jp/entry/http://scienceportal.jp/portal/最近の人気エントリーから外れたことで、アイデアの文面そのものの事象は収まった模様です。

ただし、http://b.hatena.ne.jp/entry/rss/http://scienceportal.jp/portal/ が壊れている事実は代わりありませんので、今後も同様におかしくなることはあり得るのかもしれません。

 §

で、該当アイデアで、関連しているかも、的な感じのコメントを残した idea:9749ですが、こちらで例としてあげられているものは、文字化けこそするもののパースエラーと言ったひどい状態にはならないようです。

ARTIFACTさん、青空文庫など、xnissyさんの例示したサイトではHTMLRSS(RDF)もEUC-JPで提供されており、EUCなのでブクマ時にたまたま2バイト文字の区切り方をどこかで間違えて抽出されたものがあるのかもー的な感じですか。*1

サイエンスポータルのように、サーバからはEUC-JP、metaでShift_JISRSS提供なし、と言ったサイトでは何を信じて良いのやらわからないので文字化けし、その文字化け具合があまりにもひどいのでパースエラーにまで発展しているのだと思いますが、他にそこまでひどいサイトはないものでしょうか。他にも似たような指定をしているところで、同じように文字化けし、パースエラーまで出る用であれば、それだけは何とかして欲しいみたいにスタッフ宛に連絡でもできるのですが。

*1EUC-JPは、1バイト見ればその文字が2バイト文字の一部かどうかの判別は付くが、2バイト文字の前半なのか後半なのかの判別は付かないため、場合によっては文字の切り分けに失敗することがあります。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20060609