猫並なはてな考察 このページをアンテナに追加 RSSフィード

2006-03-28

URLに使える文字 URLに使える文字 - 猫並なはてな考察 を含むブックマーク はてなブックマーク - URLに使える文字 - 猫並なはてな考察

URLに使える文字はたぶん、慣習によって決まっています。

URLに使える文字を定めたのはたぶん RFC 1738 ですが、ここでは「~」が「安全ではない文字」とされ、このことからURL中の「~」は「%7E」と記述しようという動きが1990年代にありました。

しかし、URL中の「~」は結果として広がってしまっていたので、どのブラウザでもこれをURLの一部と認めているようです。はてなでも自動リンクの対象になっています。

URLに記述できる文字は、従って多分に慣習的な要素があるのではないかと思います。あまり一般的でない文字($など)は %xx で言い換えることをユーザー自身が気をつけるようにすれば、はてなによる解決を待たなくてもローカルには解決可能になると思います。

 %20%25%2a%2f%3e%5d%7c
%21%26%2b%3a%3f%5e%7d
%22%27%2c%3b%40 _%5f ~%7e
%23%28%2d%3c%5b%60
%24%29%2e%3d%5c%7b

xnissyxnissy2006/03/31 17:52RFC 1738 は RFC 3986 で update されていますので、こちらを参照すべきでは。また、RFCで使える文字が定められていることをご存じなのに、「慣習によって決まっている」とはこれいかに。
では。

nekonaminekonami2006/04/05 17:50コメントが遅くなりました。
まぁなんというか、「疑わしきはエスケープ」で更新すれば済む話ではないかと言いたかったのでして。
もっともこのアイデアは討議の末〈検討中〉に入ったのでめでたしめでたしでENDしていますね。
RFC 1738 が 3986 で上書きされていたことは純粋に知りませんでした。RFC のこういったアップデート情報や、世の中に対する拘束力の程度について、僕はそれほど通じているわけではなかったためにこういう記述になりました。