2009-02-26 (Thu)
■ [?全般]検索が変なのの続きの続き

過去記事:検索が変なのの続き - toinamiの日記β - betaグループ の続きというのには微妙な話ですが。
はてなアイデアというのが出たので、あたらめて調べてみるよ。
§
参考アイデア
はてなアイデア を見ると、はてなアイデアが関連づけられています。はてなアイデアのベットコメントから必要な情報をサルベージしてみましょ。
cx20 『関連情報:iso-8859-1(Latin-1)一覧表 → http://www.shtml.jp/mojibake/ichiran.php』 (2005-05-29 03:47:54)
cx20 『utf8_general_ci の仕様? → http://dev.mysql.com/doc/mysql/ja/charset-charsets.html』 (2005-05-29 03:44:27)
このコメントの意図するところは、「UTF-8って言っているけど、実質Latin-1で照合してねぇ?」って事かしらん?MySQLを初めとして、各種D/Bの設定はしらんのですが。
§
まぁ、内部的に勝手に Latin-1と認識されているとしたら何が問題かというと、以下の枠の部分になります。(図)
ピンクの枠で囲ったあたりが「A」に似た文字、水色で囲ったあたりが「E」に似た文字。
「似た文字」というのがナンですが、要するには検索でも「同一の文字として扱う」ような設定になってたりしますね。
じゃあ、以下実例
末尾「A」での検索例
http://h.hatena.ne.jp/keywords?word=googlea
↓
- 「自分のハイクエントリーページのAds by Googleを晒す」http://h.hatena.ne.jp/keyword/%E8%87%AA%E5%88%86%E3%81%AE%E3%83%8F%E3%82%A4%E3%82%AF%E3%82%A8%E3%83%B3%E3%83%88%E3%83%AA%E3%83%BC%E3%83%9A%E3%83%BC%E3%82%B8%E3%81%AEAds%20by%20Google%E3%82%92%E6%99%92%E3%81%99
- 「googleに怒られた」http://h.hatena.ne.jp/keyword/google%E3%81%AB%E6%80%92%E3%82%89%E3%82%8C%E3%81%9F
末尾「E」での検索例
http://h.hatena.ne.jp/keywords?word=googlee
↓
- 「Google言語ツール巡り」http://h.hatena.ne.jp/keyword/Google%E8%A8%80%E8%AA%9E%E3%83%84%E3%83%BC%E3%83%AB%E5%B7%A1%E3%82%8A
- 「Google%E8」がありますね。%E8は「è」で、「e」の上にバッククオート乗ったような文字ですね。
以下略。後は好きなように。
追記
前に別の所向けで書いたけれど、2147の「ソート順」ってのはこのあたりで。コレーションとか呼ばれるヤツです。
http://www.unicode.org/reports/tr10/
ちなみに
合っている自信はないです。
Yuichirou2009/02/26 17:57これを機に自宅以外ではてなのサイトを見ることを控えてはいかがでしょうか……(汗)
toinami2009/02/26 18:09いやー。(仕事中に仕事外な所を見るのは)現実逃避なのですが、現実逃避やめたら壊れます……。
Yuichirou2009/02/26 18:43確かにわかりますが、個人的にはてなアイデアを見るのは現実逃避というか休息にならない気が……
toinami2009/02/26 21:14(つまりは、もう壊れているんですよ。実のところ)
2008-06-04 (Wed)
■ [?全般]googleのアレ

ダイアリーとブックマークでしか告知されていないけど、なんかあちこちにある気のせいが。
(出先からはアクセスできないところが多いのでわからんけど)counter,R,anondにもある。
G,Iは無い。(g:hatenaは有るが、ここは元々使っている)
追記
帰ってきたので確認。
※ツールバーの並び順
サービス | 有無 |
---|---|
アンテナ | 無 |
ブックマーク | 有 |
ダイアリ | 有 |
フォトライフ | 有 |
グループ | 無 |
ハイク | 無 |
アイデア | 無 |
メッセージ | 有 |
人力検索 | 有 |
RSS | 有 |
スター | 有 |
ワールド | 不明 |
カウンター | 有 |
グラフ | 有 |
マップ(終了してるけど | 有 |
リング | 有 |
はてラボは以下
サービス | 有無 |
---|---|
ロクロ | 有 |
セリフ | 有 |
匿名ダイアリー | 有 |
わんわんワールド | 無 |
WordLink | 無 |
SNS | 無 |
結構使っているところが多いな。元々使っていたのかもしれない。なんかIDは同じなのに、各ページでスクリプトが違うようで、微妙に気持ち悪い。
べつに、アクセス解析入れていること自体はあまり気にしていないが、何でダイアリとブックマークだけ告知なのかしらん。
# そういやどうでもいいですが、昨日の「d2」云々はもちろんネタなのであまり真面目にとらえないでくだされ/真面目にとらえている人がいるかどうかはともかく。
2008-01-25 (Fri)
■ [?全般]認証セットでユーザー直接指定しようとするとjavascript必要

Windows Mobile用IEとかで設定できないので不便です……。
# 無論「不便」というのは言葉の綾で設定することはほぼ無いのですが。
■ [?全般]認証セット登録画面の文言?

https://www.hatena.ne.jp/[id]/config/accept ページ下部
- 認証セットでは、ユーザー名や参加グループ名で直接指定する方法と、質問に答えられた人を対象とするなぞなぞ認証の2つの方法を設定できます。
- 直接指定となぞなぞ認証は両方設定することも可能です。両方設定されていて、アクセスして来た人がログインしていれば直接指定が優先され、直接指定に含まれている人にはなぞなぞ認証は表示されません。ログインしていないユーザーに対しては、なぞなぞ認証が表示されます。
2段目は、
・プライベートモードで認証セットを利用している場合に
- アクセスして来た人がログインしていて、直接指定で指定しているユーザidか特定グループに参加していればそのまま表示可能
- アクセスして来た人がログインしていて、直接指定で指定しているユーザidでもなく、特定グループに参加していない場合→ここは、なぞなぞ認証がかかるのか???
- アクセスしてきた人がログインしていない場合、なぞなぞ認証が表示されて、答えれば表示可能
一般的に読み取れるのは1.と3.で、2点目は多分そうなるだろうというところだが、試す気力はない。任せた(誰にだ)
2007-05-29 (Tue)
2007-05-25 (Fri)
2007-04-05 (Thu)
■ [?G][?全般]検索結果が変らへん

記事一覧検索結果がちょっと変 - facet-?β - betaグループ
archiveからの検索じゃないパターンでとりあえず。nobodyさんのブクマにもあるけど。
- "["+なにかで検索 →スーパーpre中にのみ検索対象があると、日付だけ結果に出る。preの外とか、シンタックスハイライト付きpre中なら(ハイライトされない物の)普通に検索される
- ダブルクオート+何かで検索 →スーパーpre中にのみ検索対象があると、日付だけ結果に出る。
- http://beta.g.hatena.ne.jp/toinami/?word=%5d%22 で検索したときの2006-12-04分とか。
- けど、ダブルクオートは2個セットで(例えば空白を含む一連の文字を検索するために)指定する物、と考えれば多少変な動きをするのはありなのか?
- "&"+なにかで検索 →スーパーpre中にのみ検索対象があると、日付だけ結果に出る。
- "\[i" など "\"をつけてみる→ スーパーpre関係なく"[i"を含むエントリの日付だけ結果に出る([i:t:実装済では]と書いていた場合など、日記ソース中(記法)の場合も含む)
これを基本として、1,2,4番目はarchiveからの検索では検索結果の日付のリンク先すら違う状態になる。
3番目は文字参照にならない文字だとarchiveにすら出ない……?
- http://beta.g.hatena.ne.jp/toinami/?word=%26PDF →2006-10-02は日付だけ
- http://beta.g.hatena.ne.jp/toinami/archive?word=%26PDF →archiveからだと検索結果無し。
まぁスーパーpre中だけなのでそれほど……というかURLの一部とかだとちょっとアレになりますか。
もっと変なパターンがあるかもしれないですが、"#",".",":","-"あたりは問題ないかもしれません。
- ("+"は<ins>や<del>で時刻がソース中に「GMT+9:00」とか埋まって謎にヒットしたりしますが)
- (%,;も実体参照とかの一部だったりして謎のヒットがあるような無いような)
- このあたりで力尽きた