toinamiの日記β このページをアンテナに追加 RSSフィード

2009-04-17 (Fri)

トラックバック - http://beta.g.hatena.ne.jp/toinami/20090417

2009-03-18 (Wed)

[]23681 21:24 23681 - toinamiの日記β を含むブックマーク はてなブックマーク - 23681 - toinamiの日記β 23681 - toinamiの日記β のブックマークコメント

http://b.hatena.ne.jp/entrymobile/12577666

「続きを読む」って……。

「5.このページにアクセス」以前の部分は、もとのページから抜き出した概要部分だし、そこに本当に「続きを読む」というリンクがあり、テキスト抽出した結果をキーワード解析して、ブックマークのキーワードにリンクしているのは問題ないような。

かぶった。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20090318

2009-02-17 (Tue)

[][][]「キーワードを含むブログ」表示されない問題:スタッフから質問中 11:34 「キーワードを含むブログ」表示されない問題:スタッフから質問中 - toinamiの日記β を含むブックマーク はてなブックマーク - 「キーワードを含むブログ」表示されない問題:スタッフから質問中 - toinamiの日記β 「キーワードを含むブログ」表示されない問題:スタッフから質問中 - toinamiの日記β のブックマークコメント

キーワード界隈にやっと動きがあった模様。

はてなアイデア

hatenasupport 『2/14に修正させていただきましたが、まだ含むブログに載らないキーワードあるようです。引き続き調査させていただきます。

お手数ですが、含むブログに載らないキーワードをご存じの方は、お知らせいただけますでしょうか。こちらのコメント欄でもお問い合わせからでも結構です。よろしくお願いします。』 (2009-02-16 21:13:27)

 §

「お問い合わせ」経由で問い合わせた人か、しつこいぐらいアイデアを確認している人じゃないと気づかないところで聞かれてもなー、とは前にも思ったが……。

アイデアへのコメントで同意を求められたとき、「同意を求められている」事に気づくことが難しい。 - toinamiの日記β - betaグループ

追記(2/18)

やはり一部のキーワードは駄目だよなぁ。(まだコメントには書いていないが)

うーむ

追記2

http://k.hatena.ne.jp/keywordblog/xxxxxxxxx以下には載ってた。

http://d.hatena.ne.jp/keyword/xxxxxxxxxxは、一定個数で切られているのか?あまりに言及が多いキーワードだと

lovelylovely2009/02/18 01:26idea:11652、idea:11965あたりが実装されるといいんですけど、絶賛放置中ですね。今更アイデアのシステムをいじる気はなさそうなので、期待もしていませんが。

toinamitoinami2009/02/18 07:28なんかアイデア出てた気がしたのですが、自分でも出してましたね。
まぁあのアイデアは実装される見込みはないだろうと諦めつつ出してみただけだった覚えもあります

トラックバック - http://beta.g.hatena.ne.jp/toinami/20090217

2008-12-10 (Wed)

[] あまりまともに読んでないけど 09:13  あまりまともに読んでないけど - toinamiの日記β を含むブックマーク はてなブックマーク -  あまりまともに読んでないけど - toinamiの日記β  あまりまともに読んでないけど - toinamiの日記β のブックマークコメント

一部だけ。しかも元が何かは記載しない。

とりあえず「preのネスト」はHTMLの仕様に合っていないんじゃないかな。「引用の引用」ならなおのことblockquoteのネストの間違いだと思われ。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20081210

2008-10-24 (Fri)

[]何度、同じアイデアへの関連づけをしたのだろう。 17:37 何度、同じアイデアへの関連づけをしたのだろう。 - toinamiの日記β を含むブックマーク はてなブックマーク - 何度、同じアイデアへの関連づけをしたのだろう。 - toinamiの日記β 何度、同じアイデアへの関連づけをしたのだろう。 - toinamiの日記β のブックマークコメント

idea:21499関係。


検討すらされないidea:902

……

そう言えば、「ダイアリのコメント通知メール」という時点で何か変な気がした。

関連づけたやつは基本的にUTF-8EUC-JP or ISO-2022-JP or UTF-8への変換*1で失敗していたものだった。

ダイアリのコメント通知メールだと、EUC-JPISO-2022-JPだよな。今までどうだったんだ。

追記

うーむ。やはり何かおかしい。

コメントいただいて、そう言えばはてなメッセージ経由に変わったなと言うのは思い出したのですが、そもそもはてな上で、Unicode系(UTF-8 etc)から、JIS X 0208系(EUC-JP,ISO-20220JP,Shife_JIS)への変換時には以下の状況で成否が決まる。

文字(U) 成否
~(U+FF5E)失敗(?になる)
〜(U+301C)成功

※フォントの見た目は関係ないけど。

つまり、Windowsでの変換ルールではなく*2JIS準拠*3な変換ルールを使用していることがわかる。

 §

じゃあ、ダイアリのコメントは? と言うことになるわけですが。

EUC-JPのページで「~」というか「〜」というか……、まあ、どのように打ってもブラウザが同じ文字と解釈して、SJISの0x8160に相当するEUC-JPの0xA1C1が飛んでって、それをはてなメッセージではUnicode変換して……の時に、U→JIS変換と同じく、JIS準拠な方式なら何も問題がないはずなわけですが。

ここだけCP932ルールで変換していないか。

  1. ダイアリコメント「〜(EUC-JPで0xA1C1)」
  2. →はてなメッセージ「~(UnicodeでU+FF5E)」 ←この時点でおかしい
  3. →メール「?」

と。


in/outで同じ方式で変換かけるなら、まだ化け方のパターンはいいけど(本当は良くないけど)、in/outで違うってのはもうどうにも……。アホとしか言いようがない。

過去のアイデアで言うと 「はてなアイデア」 がそう言う状態でした。(かんれん:http://beta.g.hatena.ne.jp/toinami/20051128

もうほんと、いい加減に文字の扱いをきちんとして欲しいなぁ。

*1UTF-8からUTF-8は変換しているのかというツッコミどころもあるが

*2:CP932 http://www.unicode.org/Public/MAPPINGS/VENDORS/MICSFT/WINDOWS/CP932.TXT「0x8160 0xFF5E #FULLWIDTH TILDE」で、U+FF5E⇔SJISの0x8160

*3http://www.unicode.org/Public/MAPPINGS/OBSOLETE/EASTASIA/JIS/JIS0208.TXT の「0x8160 0x2141 0x301C # WAVE DASH」で、U+301C⇔SJISの0x8160

YuichirouYuichirou2008/10/25 00:11コメント通知メールは(UTF-8をメインとする)はてなメッセージを通じて送られるようになったことから、内部的には EUC-JP→UTF-8→ISO-2022-JP と変換されているものと思われます。

テストテスト2008/10/25 09:56~ (U+FF5E)
〜 (U+301C)

toinamitoinami2008/10/25 09:58~ (U+FF5E)
〜 (U+301C)

トラックバック - http://beta.g.hatena.ne.jp/toinami/20081024

2008-10-23 (Thu)

[][]斬新なアイデアだなー 11:53 斬新なアイデアだなー - toinamiの日記β を含むブックマーク はてなブックマーク - 斬新なアイデアだなー - toinamiの日記β 斬新なアイデアだなー - toinamiの日記β のブックマークコメント

それアイデアに出す事じゃないと思ったのは私だけじゃないはず。

連絡先とかも書いていていいのか?

と言うか、本物かどうかとかも含めいろいろと。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20081023

2008-06-30 (Mon)

[]20352に18523が関係づけられているけど関係ないのでは。 12:16 20352に18523が関係づけられているけど関係ないのでは。 - toinamiの日記β を含むブックマーク はてなブックマーク - 20352に18523が関係づけられているけど関係ないのでは。 - toinamiの日記β 20352に18523が関係づけられているけど関係ないのでは。 - toinamiの日記β のブックマークコメント

はてなアイデア」に「はてなアイデア」が関係づけられ、i:t:重複タグが付いているけど関係ないのでは。

本当に起こるかどうかは知らん(と言うか起こりえる)が、20352はアイデア発案時の事を書いているように読める。18523はベット時のコメントカウンタの話。



20352では全角は2バイトと言っているけど、UTF-8なので基本は全角文字(謎)は3バイト。

http://i.hatena.ne.jp/js/comment_counter.js

	var bytes = 0;
	for (var i=0; i<str.length; i++) {
		if (str.charCodeAt(i) <= 255)
			bytes += 1;
		else
			bytes += 3;
	}

全角文字は3バイト、と言いつつ想定外な文字は有るので、一部文字のカウントがおかしくなる。「±」「÷」とか。

UTF-8で2バイトになる文字は、U+0080~U+07FFまで。そのうち上の

if (str.charCodeAt(i) <= 255)

に当てはまるのがU+0080~U+00FFまで。この範囲に収まる文字が入力されると、少なくカウントされる虞はある。

「÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷÷」

で、「43文字」とカウンタには表示されるが、実際は256byteになる。


# ちなみにアレは「»」を入力しようとして「≫」になってしまったから(何)

追記

関連づけ解除お疲れ。

余談

関連づけるとすれば 14983かな

VSTLINKVSTLINK2008/07/15 22:42ぁぅぁぅぁ・・・おと失礼、取り乱してしまいましたワタクシとした事が。

・ »»»»»・・・の件:
  その節は失礼しますた。
・ あちこちに毎回重複タグ付けてる人の件:
  文書読解能力やコミュニケーション能力に問題があって、
  はてなで毎回問題起こしてる人みたいですね。
・ UTF8で全角3バイト換算の件
  JSのコード見て引きました。はてなのコード書いている人って
  定義や規格にきちんと従ったライブラリも作らずに
  こんな適当なコードを書き散らかしてるんですか・・・。
  これじゃあちこちで中途半端な不具合発生するのも当然ですね。

toinamitoinami2008/07/15 22:52・ »»»»»・・・の件:
>  その節は失礼しますた。
この件についてはこちらもポカしていますので……
---
daichanも,はてなのコードも対応も、全てだんだん諦めてくるようになります。
私を含め何人もはてなアイデアに対する徒労感を持っているんじゃないかと……。

トラックバック - http://beta.g.hatena.ne.jp/toinami/20080630