誤爆可能性の話。
http://d.hatena.ne.jp/n_kakka/20040625#1088095808
id:n_kakkaさんもご指摘のように、誤爆についての議論を進める前に、「誤爆」について整理してみるのが先のような気がします。
「誤爆」の定義が人により異なると、話がややこしくなるからです。
誤爆に関することに詳しそうなid:kawabeさん、id:n_kakkaさん、id:naka64さんはどのような定義・分類をしているのかかなり興味深いのですが、今後議論していく過程において「問題ある誤爆」(例:『複数の単語にまたがってリンクすることで文脈を破壊する誤爆』)と「そうでない誤爆」を切り分けるために、ぜひ一度まとめてみてはいただけないでしょうか?→id:kawabeさん、id:n_kakkaさん、id:naka64さん
最終的にはキーワード「誤爆」に記載できるようなものを作りたいのですね。
イメージとしては次のようなものです。
- 日記→キーワードへの自動リンクに際して生じるもの
- 単語単位でのヒット
- リンクされたキーワードが同一文字列の別ものをさす場合(例:Bic)
- 単語未満でのヒット
- ある単語の一部分だけがヒットしてしまう(例:アマリリス)
- 単語と単語をまたがってヒットしてしまう(例:でつ→http://d.hatena.ne.jp/n_kakka/20040617#1087464758)
- 単語単位でのヒット
- キーワード→日記への自動リンクに際して生じるもの
- 「含む日記」をたどったときに、当該キーワードがその意味で使われていない(例:p2)
(追記)
お返事をいただいてます。
いずれもこの問題に取り組む際には必読の記事といえましょう。
(追記の追記)
「誤爆」と「文脈破壊」を用語で区別するのは有用な気がします。すなわち、
- 誤爆→キーワードからみたミスヒット
- 文脈破壊→日記からみたミスヒットのうち、単語未満のもの
- ?→日記からみたミスヒットのうち単語単位のもの(→これについては「ミスヒット」と呼ぶのか意見が分かれていたはず)
こうした使い分けを意図的にすることによって、「誤爆」回避という名目の中でも、不正に使われているものが明白になってくるでしょう。