捕捉誤爆するキーワードに関して。

id:n_kakkaさん(「ちさ」に寄せて*1

捕捉誤爆を理由にしたキーワード削除の是非について、民意を問うてみる必要性を感じました。

モデレーションシステム導入前は、捕捉誤爆自動リンク誤爆の問題と表裏一体をなしており、捕捉誤爆であれ自動リンク誤爆であれ「誤爆」への対処を理由にした削除には一定の合理性が認められました。象徴的に言えば、捕捉誤爆ではずれを引いている人の背後には、自動リンク誤爆によりヘンなリンクが発生して困っている人が存在したのです。そして、以前はそうしたキーワードを削除することでお互いが得をする状況にありました。

しかしながら、モデレーションシステムの導入により、自動リンク誤爆の問題と捕捉誤爆の問題を分けて考えることが出来るようになりました。

自動リンク誤爆の不利益をこうむるのは、日記を書く人です。一方、捕捉誤爆の不利益をこうむるのは、キーワードを立てた人・利用する人です。そして、モデレーションシステムは自動リンク誤爆の日記を書く人によるコントロールを実現しました。

つまり、モデレーションシステムはこれらの利害関係を切り分けることに成功したのです。となると、誤爆→削除の合理性が失われるのではないでしょうか。これは「自動リンク誤爆が発生しなくなればいかに捕捉誤爆が発生しようと知ったことではない」と思う人がどれだけいるかに依存するでしょう*2

要するに、非効率なキーワードの立て方をしたがゆえに自分が不利益をこうむっているようなケースで、他人がおせっかいを焼いてまで、キーワードを削除する必要性があるのか、ということを問うてみるべきだと思うのです。


(追記)

http://d.hatena.ne.jp/n_kakka/20041025#1098635619


n_kakkaさんよりお返事をいただいてます*3

まず、根本的に誤解していらっしゃるようなのですが、私が今回「ちさ」を削除した理由は捕捉誤爆ではなく、「非常に多くの『複数の文節にまたがる誤爆』を生んでおり、しかも私が調べた限りで当該キーワードの意味でのヒットが存在していなかったから」です。

当該キーワードのコメント欄から意図を推察したのですが、そこでの解釈にずれが発生していたようです。意図について完全に誤解しておりました。「2日間57ページを調べましたが、この意味での言及はなく、全て誤爆でした。」のみを見ていたように思います。申し訳ありません。




まず、最初の理由(「非常に多くの『複数の文節にまたがる誤爆』を生んでおり、」)については、了解いたしました。

確かに、

  • 削除以外では対処できないような自動リンク誤爆が存在する
    • 例:複数の活用自立語・付属語を含む単語群にまたがる誤爆(ttp://d.hatena.ne.jp/n_kakka/00000306#type1)

という点は認めざるを得ないところです。

自動リンク誤爆による削除を認めると、その濫用が懸念されるのですが、これを理由にした削除をするためには「削除以外では対処できない」ということが必要ですから、ガイドライン化する際に、

を行ったうえでダメな場合には削除、という形で取り込んで行けば、手続き安定性も確保できそうな気がします。また、この規則が発動しうるのはひらがな2・3文字の単語でしょうから、逆にそれ以外の自動リンク誤爆を理由にした削除を認めない、と言い切ったほうがよさげですね。


つまり、基本的なスタンスとしては

というところなのですが、発動要件の明確さ(既存の誤爆回避手段を用いても回避不能)と対象となる単語の少なさ(ひらがな2・3文字のキーワード以外は実質上対象外)を鑑み、

  • 「D.複数の活用自立語・付属語を含む単語群にまたがる誤爆(ttp://d.hatena.ne.jp/n_kakka/00000306#type1)を生むキーワードの削除は例外的に認める」

とするのが落としどころとして妥当でしょう。





一方、誤爆率の高さ(=捕捉誤爆の多さ)を削除理由に挙げるのは認められるのだろうか、というのはわたしが上で述べたように、現在、疑問に思っている点であります。

とりあえず、

  • 捕捉誤爆というのははっきり言ってどのキーワードでも起こることであり、その根絶は不可能

であることを認めることがまず必要であり、その上で、

  • 不可能だから対処しない
  • 不可能だけど頑張ってみる

のどちらにするかを考えねばならない、でしょう。そして、その段階でコスト・ベネフィットを比較すると、「対処しない」に落ち着きそう、すなわち、「捕捉誤爆は削除理由にならない」となりそうですが。





以上を総括すると、

  • 削除以外に回避策がなかったのならばやむを得ない(条件付賛成)
    • 特に、文節破壊により誤爆回避キーワードによる対処が事実上不可能であるという点を重く評価すべき
  • 誤爆率の高さを理由にした削除には疑問(反対)

ということになるでしょうか。つまり、削除の理由としては、前段(「前者はキーワード登録による誤爆回避が不可能であることを意味し、」)だけで十分であり後段(「後者は言い換えれば誤爆率100%です。」)は蛇足だったのではないでしょうか。




なお、私は「捕捉誤爆を理由にした削除の是非」を問う前に、「自動リンク誤爆を理由にした削除の是非」を改めて問うべきと考えます。


自動リンク誤爆を理由にした削除が見られなくなった、ということは、「自動リンク誤爆への対処についてはスコアで」、という慣習が定着した証左である、とわたしは考えていたので、いわば第二stepである「捕捉誤爆を理由にした削除の是非」を問うのみで足りると考えていたのですが、手順から言えば第一stepである「自動リンク誤爆を理由にした削除の是非」を先にするのが正道でありましょう。

つまり、ご指摘はまったく正しい、と思います。

わたしは「自動リンク誤爆への対処についてはスコアで」、という慣習が定着したと考えるので、「自動リンク誤爆を理由にした削除を認めない」とする人が多数派を占めると予想しますが、予想だけで話を進めるのは危険ですから、実際に調べてみるのは無駄ではないでしょう。

*1:捕捉効率が著しく低いというのはその通りだと思うので、括弧をつけて再登録を促すのは正しい方向性だと思いました。▼とりあえず、「自動リンク」方面の問題<過度に一般的な単語・文節破壊型自動リンク誤爆>に関してはモデレーションで対処、というコンセンサスが形成されつつあるのを感じますが、「捕捉誤爆」に関しては落としどころがどこかわたしにはまだ分かりません。ただ、困ったことがあれば即座に声を上げる人が居るはてなダイアリーユーザと言う集団の中で「捕捉誤爆で困っている」という声が上がっていないように感じられますので、捕捉誤爆に関し対策を打つだけのベネフィットがあるか再考の余地ありだと思います。また、あわせて考えるべきなのは、googleで検索単語がまずくてはずれを引きまくるようなケース<例:R言語の意で'R'など>で、誰が本当に責められるべきか、ということでしょう。▼要するに、自動リンク誤爆という悪影響はモデレーションシステムで押さえられると言う状況になった今削除することによりさほどのベネフィットが得られないですから、捕捉誤爆に対処するコストを考えると、放置で共存可能ならばそれにこしたことはないのではないでしょうか。

*2:ヘンな検索キーワードでダイアリーにやってきた場合、その単語を晒す、という遊びがありますから、捕捉によるはずれくじを引くことについて日記を書いている人は寛容なのではないかと思われるのです。

*3:私信:修論予備審査おつかれさまでした。