考慮したい諸々。

  • キーワードの「統計」情報を状態遷移のトリガーとして活用できないか?
    • 参考:http://d.hatena.ne.jp/yukatti/20041208#1102506652
      • スコア高低・言及数高低で4つにキーワードをカテゴライズすると、、、
        • スコア高・言及数高→「注目キーワード」、今、旬なキーワード(おそらく映画のタイトルなど)
        • スコア高・言及数低→キーワードとしての価値が認められる言葉(ほとんどのキーワードがここに入るはず)
        • スコア低・言及数高→日常基本語彙(誤爆などの問題がおこるキーワードはここに入るはず)
        • スコア低・言及数低→私物化されたキーワード(かつての「はてな事務局」など)→削除されるべき

統計情報を活用すれば、処理を自動化しながらもわりと実情を鑑みた削除提案が可能になると思います。