posimai-root/posimai-sc/js
posimai ce195cee72 fix(posimai-sc): 用語インデックス抽出アルゴリズムを再設計
旧アルゴリズムの問題:
- <strong> の出現位置を問わず全て用語として分割していたため
  説明文中の強調タグ(例: <strong>種類の異なる</strong>)が
  偽の用語エントリになっていた(104件中80件以上が不正)
- ヒントが助詞(は、が)や記号で始まるケースを除去できていなかった

新アルゴリズム:
- <br> で行分割し、各行の先頭 <strong> だけを用語として扱う
- 先頭より前に地の文があれば inline 強調とみなしてスキップ
- hint クリーンアップに =・は を追加
- 結果: 104件 → 26件の正常エントリのみ残留

SW v8 → v9

Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
2026-04-20 22:51:41 +09:00
..
data feat(posimai-sc): 用語インデックスと試験モード、SW v4 2026-04-20 13:49:03 +09:00
app.js fix(posimai-sc): 用語インデックス抽出アルゴリズムを再設計 2026-04-20 22:51:41 +09:00