旧アルゴリズムの問題: - <strong> の出現位置を問わず全て用語として分割していたため 説明文中の強調タグ(例: <strong>種類の異なる</strong>)が 偽の用語エントリになっていた(104件中80件以上が不正) - ヒントが助詞(は、が)や記号で始まるケースを除去できていなかった 新アルゴリズム: - <br> で行分割し、各行の先頭 <strong> だけを用語として扱う - 先頭より前に地の文があれば inline 強調とみなしてスキップ - hint クリーンアップに =・は を追加 - 結果: 104件 → 26件の正常エントリのみ残留 SW v8 → v9 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com> |
||
|---|---|---|
| .. | ||
| data | ||
| app.js | ||