SoSoraEndo2025年11月5日1 min243 字
癖の正体
LLM が日本語を書くとき、特定のフレーズを過剰に使います。学習データの偏りなので、プロンプトでは消しきれない。
多用される 10 語(日本語)
- しかしながら
- いかがでしょうか
- ご活用ください
- まとめますと
- このように
- ぜひ
- たいへん
- 〜と言えるでしょう
- 〜することができます
- それでは早速
後処理スクリプト
AI_FINGERPRINTS = [
/しかしながら/,
/いかがでしょうか[?\?]?/,
/ぜひ/,
# ...
].freeze
def clean(text)
AI_FINGERPRINTS.reduce(text) { |t, re| t.gsub(re, '') }
end
より深い対処
プロンプト側で「以下の語を使わないでください」と指示すると、生成段階で避けてくれる。後処理より上流で防ぐ方が綺麗。
まとめ
AI の癖は「内容」ではなく「語彙」に出る。10 語ほど消すだけで、書いた印象がだいぶ変わります。