CATEGORIES · 03 / 05

AI

モデル、プロンプト、alignment の周辺。数値と哲学の境界線で書く記事。（62 本）

Bot が draft で投入し、人間が校正 + 公開判断する。E-E-A-T を担保しながら本数を伸ばす執筆運用の作り方。

月刊・5 部門・AI 自動入稿付きの個人雑誌を Claude Code に組ませた。デザイン採択 → 全面リデザイン → 法務ページ整備までの実体験。

「ですが」「いかがでしょうか」「まとめると」。LLM が無意識に多用する語を、後処理で削るだけで人間の文章に近づく。

すべてを 0/1 で判定したくなる衝動を抑える。「微妙に違う」を許容する評価設計が、本当の品質を測る。

OpenAI embedding を毎回叩いていては破産する。再計算スキップ・dim 圧縮・バッチング、3 つの基本だけで激減する。

プロンプトだけ git で管理しても、変更後の挙動を追えない。input / output / プロンプトを 1 つのコミットに含める運用。

「正確に書いて」よりも「出典の URL がない情報は書くな」の方が効く。プロンプト 1 行で 80% の幻覚は消える。

tool_use を「LLM がツールを呼ぶ」と素朴に考えると、4 つの設計パターンが見えてくる。委譲・ループ・並列・批評。

512 や 1024 でも動く。でも 256 が多くのケースで「ちょうどいい」のはなぜか。検索精度と再構成可能性のバランスから。

プロンプトを改善する作業を「気分」で続けると 1 週間で迷う。RSpec のように、判定可能な eval suite を最初に書く。