CATEGORIES · 03 / 05
AI
モデル、プロンプト、alignment の周辺。数値と哲学の境界線で書く記事。(62 本)

AI
Claude Bot + 人間編集者の二段階パイプライン
Bot が draft で投入し、人間が校正 + 公開判断する。E-E-A-T を担保しながら本数を伸ばす執筆運用の作り方。
2026年5月9日 20:03

AI
Claude Code で個人雑誌を 48 時間で建てた記録
月刊・5 部門・AI 自動入稿付きの個人雑誌を Claude Code に組ませた。デザイン採択 → 全面リデザイン → 法務ページ整備までの実体験。
2026年5月9日 19:36

AI
AI が書いた文章の癖を消す
「ですが」「いかがでしょうか」「まとめると」。LLM が無意識に多用する語を、後処理で削るだけで人間の文章に近づく。
2025年11月5日 17:00

AI
評価で曖昧さを残すケース
すべてを 0/1 で判定したくなる衝動を抑える。「微妙に違う」を許容する評価設計が、本当の品質を測る。
2025年10月8日 20:00

AI
embedding コストを 1/10 にする工夫
OpenAI embedding を毎回叩いていては破産する。再計算スキップ・dim 圧縮・バッチング、3 つの基本だけで激減する。
2025年9月17日 13:30

AI
プロンプトとログをまとめて版管理する
プロンプトだけ git で管理しても、変更後の挙動を追えない。input / output / プロンプトを 1 つのコミットに含める運用。
2025年8月27日 22:00

AI
ハルシネーション対策としての出典強制
「正確に書いて」よりも「出典の URL がない情報は書くな」の方が効く。プロンプト 1 行で 80% の幻覚は消える。
2025年8月6日 14:00

AI
Claude のツール使用パターン 4 種
tool_use を「LLM がツールを呼ぶ」と素朴に考えると、4 つの設計パターンが見えてくる。委譲・ループ・並列・批評。
2025年7月23日 19:30

AI
RAG の chunk size を 256 に固定する理由
512 や 1024 でも動く。でも 256 が多くのケースで「ちょうどいい」のはなぜか。検索精度と再構成可能性のバランスから。
2025年7月9日 11:00

AI
評価 (evaluation) を test として書く
プロンプトを改善する作業を「気分」で続けると 1 週間で迷う。RSpec のように、判定可能な eval suite を最初に書く。
2025年6月25日 21:00