POSTS
記事一覧
技術、設計、AI、過程、随筆。書き散らしたものをゆっくり並べ直しています。176 本。

モデルの個性は post-training で決まる — API 運用者目線で読む
モデルの口調や癖は、学習データの量よりも post-training(RLHF / RLVR)で大きく決まります。Cybernetic Forests の記事を起点に、版が変わると個性が変わる理由と、API を本番で回す運用者として何に備えるかを整理します。

Cloudflare Turnstile が WebGL 指紋を要求し始めた — 運用者目線で読む
Cloudflare Turnstile が WebGL から取れる端末の指紋を要求し始め、指紋を隠す一部ブラウザの人間まで弾く事例が報告されました。バグではなく仕様です。Turnstile を置く運用者として、bot 防御とユーザ巻き込み・プライバシーのトレードオフ、確認すべき点、代替手段を整理します。

OpenRouter が $113M 調達・評価額 約 $1.3B — 「ルーティング層」の値段を運用者目線で読む
LLM ルーティング基盤の OpenRouter が CapitalG 主導で $113M のシリーズBを調達し、報道では評価額が約 $1.3B と 1 年で倍増しました。モデルそのものではなく「束ねる層」になぜ値段がつくのか、複数モデルを自前で叩く運用者として gateway を外部に置く損得を翻訳して読みます。

夕方の散歩で、考えごとがほどける
行き詰まったら歩く。机の前では何時間も出てこなかった答えが、信号待ちの数十秒で勝手に並ぶ。歩く速度と思考の速度の関係を、夕方の川沿いから書いた随筆。

麦茶のボトルが冷蔵庫に戻る日 — 夏の支度は飲み物から始まる
5月末、やかんで麦茶を沸かして冷ましてから冷蔵庫に入れる。毎年この一本で夏が始まる。台所の小さな合図と、季節の境目に手が勝手に動く所作についての随筆だ。

Liquid AI の LFM2.5 8B-A1B を運用視点で読む — 「総8B・アクティブ1B」の意味
Liquid AI が 2026 年 5 月 28 日に公開した LFM2.5 8B-A1B は、総 8B・アクティブ 1B の MoE 構成です。メモリは 8B 級・1 回の推論で動くのは 1B という設計が、自前で LLM を回す運用にどう効くのか。公称スループットとメモリ 6GB の数字を物差しに、品質とのトレードオフまで読み解きます。

コントラスト検証を「要素×状態×テーマ」で総当たりする — axe-core の穴を埋める
axe-core を CI に入れていても、hover やダークテーマに切り替えた瞬間のコントラスト事故は漏れます。要素×状態×テーマを総当たりするブラウザ JS 監査手法を、OKLCH トークン + light/dark 運用の視点で読み解きます。静的 CSS 差分・実効背景色の合成・WCAG 比の計算と、その限界までまとめます。

durable workflow の状態を SQLite だけに置く案を Sidekiq + Redis 運用者として読む
「SQLite is all you need for durable workflows」は、途中で落ちても再開できるワークフローの状態を SQLite 1 ファイルに寄せる主張です。Sidekiq 8 + Redis 8 でジョブを回す運用者として、どこまで刺さり、どこで Redis を残すかを書きました。

要件定義を「思想」と「仕様」に分ける — 個人開発で手戻りを減らした運用
要件定義を「思想(なぜ・どうあるべきか)」と「仕様(何を・どう作るか)」の 2 層に分けると、レビューの重さもスコープの膨張も減ります。個人開発の auto-publish 再設計に当てはめた運用の記録です。

標準 GPU で LLM 推論 3000 tokens/s/req — 数字の前提を運用者目線で読む
Kog AI が 8 枚の標準 GPU で「1 リクエストあたり毎秒 3000 トークン」を出したと発表しました。確かに速いのですが、これは batch size 1 の単一リクエスト速度で、モデルは 2B。自前推論のコストとレイテンシを気にする運用者として、数字の前提と再現性を読みます。