CATEGORIES · 03 / 05
AI
モデル、プロンプト、alignment の周辺。数値と哲学の境界線で書く記事。(62 本)

モデルを消したのは出資元で競合だった — Anthropic 規制報道を運用者目線で読む
WSJ 報道で、Fable 5 / Mythos 5 停止の引き金が、出資元かつインフラ供給元かつ競合でもある Amazon の CEO の懸念表明だったと分かりました。可用性リスクの「統治層」を運用者目線で読みます。

Claude Fable 5 / Mythos 5 が突然止まった日 — 単一プロバイダ依存を運用者目線で点検する
2026 年 6 月 12 日、米政府の輸出管理指令で Anthropic が Claude Fable 5 と Mythos 5 のアクセスを全顧客向けに突然停止しました。モデルは「落ちる」だけでなく「消える」前提で組むべきという視点から、フェイルオーバー・モデル抽象化・縮退運転の三つの守りを運用者目線で整理します。

コーディングエージェントに 18 万行書かせて見えた限界と運用の勘所
GitHub のコーディングエージェントに 1 週間で 18 万行を書かせた実践記録を起点に、量を出せても設計は出せないという破綻ポイントと、Issue を基点に規約を「スキル」として渡すレビュー・運用の勘所を、自前の自動投稿運用も交えて運用者目線で整理します。

VLM は方眼を数えられない — 編み図読み取りで古典 CV に切り替えた話を運用者目線で読む
VLM が編み図の方眼マス目を正確に数えられず、20 列を 19 列と読み、実行ごとに結果が揺れた失敗事例。8 日かけて古典 CV(OpenCV の格子検出)に切り替えた実話を、AI に何を任せ何を任せないかという運用者の判断軸で読みます。

Anthropic SDK の Managed Agents デプロイ対応を運用者目線で読む
anthropic-sdk-python v0.109.0 が Managed Agents のデプロイと環境変数クレデンシャルに対応しました。Claude を「呼ぶ API」から「エージェントを走らせる実行環境」へ広げる更新を、どこまで Anthropic に預けるかという運用者の判断軸で読みます。

MiMo-V2.5-Pro UltraSpeed で 1T モデルが 1000 tokens/s — 数字の前提を運用者目線で読む
Xiaomi の MiMo が 1 兆パラメータの MoE モデルでデコード 1000 tokens/s 超を出したと発表しました。確かに速いのですが、これは batch やレイテンシの前提が書かれていない decode 速度の話です。何の速度なのかを MXFP4・DFlash・TileRT の三段に分解し、運用者として鵜呑みにする前に確認したい点を整理します。

「最小の脳」パーセプトロンを Python でゼロから書いて、LLM 全盛の今に読み直す — 運用者目線で
1958 年生まれのパーセプトロンは、入力に重みを掛けて足して 0 と比べるだけの「最小の判定器」です。LLM が当たり前になった 2026 年に、あえてこの一番小さい学習機械を Python でゼロから書き直し、運用者として何が嬉しいのかを測り直しました。

LLM API のコスト暴走を「呼ばない」で防ぐ三段防御 — 運用者目線で
個人開発で生成 AI 機能を載せると API 課金が青天井になりがちです。入力ゲーティング・キャッシュ・軽量モデルへのフォールバックという『そもそも呼ばない』方向の三段防御を、Zenn の実装事例を起点に運用者目線で整理しました。

Meta の AI チャットボットが 2 万件超の Instagram 乗っ取りに使われた — 運用者目線で読む
Meta が 2026 年 6 月 6 日に Instagram の大量乗っ取りを認めました。原因は派手なゼロデイではなく、復旧用 AI チャットボットの確認漏れで、攻撃者の宛先にリセットリンクが飛んでいた件です。AI に操作権限を渡すことの危うさを、運用者目線で読みます。

Claude は rsync のバグを増やしたのか — 36 リリースの統計を運用者目線で読む
rsync v3.4.3 のバグは AI のせいだと言われました。36 リリースの履歴で検証すると、Claude が原因という統計的証拠は出ていません。順列検定 p=46%、変更量は 5 倍でもバグ密度は同じ。単発事例を分布に戻す読み方を運用者目線で整理します。