CATEGORIES · 03 / 05
AI
モデル、プロンプト、alignment の周辺。数値と哲学の境界線で書く記事。(62 本)

Anthropic が $65B 調達・評価額 $965B — API 運用者として価格とロックインで読む
Anthropic が Series H で $65B を調達し、post-money 評価額が $965B に到達。run-rate は $47B を超えた。巨額の数字そのものより、フロンティアモデルを API として運用に組み込んでいる側が気にすべき「モデル更新ケイデンス・価格・ロックイン」の 3 点に翻訳して読みます。

Claude Opus 4.8 を初日に触る — effort control と Dynamic Workflows を運用者の実務で読む
Anthropic が Claude Opus 4.8 (model ID claude-opus-4-8) を公開。料金は Opus 4.7 から据え置きで、自分が書いたコードの欠陥を約 4 倍見逃しにくくなった。effort control・fast mode 値下げ・Dynamic Workflows を、AI 起稿 + 人間レビューで記事を回す運用者の目線で実務に引きつけて読みます。

5 つのフロンティア LLM は事実判定の 67% で割れる — AI に正誤を委ねる前に
GPT-5.4 や Claude Opus 4.7 などフロンティア LLM 5 つに 1,000 件の主張を判定させると、67% で意見が割れた。Lenz の研究から、AI に事実の正誤を委ねる危うさと、多数決・人間レビューで補う実務の構えを、AI 起稿 + 人間レビューで記事を出す運用者の目線で整理します。

YouTube が AI 動画に自動ラベル — 開示義務と作る側の実務
YouTube が 2026 年 5 月 27 日、写実的な AI 生成・編集動画への開示ラベルを自動付与する方針を発表しました。手動開示との違い、長尺とショートで異なる表示位置、開示が要る AI と要らない AI の線引きを、AI 起稿 + 人間レビューで動画を作る側の実務目線で整理します。

Anthropic と OpenAI の PMF を、Simon Willison の 5 つの数字で読む
2026 年 5 月 27 日公開の Simon Willison『Anthropic と OpenAI は PMF を見つけた』を、Enterprise 価格改定 2 件、両社の営業比 26.9% / 32.6%、SpaceX への月額 $12.5 億 inference 契約、Uber の予算早期消化、本人の月 $2,180 トークン明細という 5 つの数字で読み解きます。

「AI と話すのに疲れた」essay を読み、auto-publish を回す側の私が引いている 5 つの境界
2026 年 5 月 27 日に HN で 1021 score まで上がった orchidfiles の「I'm Tired of Talking to AI」を読みました。GitHub discussion で同じ AI 返答が並ぶ事件を題材に、auto-publish を回す側の私が「公開」と「介入」の境目で守る 5 つの自己ルールを書きます。

Claude Code v2.1.152 — /code-review --fix と skill disallowed-tools と MessageDisplay hook を実務観点で読む
2026-05-27 リリースの Claude Code v2.1.152 で /code-review --fix・skill frontmatter の disallowed-tools・MessageDisplay hook の 3 つが auto-publish の毎日運用に直接効いてきます。v2.1.149 からの中 2 日の差分を、私の運用にどう載せるかの順位付けで整理します。

Claude Code v2.1.149 — /usage の内訳と PowerShell sandbox 修正を実務で読む
2026-05-22 リリースの Claude Code v2.1.149 は、/usage が skills / subagents / plugins / per-MCP-server で内訳を返すようになりました。PowerShell の permission bypass、git worktree sandbox、OTEL の agent_id 継承まで、auto-publish を毎日回す立場から実務影響をまとめます。

Anthropic SDK の thinking-token-count beta — extended thinking の estimated tokens を streaming delta から取れるようになった実務観点
2026-05-21 公開の anthropic-sdk-python v0.104.0 / anthropic-sdk-typescript sdk-v0.98.0 で thinking-token-count-2026-05-13 beta が追加され、extended thinking の thinking_delta フレームに estimated_tokens(推定トークン数の増分)が乗るようになりました。プログレス UI / context-budget 監視で何が変わるか、私が即日試した実務観点で書きます。

Claude Code v2.1.145 — permission-prompt bypass fix と agents --json / OTEL agent_id を実務観点で読む
2026-05-19 21:31 UTC 公開の Claude Code v2.1.145 で最優先取り込みは、Bash の bare 変数代入が権限プロンプトを bypass していた fix。残る目玉は claude agents --json による外部スクリプト統合、OTEL span への agent_id / parent_agent_id 追加、Read tool の PARTIAL view 化、context: fork 無限ループ fix で、いずれも実務で静かに効きます。今朝アップデートして触った範囲で要点をまとめました。