TAG

#読書

9 件の記事がこのタグでまとめられています。

標準 GPU で LLM 推論 3000 tokens/s/req — 数字の前提を運用者目線で読む
AI

標準 GPU で LLM 推論 3000 tokens/s/req — 数字の前提を運用者目線で読む

Kog AI が 8 枚の標準 GPU で「1 リクエストあたり毎秒 3000 トークン」を出したと発表しました。確かに速いのですが、これは batch size 1 の単一リクエスト速度で、モデルは 2B。自前推論のコストとレイテンシを気にする運用者として、数字の前提と再現性を読みます。

2026年5月30日 06:06
Quake を 1997 年の道具でビルドし直す — 再現性を運用者目線で読む
Engineering

Quake を 1997 年の道具でビルドし直す — 再現性を運用者目線で読む

Fabien Sanglard が 1997 年当時のツールチェーンで Quake をビルドし直す記事を読んだ。VC++6 SP5 + Processor Pack で WinQuake.dsw を組む手順は短いのに、つまずきは全部「前提の固定漏れ」。Docker で同じ轍を踏んだ私が、再現性の急所を運用者目線で読みます。

2026年5月30日 00:06
図書館で時間を忘れる
Essay

図書館で時間を忘れる

時計のない閲覧室、集合的な静寂、本に囲まれた地続き感、偶然との出会い、何もしない 30 分。書き手にとっての図書館の意味。

2026年5月9日 20:03
コードと詩が、同じテーブルにつく場所をつくる
Essay

コードと詩が、同じテーブルにつく場所をつくる

個人発行の Web 雑誌を作った理由。Engineering と Essay を同じドメインに並べる、書き手の自然さを優先する場所の話。

2026年5月9日 20:03
RAG を「読み物」として設計する 5 観点
AI

RAG を「読み物」として設計する 5 観点

質問応答ではなく、興味から関連記事を提示する RAG。答えではなく問いを返す、読書をガイドする編集者としての RAG 設計。

2026年5月9日 20:03
図書館で時間を忘れる
Essay

図書館で時間を忘れる

本を借りに来たはずなのに、棚と棚のあいだを 2 時間歩いていた。図書館の独特な時間の進み方について。

2025年10月12日 13:00
「書くな」のときに何を読むか
Process

「書くな」のときに何を読むか

書けない夜は無理に書かない。代わりに「次に書くため」の読書をする。3 種類の読み方を切り替える。

2025年7月30日 22:00
古書店で見つけた、半分しか読まれていない本
Essay

古書店で見つけた、半分しか読まれていない本

神保町の古書店で買った本は、しおりが 142 ページに挟まったままだった。前の持ち主は、なぜここでやめたのか。

2025年7月5日 15:30
山手線のなかで読む詩
Essay

山手線のなかで読む詩

通勤電車のなかは、本当はとても静かな場所。乗客の音と振動の隙間で、詩集を 5 ページずつ読む朝の話。

2025年5月7日 08:30