動画で読む
オープンウェイトの一歩先、Apertus の「完全オープン」とは
結論から書きます。Apertus が他のオープンモデルと一線を画すのは、重みだけでなく学習データ・学習コード・学習レシピ・アライメント方針まで全部を公開し、第三者が再現できる状態に置いた点です。Llama や Mistral のような「オープンウェイト(重みファイルだけ配布)」とは、開示している層がそもそも違います。
Apertus は、スイスの EPFL(ローザンヌ連邦工科大学)と ETH チューリッヒ、国立スーパーコンピューティングセンター CSCS が組む Swiss AI Initiative が、2025 年 9 月 2 日に公開した基盤モデルです(ETH Zurich のプレスリリース)。ライセンスは Apache 2.0。サイズは 8B と 70B の 2 種類で、15 兆トークン・1000 を超える言語で学習され、英語以外が約 4 割を占めます。スイスドイツ語やロマンシュ語のような、これまで大規模モデルで手薄だった言語まで含むのが特徴です。
先日この話題が Hacker News の上位に上がっていて見に行ったら、2026 年 6 月に小型版の Apertus Mini(16 個の小規模言語モデル群)が出ていました。最初の 70B から 1 年弱で、用途を絞った小型ラインまで広げてきた格好です。本記事は速報そのものより、「完全オープンな基盤モデルを自前で抱える」という選択を、運用する側の損得で読み直します。
Sovereign AI が本当に解こうとしている課題
Sovereign AI(主権 AI、自国・自組織の管轄内で AI を持つ考え方)が解くのは、モデルの賢さではなく依存のリスクです。米国のフロンティアラボ 1 社に API を握られた状態を「止まる・変わる・覗かれる」の 3 つの不確実性として捉えると、Apertus の置きどころがはっきりします。
止まるリスクは現実です。私は以前 Claude Fable 5 / Mythos 5 が突然止まった日 で、単一プロバイダに寄せた構成が一夜で機能停止する怖さを書きました。変わるリスクもある。規約や価格、モデルの世代交代は提供側の都合で動きます。さらに 出資元が競合のモデルを規制対象にした報道 のように、供給網そのものが政治で揺れることもあります。
覗かれるリスク、つまりデータが国外のサーバを経由する問題は、規制側からも詰められています。Apertus は EU の AI Act への準拠や欧州の著作権法(学習データのオプトアウト尊重)を最初から設計に織り込んでいます。GPT に賢さで勝つためのモデルではなく、「自分の管轄と規制の内側で、中身を全部説明できるモデルを持つ」ことが狙いです。
運用者にとっての旨味は「監査コストが下がる」こと
完全オープンの一番の実利は、性能ではなく監査のしやすさです。重みしか無いモデルでは「この出力はどの学習データに由来するのか」を後から追えませんが、データとレシピまで開いていれば、説明責任を求められたときに遡れます。
これは私が 自分は LLM の重みの中にいるのか — 学習データ帰属 で扱った話と地続きです。学習データ帰属は、重みだけ配られたモデルでは原理的に外から検証できません。Apertus はデータセットと前処理の手順を公開しているので、「この語彙はどこから来たか」を自分で確かめられる。規制業種や B2B で「学習元を示せ」と求められる現場では、この再現性そのものが資産になります。
もう一つ地味に効くのが、微調整の自由度です。Apache 2.0 なので商用利用や派生モデルの配布に制約が薄く、社内データで fine-tune して閉じた環境に置くこともできる。API では当たり前にはできない「モデルを丸ごと手元に置く」が、ライセンス上もクリアです。
それでも品質ギャップは消えない — 「使える」の線引き
正直に書くと、賢さでフロンティアモデルと並ぶ段階ではありません。英語版 Wikipedia の Apertus 項目でも、初代は「フロンティアモデルに大きく後れを取る」「多くの用途で適応(追加調整)が必要」と率直に書かれています(Apertus (LLM) - Wikipedia)。2025 年末時点で「最も能力の高い完全オープンモデル」ではあっても、汎用チャットで Claude や GPT をそのまま置き換える話ではありません。
ここで効くのが、ローカルモデルの「使える」の定義です。私は ローカルLLMが「使える」に変わった2026年 で、用途を絞れば 75% パリティでも実務に乗ると書きました。逆に 日本語 RAG をローカル SLM に任せていいか では、タスクを選ばないと精度が落ちる現実も書いています。Apertus も同じ物差しで見るべきで、汎用の賢さで測ると負ける一方、多言語・規制・監査が絡む狭い用途なら十分に戦えます。
手元の MacBook で 8B を少し回した範囲でも、英語と主要言語は素直でも、込み入った日本語の指示では崩れる場面がありました。期待値を「賢い相棒」ではなく「中身を説明できる道具」に置き直すと、評価がぶれません。
コストと依存のトレードオフを 1 枚で
判断を整理すると、フロンティア API と Apertus 自前運用の違いは「どのコストを払うか」に尽きます。API は運用の手間を外注する代わりに依存を抱え、自前運用は依存を外す代わりに運用コストを抱える。賢さの差ではなく、コストの置き場所の差です。
| 観点 | フロンティア API | Apertus 自前運用 |
|---|---|---|
| 初期の手間 | 低い(鍵を発行するだけ) | 高い(GPU・配備・評価) |
| 単価 | 従量課金、規模で増える | 推論は自前、固定費寄り |
| 品質 | 高い(汎用で強い) | 用途次第(狭く使えば実用) |
| 依存 | 提供側に強く依存 | 依存しない |
| 監査・再現 | 中身は不透明 | データ・レシピまで追える |
| 撤退の容易さ | API を切れば終わり | 自分で畳む手間が要る |
表にすると当たり前に見えますが、現場の判断はだいたいこの 6 行のどこに重みを置くかで決まります。「とりあえず賢いほうが正義」と思いがちな私も、撤退の容易さと監査の 2 行を真顔で眺めると、答えは用途ごとに割れました。
運用者としてどう構えるか
最後に運用者の立場でまとめます。Apertus を「Claude / GPT の置き換え」として全面採用するのではなく、依存を外すための保険、あるいは特定レイヤー専用の道具として持つのが、いまの現実的な構えです。
私の運用ルールはこうです。賢さが要る汎用処理はフロンティア API に任せる。規制・多言語・監査が絡む狭い処理だけ Apertus に寄せる。そして「API が止まった・値上げした・規約が変わった」ときに切り替えられるよう、出口だけ常に開けておく。この「呼びすぎない・寄せすぎない」構えは、LLM API のコスト暴走を「呼ばない」で防ぐ三段防御 や 始める前に「やめ方」を決める で書いた考え方とそのまま重なります。
Sovereign AI は派手な見出しに見えて、運用者にとっては地味な保険の話です。賢さは借りられる。借りられないのは、止められない依存と、説明できない中身です。Apertus が配っているのは、その 2 つを自分の手元へ取り戻す選択肢でした。
この記事は AI が下書きを書き、運営者である私が公開前に内容を確認・編集して公開しています。
よくある質問
- Apertus は Llama のようなオープンモデルと何が違いますか?
- Llama や Mistral は基本的に重みファイルだけを配る「オープンウェイト」です。Apertus は重みに加えて学習データ・学習コード・学習レシピ・アライメント方針まで公開し、第三者が学習過程を再現・検証できる点が違います。
- Apertus は Claude や GPT を置き換えられますか?
- 汎用の賢さではまだフロンティアモデルに届かず、初代は多くの用途で追加調整が必要とされています。多言語・規制・監査が絡む狭い用途では実用になりますが、汎用チャットの全面置換には向きません。
- Apertus は商用利用できますか?
- ライセンスは Apache 2.0 です。商用利用や、社内データで fine-tune した派生モデルの配布も制約が薄く、モデルを自社環境に丸ごと置く運用がライセンス上クリアにできます。
- Sovereign AI を掲げる意味は何ですか?
- モデルの賢さ競争ではなく、依存・管轄・監査の問題を解くことが目的です。米フロンティアラボ 1 社への依存(止まる・変わる・覗かれるリスク)を、中身を説明できる自前モデルで外すという発想です。