Google、エージェント特化の「Gemma 4」をApache 2.0で公開／Gemma 4登場でいよいよローカルLLM元年？

	2026/04/08

	Google、エージェント特化の「Gemma 4」をApache 2.0で公開

	新たな「国産LLM」公開、国立情報学研究所　「gpt-oss-20b」超えの日本語性能うたう

	初の“長考できる”国産LLM、どう開発？　「PLaMo 3.0 Prime」の資料公開、PFN

	「Claude」Pro／Max／Teamユーザーに無料で追加クレジット付与、最大200ドル分　受け取り申請の方法は

	「スマホで動く」80億パラメーターLLM――1.15GBで実運用レベルうたう「1-bit Bonsai」が話題に

	「Claude」で「OpenClaw」などの利用がサブスク対象外に　API利用や追加使用量購入が必要

	2030年までに、1兆パラメータを持つLLMの推論コストが90％以上削減される　ガートナー予想

	LLMの学習データ「枯渇元年」にどう立ち向かうか　国・組織を横断したデータ連携の仕組み実現へ、IPAが成果物公開

	OpenAI、「超知能時代」の産業政策を提言──週休3日制や富の分配など、アルトマンCEOが語る新たな社会契約

Gemma 4登場でいよいよローカルLLM元年？

最近も強力なオープンウェイトモデルとして「Qwen3.5」を紹介したが、GoogleからもQwen3.5と同程度のサイズ・アーキテクチャ（DenseとMoE）の「Gemma 4」が出てきた。最もサイズの大きいGemma 4 31Bは、ベンチマークの種類にもよるがQwen3.5 27Bと争うような性能となっている。

Qwen3.5 27Bにせよ、Gemma 4 31Bにせよ、デスクトップ向けハイエンドGPUのビデオメモリに載せられるサイズとなっている（量子化前提かつ最大コンテキスト長となるとまだ困難はあり）。使ってみると分かるが明らかに賢さが感じられる。もちろんフロンティアモデルであるGPT-5.4やClaude Opus 4.6には敵わないが、Claude Sonnet 4.6とはいい勝負まで来ているという見方もある。

国内勢からも進捗が出ている。国立情報学研究所は「LLM-jp-4」シリーズを発表。32B-A3Bモデルは日本語ベンチマークでgpt-oss-20bやGPT-4oを上回ったという。米中のオープンモデルの後ろを歩く格好となってはいるが、非常に透明性の高いフルスクラッチ学習を行ってこれくらいの性能を出せたという結果は、国内の他の国産LLM開発ベンダーに対するプレッシャーとしても機能するだろう。

こうした状況を見ていると「2026年はいよいよローカルLLM元年か」という印象がある。機密性やプライベートに関わることはローカルで、そうではないがより強い推論が必要となる場合はクラウドで、といったいわゆる「ハイブリッドAI」も現実味を帯び始めているのではないだろうか。（井上）