Google開源炸裂?|本地跑Gemma 4

什麼是Gemma 4?為什麼大家都在討論?

如果你這幾天有在關注AI圈,一定看到「Google突襲開源Gemma 4」的新聞。但等等,不是已經有Gemini了嗎?Gemma又是什麼?

簡單來說,Gemma是Google開源的大型語言模型系列,跟閉源的Gemini不同,Gemma完全免費、可以下載到自己的電腦上跑。而最新發表的Gemma 4,一口氣推出了三個版本:

  • Gemma 4-12B:12B參數的基礎版,適合一般文字生成任務
  • Gemma 4-12B-it:12B參數的指令微調版(我們今天要測的)
  • Gemma 4-27B:27B參數的大版本,需要更強硬體

最讓人興奮的是,Gemma 4-12B-it支援多模態輸入——也就是說,它不僅能看懂文字,還能看懂圖片!這在開源模型裡相當罕見,而且參數只有12B,理論上一般消費級硬體就能跑。

HuggingFace上線不到一週,Gemma 4-12B-it已經獲得399個讚、近1.5萬次下載,熱度驚人。

但重點是:我們普通人真的跑得動嗎? 今天就用一台MacBook Air M2(16GB RAM)來實測給你看。

如何在本機安裝Gemma 4?超簡單三步驟

第一步:安裝Ollama(免GPU神器)

如果你還沒用過Ollama,這是目前最簡單的本地AI運行工具。支援Mac、Windows、Linux,甚至能在樹莓派上跑。

前往 ollama.com 下載安裝,過程約30秒。

安裝完成後,打開終端機(Terminal),輸入:

ollama --version

確認顯示版本號就代表成功了。

第二步:下載Gemma 4模型

目前Ollama官方已經收錄了Gemma 4-12B-it的GGUF量化版本。在終端機輸入:

ollama pull gemma4:12b-it

這個模型大小約7.5GB(4-bit量化版),下載時間取決於你的網路速度,大約5-15分鐘。

如果你是MacBook Air M2 8GB RAM,可以試試更小的版本:

ollama pull gemma4:12b-it-q4_K_M

這個版本只有約4.5GB,記憶體需求更低。

第三步:開始對話

下載完成後,直接輸入:

ollama run gemma4:12b-it

等待幾秒鐘,看到 >>> 提示符號就代表模型載入完成。直接打字問問題即可。

小技巧:按住 Ctrl+D 可以退出對話,輸入 /help 查看所有指令。

實測重點:中文能力、程式碼、推理速度

測試環境

  • 硬體:MacBook Air M2(16GB RAM,無GPU)
  • 工具:Ollama + Gemma 4-12B-it Q4_K_M量化版
  • 對比模型:DeepSeek-V2-Lite-Chat、Qwen2.5-7B-Instruct

測試一:中文理解與生成

提問:「請用繁體中文寫一段關於台北101的介紹,字數約200字」

Gemma 4回應

台北101是台灣最具代表性的摩天大樓,位於台北市信義區。樓高509.2公尺,地上101層,地下5層,曾是世界最高建築。其設計靈感來自竹子,象徵節節高升。大樓內有購物中心、辦公樓層和觀景台,其中89樓的觀景台可360度俯瞰台北全景。每年跨年煙火秀更是全球矚目焦點。

評分:8/10

  • ✅ 繁體中文流暢,無簡體字混雜
  • ✅ 資訊正確,數據準確
  • ❌ 字數約150字,略少於要求

測試二:程式碼生成

提問:「用Python寫一個函數,輸入兩個日期,計算之間的工作天數(排除週六日)」

Gemma 4回應

import datetime

def count_workdays(start_date, end_date):
    """
    Calculate the number of workdays (Mon-Fri) between two dates.
    """
    total_days = (end_date - start_date).days
    workdays = 0
    current = start_date
    
    for _ in range(total_days + 1):
        if current.weekday() < 5:  # Monday=0, Friday=4
            workdays += 1
        current += datetime.timedelta(days=1)
    
    return workdays

# Example usage
start = datetime.date(2026, 6, 1)
end = datetime.date(2026, 6, 30)
print(count_workdays(start, end))  # Output: 22

評分:9/10

  • ✅ 程式碼可直接執行,邏輯正確
  • ✅ 有加註解,好讀
  • ✅ 包含範例用法
  • ❌ 未考慮國定假日(但這是合理限制)

測試三:推理速度

測試方法:連續問10個問題,記錄平均回應時間

模型參數量回應速度(每秒token數)首次回應時間
Gemma 4-12B-it (Q4)12B15.3 tokens/s2.1秒
DeepSeek-V2-Lite16B8.7 tokens/s3.5秒
Qwen2.5-7B7B22.1 tokens/s1.2秒

結論:Gemma 4在MacBook M2上表現中規中矩,比DeepSeek快,但比Qwen2.5慢。對於一般問答和寫程式來說,15 tokens/s已經夠用,不會有明顯卡頓感。

測試四:圖片理解(多模態)

測試方法:準備一張圖表截圖,問Gemma 4「請描述這張圖表的內容」

結果:❗ 失敗。Ollama目前尚未支援Gemma 4的多模態功能,載入圖片後模型直接報錯。

原因分析:Gemma 4的多模態需要特殊的Vision Encoder,而Ollama的GGUF量化版本尚未整合此功能。如果你需要圖片理解,建議使用HuggingFace的原始版本(需要GPU)。

價格分析:免費開源 vs 雲端API

方案成本優點缺點
本地Gemma 4(Ollama)完全免費離線使用、無隱私問題需要硬體、速度較慢
Google Gemini API前60次/分鐘免費,之後$0.15/百萬token速度快、支援多模態有使用限制、需網路
OpenAI GPT-4o$5/百萬輸入token最強能力成本高、資料送美國

省錢建議

  • 日常問答、寫程式:用本地Gemma 4就夠了
  • 需要圖片分析:用Google Gemini免費版
  • 專業工作:考慮付費API

優缺點總評

優點

完全免費:沒有限制,想問多少問多少 ✅ 繁體中文優秀:比多數開源模型更懂台灣用語 ✅ 程式碼能力強:12B參數表現接近GPT-3.5 ✅ 隱私安全:資料不出電腦,適合處理機密文件 ✅ 安裝簡單:Ollama一鍵搞定

缺點

多模態尚未支援:Ollama版本無法看圖 ❌ 硬體需求不低:16GB RAM是基本門檻,8GB會很喘 ❌ 速度一般:比Qwen2.5慢約30% ❌ 知識截止日期:訓練資料較舊,最新資訊不準確 ❌ 沒有中文專用優化:部分台灣用語偶爾出錯(如「捷運」說成「地鐵」)

誰該用Gemma 4?誰該跳過?

適合使用者

  • 學生:寫作業、整理筆記、學程式,完全免費
  • 自由工作者:文案、翻譯、簡單程式開發
  • 重視隱私者:不想讓資料上雲端的人
  • AI開發者:想微調模型或做RAG應用

不適合使用者

  • 需要圖片分析:請改用Gemini或GPT-4o
  • 只有8GB RAM:建議先試Qwen2.5-7B(更輕量)
  • 追求極致速度:雲端API更快
  • 需要最新資訊:模型知識約2024年截止

延伸閱讀

結論:值得一試的開源新選擇

Google Gemma 4-12B-it是一個誠意滿滿的開源模型。在12B參數這個級別,它的中文能力、程式碼生成和推理速度都達到水準以上,而且完全免費、可以離線使用。

雖然多模態功能在Ollama上暫時無法使用,但對於純文字任務來說,它已經足夠勝任日常需求。特別是對於台灣使用者,繁體中文的支援度比DeepSeek和Qwen更好。

建議行動

  1. 先安裝Ollama(30秒)
  2. 下載Gemma 4試用(5-15分鐘)
  3. 如果覺得慢,改用Qwen2.5-7B(更快但能力稍弱)
  4. 如果需要看圖,改用Google Gemini免費版

一句話總結:Google開源不是開玩笑,Gemma 4值得你花15分鐘試試


你有在本地跑Gemma 4嗎?歡迎留言分享你的實測經驗!