免網路也能跑!|Google最強開源AI

你有沒有想過,如果有一天網路斷了,或者你正在捷運上、飛機上,突然需要 AI 幫你寫一封重要的英文郵件、翻譯一段日文,或是分析一份 PDF 合約,卻發現 ChatGPT 連不上,那種感覺有多崩潰?

今天我要告訴你一個好消息:Google 剛剛開源了他們的 Gemma 4 12B 模型,而且你完全可以在自己的電腦上免費跑起來,不需要連網,不用擔心資料外洩,速度還很快。

這篇文章就是你的完整入門教學。我會一步一步教你下載、安裝、設定,最後讓你在本地端像用 ChatGPT 一樣跟 AI 對話。就算你完全不懂程式,只要會用滑鼠,就能跟著做。

為什麼你該在本地跑 AI?

先說一個真實故事。上週我一位在律師事務所工作的朋友,需要審閱一份客戶的合約,裡面有大量敏感條款。他不敢把合約貼到 ChatGPT 上,因為公司資訊安全政策明令禁止。最後他只能自己熬夜看文件,花了整整一個下午。

如果當時他學會了本地跑 Gemma 4,這一切只需要 10 分鐘。本地運行的最大優勢就是隱私——所有資料都在你的電腦裡,不經過任何雲端伺服器。Google 看不到、OpenAI 看不到,連你公司的 IT 部門也看不到。

第二個好處是 完全免費,沒有限制。ChatGPT 免費版每三小時只能發幾十則訊息,Claude 有每日用量上限,而本地跑的模型,你想問多少次就問多少次,半夜三點寫論文也沒人管你。

第三,速度穩定。不用跟幾百萬人搶伺服器頻寬,你的 AI 回應速度只取決於你的電腦效能。

那 Gemma 4 12B 到底有多強?根據 Google 官方公布的基準測試,它在多項任務上已經超越了同樣大小的 Llama 3 和 Mistral 模型,尤其在程式碼生成、邏輯推理、多語言翻譯方面表現非常出色。它支援超過 140 種語言,繁體中文當然沒問題。

你的電腦跑得動嗎?

先別急著跳過這一段。很多人看到「AI 模型」就覺得一定要有超貴的顯示卡,但 Gemma 4 12B 其實對硬體的要求比你想像中友善

基本需求很簡單:

  • 記憶體:至少 16GB。如果你的電腦有 32GB 會更順暢。
  • 硬碟空間:約 15GB 可用空間。
  • 處理器:一般的 Intel 或 AMD 處理器都可以,但 Apple Silicon(M1/M2/M3)表現特別好。

如果你用的是 MacBook Air M1(8GB 記憶體),其實也能跑,只是速度會慢一些,大約每 3-5 秒生成一個字。但如果你有 MacBook Pro M2 或 M3(16GB 以上),幾乎可以做到即時回應。

Windows 使用者也不用擔心,我們接下來用的工具支援 Windows、macOS 和 Linux。

第一步:安裝 Ollama — 你的 AI 管理員

Ollama 是一個超好用的開源工具,它幫你把複雜的 AI 模型安裝、管理、執行都變得像安裝手機 App 一樣簡單。你不需要懂任何程式碼。

步驟 1:下載 Ollama

打開你的瀏覽器,前往 ollama.com,點擊大大的「Download」按鈕。它會自動偵測你的作業系統,給出正確的版本。下載後雙擊安裝,就像安裝一般軟體一樣。

步驟 2:確認安裝成功

安裝完成後,打開你的命令提示字元(Windows 按 Win+R,輸入 cmd)或終端機(Mac 按 Command+空白鍵,輸入 Terminal)。輸入以下指令:

ollama --version

如果你看到類似 ollama version 0.1.xx 的訊息,恭喜你,安裝成功了!

第二步:下載 Gemma 4 12B 模型

現在來到最關鍵的一步。在 Ollama 裡,下載模型就像從 App Store 下載 App 一樣簡單。

步驟 3:下載模型

在終端機輸入:

ollama pull gemma4:12b

這行指令會從 Ollama 的模型庫下載 Gemma 4 12B 模型。注意:這個模型檔案約 7GB 大小,下載時間取決於你的網路速度,可能需要 10 到 30 分鐘。建議用有線網路或穩定的 Wi-Fi。

下載過程中,你會看到進度條。不用緊張,讓它跑完就好。你可以趁這個時間去泡杯咖啡。

步驟 4:啟動模型

下載完成後,輸入:

ollama run gemma4:12b

你會看到終端機出現一個提示符號 >>>,這表示 AI 已經準備好回答你的問題了。

第三步:開始跟 AI 對話

現在你可以直接在終端機輸入任何問題。試試看:

>>> 用繁體中文解釋什麼是量子糾纏,用簡單的方式說明

Gemma 4 會開始生成回應。你會看到文字一個一個地出現,就像有人在打字一樣。

你也可以問它更實際的問題:

>>> 幫我寫一封給房東的英文郵件,通知他我要提前兩個月搬走

或是:

>>> 分析這段 Python 程式碼有什麼潛在問題:[貼上你的程式碼]

小技巧:如果你想結束對話,輸入 /bye 或按 Ctrl+D。下次要用時,只要再輸入 ollama run gemma4:12b 就可以了。

第四步:安裝圖形化介面 — 讓它更像 ChatGPT

如果你覺得終端機的黑畫面不夠友善,這裡有一個更簡單的方法:使用 Open WebUI。

步驟 5:安裝 Docker(可選)

如果你想要最漂亮的介面,先安裝 Docker Desktop(docker.com)。這不是必須的,但可以讓後續安裝更簡單。

步驟 6:一鍵啟動 Open WebUI

在終端機輸入:

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然後打開瀏覽器,輸入 http://localhost:3000。你會看到一個美觀的聊天介面,跟 ChatGPT 幾乎一模一樣。在設定裡選擇模型為 gemma4:12b,就可以開始了。

如果你不想用 Docker,也可以直接下載 Open WebUI 的桌面版(openwebui.com),安裝後它會自動偵測你已經在 Ollama 裡安裝好的模型。

進階技巧:如何讓 Gemma 4 表現更好

現在你已經能跑了,但你可能會發現,預設的回應有時候不夠精準。這是因為你還沒有給它「系統提示」(System Prompt)。

系統提示就像是你對 AI 的「角色設定」——你可以告訴它你是誰、你要什麼風格的回答。例如,你可以這樣設定:

>>> /system 你是一位專業的繁體中文編輯,擅長修改文章,讓文字更流暢、更優雅。回答要簡潔、有條理。

設定完後,所有後續對話都會遵循這個風格。如果你要寫程式,可以改成:

>>> /system 你是一位經驗豐富的 Python 開發者,擅長寫 clean code 和單元測試。請給出完整的可執行程式碼。

另一個實用技巧是設定上下文長度。預設情況下,Gemma 4 可以記住約 8000 個 token(約 6000 個中文字)的對話歷史。如果你需要處理更長的文件,可以在啟動時指定:

ollama run gemma4:12b --num-ctx 32768

這樣它就能記住更長的對話內容,非常適合分析長篇論文或合約。

實際應用場景:省下你每天 30 分鐘

讓我給你三個真實的應用案例:

案例一:翻譯專業文件

我一位在貿易公司工作的讀者,每天要處理中英日三種語言的報價單。過去他需要開三個瀏覽器分頁,複製貼上到 Google 翻譯。現在他直接用 Gemma 4,把整份報價單貼進去,下指令:「翻譯成繁體中文,保留表格格式,把金額換算成台幣。」10 秒鐘完成。

案例二:程式碼除錯

另一位自由接案的工程師,經常在半夜寫程式時遇到 bug。他不再需要等 ChatGPT 的回應,直接在本地問 Gemma 4:「這個 SQL 查詢為什麼跑這麼慢?」模型會分析索引、JOIN 順序,甚至可以給出優化後的版本。

案例三:學習新知識

學生族群也很適合。你可以把整篇課本內容貼進去,問:「用簡單的方式總結這三段的重點,並給我三個考試可能會考的題目。」

常見問題

Q: 我的電腦只有 8GB 記憶體,可以跑嗎? A: 可以,但速度會比較慢。建議使用量化版本(GGUF),它會犧牲一點點準確度來換取更快的速度。你可以在 Ollama 搜尋 gemma4:12b-q4_K_M 這個版本,它只需要約 8GB 記憶體。

Q: 模型下載到一半中斷了怎麼辦? A: 不用擔心,直接重新輸入 ollama pull gemma4:12b,它會從中斷的地方繼續下載,不會從頭開始。

Q: 繁體中文支援好嗎?會不會出現簡體字? A: 預設情況下,Gemma 4 會根據你的提問語言回應。如果你用繁體中文問,它會用繁體中文回答。如果偶爾出現簡體字,只要在系統提示裡加上「請使用繁體中文」即可。

Q: 離線使用真的可以嗎?需要先做什麼設定? A: 是的,完全離線。只要第一次下載模型時需要網路,之後就算拔掉網路線,Ollama 也能正常運作。你可以在飛機上、捷運上、甚至露營時使用。

Q: 這個模型可以商用嗎? A: Google 的 Gemma 授權條款允許大多數商用用途,包括在你的公司內部使用。但如果你要將模型整合到你的產品中銷售,建議閱讀 Google 的官方授權文件確認細節。

延伸閱讀

總結

今天你學會了如何在電腦上免費安裝 Google 的 Gemma 4 12B 模型,完全離線、保護隱私、沒有限制。你只需要安裝 Ollama、下載模型、然後就可以開始對話。如果你想要更漂亮的介面,還可以安裝 Open WebUI。

我鼓勵你現在就打開電腦試試看。就算你只是問它「今天天氣如何?」(它會告訴你它沒有網路,所以不知道),這也是你跨出在地端使用 AI 的第一步。當你真的開始用它來處理工作、學習、創作時,你會發現那種「不需要依賴任何雲端服務」的自由感,是無可取代的。

如果你在安裝過程中遇到任何問題,歡迎在留言區提問。我們下篇文章見!