免網路也能跑！|Google最強開源AI

你有沒有想過，如果有一天網路斷了，或者你正在捷運上、飛機上，突然需要 AI 幫你寫一封重要的英文郵件、翻譯一段日文，或是分析一份 PDF 合約，卻發現 ChatGPT 連不上，那種感覺有多崩潰？

今天我要告訴你一個好消息：Google 剛剛開源了他們的 Gemma 4 12B 模型，而且你完全可以在自己的電腦上免費跑起來，不需要連網，不用擔心資料外洩，速度還很快。

這篇文章就是你的完整入門教學。我會一步一步教你下載、安裝、設定，最後讓你在本地端像用 ChatGPT 一樣跟 AI 對話。就算你完全不懂程式，只要會用滑鼠，就能跟著做。

為什麼你該在本地跑 AI？

先說一個真實故事。上週我一位在律師事務所工作的朋友，需要審閱一份客戶的合約，裡面有大量敏感條款。他不敢把合約貼到 ChatGPT 上，因為公司資訊安全政策明令禁止。最後他只能自己熬夜看文件，花了整整一個下午。

如果當時他學會了本地跑 Gemma 4，這一切只需要 10 分鐘。本地運行的最大優勢就是隱私——所有資料都在你的電腦裡，不經過任何雲端伺服器。Google 看不到、OpenAI 看不到，連你公司的 IT 部門也看不到。

第二個好處是 完全免費，沒有限制。ChatGPT 免費版每三小時只能發幾十則訊息，Claude 有每日用量上限，而本地跑的模型，你想問多少次就問多少次，半夜三點寫論文也沒人管你。

第三，速度穩定。不用跟幾百萬人搶伺服器頻寬，你的 AI 回應速度只取決於你的電腦效能。

那 Gemma 4 12B 到底有多強？根據 Google 官方公布的基準測試，它在多項任務上已經超越了同樣大小的 Llama 3 和 Mistral 模型，尤其在程式碼生成、邏輯推理、多語言翻譯方面表現非常出色。它支援超過 140 種語言，繁體中文當然沒問題。

你的電腦跑得動嗎？

先別急著跳過這一段。很多人看到「AI 模型」就覺得一定要有超貴的顯示卡，但 Gemma 4 12B 其實對硬體的要求比你想像中友善。

基本需求很簡單：

記憶體：至少 16GB。如果你的電腦有 32GB 會更順暢。
硬碟空間：約 15GB 可用空間。
處理器：一般的 Intel 或 AMD 處理器都可以，但 Apple Silicon（M1/M2/M3）表現特別好。

如果你用的是 MacBook Air M1（8GB 記憶體），其實也能跑，只是速度會慢一些，大約每 3-5 秒生成一個字。但如果你有 MacBook Pro M2 或 M3（16GB 以上），幾乎可以做到即時回應。

Windows 使用者也不用擔心，我們接下來用的工具支援 Windows、macOS 和 Linux。

第一步：安裝 Ollama — 你的 AI 管理員

Ollama 是一個超好用的開源工具，它幫你把複雜的 AI 模型安裝、管理、執行都變得像安裝手機 App 一樣簡單。你不需要懂任何程式碼。

步驟 1：下載 Ollama

打開你的瀏覽器，前往 ollama.com，點擊大大的「Download」按鈕。它會自動偵測你的作業系統，給出正確的版本。下載後雙擊安裝，就像安裝一般軟體一樣。

步驟 2：確認安裝成功

安裝完成後，打開你的命令提示字元（Windows 按 Win+R，輸入 cmd）或終端機（Mac 按 Command+空白鍵，輸入 Terminal）。輸入以下指令：

ollama --version

如果你看到類似 ollama version 0.1.xx 的訊息，恭喜你，安裝成功了！

第二步：下載 Gemma 4 12B 模型

現在來到最關鍵的一步。在 Ollama 裡，下載模型就像從 App Store 下載 App 一樣簡單。

步驟 3：下載模型

在終端機輸入：

ollama pull gemma4:12b

這行指令會從 Ollama 的模型庫下載 Gemma 4 12B 模型。注意：這個模型檔案約 7GB 大小，下載時間取決於你的網路速度，可能需要 10 到 30 分鐘。建議用有線網路或穩定的 Wi-Fi。

下載過程中，你會看到進度條。不用緊張，讓它跑完就好。你可以趁這個時間去泡杯咖啡。

步驟 4：啟動模型

下載完成後，輸入：

ollama run gemma4:12b

你會看到終端機出現一個提示符號 >>>，這表示 AI 已經準備好回答你的問題了。

第三步：開始跟 AI 對話

現在你可以直接在終端機輸入任何問題。試試看：

>>> 用繁體中文解釋什麼是量子糾纏，用簡單的方式說明

Gemma 4 會開始生成回應。你會看到文字一個一個地出現，就像有人在打字一樣。

你也可以問它更實際的問題：

>>> 幫我寫一封給房東的英文郵件，通知他我要提前兩個月搬走

或是：

>>> 分析這段 Python 程式碼有什麼潛在問題：[貼上你的程式碼]

小技巧：如果你想結束對話，輸入 /bye 或按 Ctrl+D。下次要用時，只要再輸入 ollama run gemma4:12b 就可以了。

第四步：安裝圖形化介面 — 讓它更像 ChatGPT

如果你覺得終端機的黑畫面不夠友善，這裡有一個更簡單的方法：使用 Open WebUI。

步驟 5：安裝 Docker（可選）

如果你想要最漂亮的介面，先安裝 Docker Desktop（docker.com）。這不是必須的，但可以讓後續安裝更簡單。

步驟 6：一鍵啟動 Open WebUI

在終端機輸入：

docker run -d -p 3000:8080 --add-host=host.docker.internal:host-gateway -v open-webui:/app/backend/data --name open-webui --restart always ghcr.io/open-webui/open-webui:main

然後打開瀏覽器，輸入 http://localhost:3000。你會看到一個美觀的聊天介面，跟 ChatGPT 幾乎一模一樣。在設定裡選擇模型為 gemma4:12b，就可以開始了。

如果你不想用 Docker，也可以直接下載 Open WebUI 的桌面版（openwebui.com），安裝後它會自動偵測你已經在 Ollama 裡安裝好的模型。

進階技巧：如何讓 Gemma 4 表現更好

現在你已經能跑了，但你可能會發現，預設的回應有時候不夠精準。這是因為你還沒有給它「系統提示」（System Prompt）。

系統提示就像是你對 AI 的「角色設定」——你可以告訴它你是誰、你要什麼風格的回答。例如，你可以這樣設定：

>>> /system 你是一位專業的繁體中文編輯，擅長修改文章，讓文字更流暢、更優雅。回答要簡潔、有條理。

設定完後，所有後續對話都會遵循這個風格。如果你要寫程式，可以改成：

>>> /system 你是一位經驗豐富的 Python 開發者，擅長寫 clean code 和單元測試。請給出完整的可執行程式碼。

另一個實用技巧是設定上下文長度。預設情況下，Gemma 4 可以記住約 8000 個 token（約 6000 個中文字）的對話歷史。如果你需要處理更長的文件，可以在啟動時指定：

ollama run gemma4:12b --num-ctx 32768

這樣它就能記住更長的對話內容，非常適合分析長篇論文或合約。

實際應用場景：省下你每天 30 分鐘

讓我給你三個真實的應用案例：

案例一：翻譯專業文件

我一位在貿易公司工作的讀者，每天要處理中英日三種語言的報價單。過去他需要開三個瀏覽器分頁，複製貼上到 Google 翻譯。現在他直接用 Gemma 4，把整份報價單貼進去，下指令：「翻譯成繁體中文，保留表格格式，把金額換算成台幣。」10 秒鐘完成。

案例二：程式碼除錯

另一位自由接案的工程師，經常在半夜寫程式時遇到 bug。他不再需要等 ChatGPT 的回應，直接在本地問 Gemma 4：「這個 SQL 查詢為什麼跑這麼慢？」模型會分析索引、JOIN 順序，甚至可以給出優化後的版本。

案例三：學習新知識

學生族群也很適合。你可以把整篇課本內容貼進去，問：「用簡單的方式總結這三段的重點，並給我三個考試可能會考的題目。」

常見問題

Q: 我的電腦只有 8GB 記憶體，可以跑嗎？ A: 可以，但速度會比較慢。建議使用量化版本（GGUF），它會犧牲一點點準確度來換取更快的速度。你可以在 Ollama 搜尋 gemma4:12b-q4_K_M 這個版本，它只需要約 8GB 記憶體。

Q: 模型下載到一半中斷了怎麼辦？ A: 不用擔心，直接重新輸入 ollama pull gemma4:12b，它會從中斷的地方繼續下載，不會從頭開始。

Q: 繁體中文支援好嗎？會不會出現簡體字？ A: 預設情況下，Gemma 4 會根據你的提問語言回應。如果你用繁體中文問，它會用繁體中文回答。如果偶爾出現簡體字，只要在系統提示裡加上「請使用繁體中文」即可。

Q: 離線使用真的可以嗎？需要先做什麼設定？ A: 是的，完全離線。只要第一次下載模型時需要網路，之後就算拔掉網路線，Ollama 也能正常運作。你可以在飛機上、捷運上、甚至露營時使用。

Q: 這個模型可以商用嗎？ A: Google 的 Gemma 授權條款允許大多數商用用途，包括在你的公司內部使用。但如果你要將模型整合到你的產品中銷售，建議閱讀 Google 的官方授權文件確認細節。

總結

今天你學會了如何在電腦上免費安裝 Google 的 Gemma 4 12B 模型，完全離線、保護隱私、沒有限制。你只需要安裝 Ollama、下載模型、然後就可以開始對話。如果你想要更漂亮的介面，還可以安裝 Open WebUI。

我鼓勵你現在就打開電腦試試看。就算你只是問它「今天天氣如何？」（它會告訴你它沒有網路，所以不知道），這也是你跨出在地端使用 AI 的第一步。當你真的開始用它來處理工作、學習、創作時，你會發現那種「不需要依賴任何雲端服務」的自由感，是無可取代的。

如果你在安裝過程中遇到任何問題，歡迎在留言區提問。我們下篇文章見！

🔍 搜尋文章

免網路也能跑！|Google最強開源AI

免網路也能跑！|Google最強開源AI

為什麼你該在本地跑 AI？

你的電腦跑得動嗎？

第一步：安裝 Ollama — 你的 AI 管理員

第二步：下載 Gemma 4 12B 模型

第三步：開始跟 AI 對話

第四步：安裝圖形化介面 — 讓它更像 ChatGPT

進階技巧：如何讓 Gemma 4 表現更好

實際應用場景：省下你每天 30 分鐘

常見問題

延伸閱讀

總結

🔍 搜尋文章

📬 每週 AI 精選

免網路也能跑！|Google最強開源AI

免網路也能跑！|Google最強開源AI

為什麼你該在本地跑 AI？

你的電腦跑得動嗎？

第一步：安裝 Ollama — 你的 AI 管理員

第二步：下載 Gemma 4 12B 模型

第三步：開始跟 AI 對話

第四步：安裝圖形化介面 — 讓它更像 ChatGPT

進階技巧：如何讓 Gemma 4 表現更好

實際應用場景：省下你每天 30 分鐘

常見問題

延伸閱讀

總結

相關文章

五分鐘學會！|省你五小時

一秒找到東西！|NVIDIA神級AI教學

記憶碎片全打通！|AI記憶統一協議教學