Mellum2免費?|JetBrains開源了
JetBrains 開源了! 就在上週,JetBrains 在 HuggingFace 上架了他們最新的程式碼模型 Mellum2-12B-A2.5B-Thinking,短短 7 天就衝上 249 個讚、近 17,000 次下載。這不是普通的模型,它是 專門為開發者打造的對話式程式碼助手,更狂的是——完全開源、可商用。
對比那些動輒數百億參數、跑不動的巨無霸,Mellum2 只有 12B 參數(激活僅 2.5B),採用 MoE(混合專家)架構,讓你能在一般消費級 GPU 上跑。這意味著:你不用再依賴雲端 API,本地就能擁有 JetBrains 等級的 AI 程式碼助手。
這篇文章會帶你實測 Mellum2 的程式碼生成、推理、除錯能力,並對比 DeepSeek-Coder-V2、Qwen2.5-Coder 和 GPT-4o,幫你判斷:這款模型真的值得下載嗎?還是只是 JetBrains 的公關操作?
Mellum2 是什麼?|為什麼值得關注
Mellum2 是 JetBrains 基於 Qwen2.5 架構 進行的微調版本,採用 MoE(Mixture of Experts)設計:12B 總參數中,每次推理只激活 2.5B 參數。這代表它在保持性能的同時,記憶體和計算需求大幅降低。
核心亮點:
- 開源且可商用:Apache 2.0 授權,企業也能放心用
- 專注程式碼對話:不是通用模型,而是針對開發者需求設計
- 支援長上下文:32K token 上下文長度,能處理大型專案
- Thinking 模式:名稱中的「Thinking」代表它會展示推理過程
- GGUF 格式支援:可搭配 Ollama、llama.cpp 在本地跑
為什麼它值得關注? 目前開源程式碼模型市場,DeepSeek-Coder-V2 和 Qwen2.5-Coder 幾乎壟斷了話題。但 JetBrains 的加入,代表 IDE 巨頭親自下場做 AI 模型,這對開發者生態的影響可能比想像中大。
實測 Mellum2|程式碼生成、推理、除錯
為了測試 Mellum2 的真實實力,我準備了 三個場景:程式碼生成、邏輯推理、除錯建議。硬體環境是 NVIDIA RTX 4090 24GB,使用 Ollama 載入 GGUF 量化版本。
場景一:程式碼生成
提示詞: 「用 Python 寫一個函數,輸入一個整數列表,回傳所有子陣列的最大和(Kadane’s Algorithm)」
Mellum2 輸出:
def max_subarray_sum(nums):
if not nums:
return 0
max_current = max_global = nums[0]
for i in range(1, len(nums)):
max_current = max(nums[i], max_current + nums[i])
if max_current > max_global:
max_global = max_current
return max_global
- 程式碼品質:✅ 正確實現 Kadane’s Algorithm,變數命名清晰,有邊界條件檢查
- 解釋:附帶了演算法時間複雜度 O(n) 和空間複雜度 O(1) 的說明
- 對比 DeepSeek-Coder-V2:兩者輸出幾乎一致,但 Mellum2 的註解更詳細
場景二:邏輯推理
提示詞: 「有一個 4 公升和 3 公升的水壺,如何量出剛好 2 公升的水?」
Mellum2 輸出:
- 裝滿 4 公升水壺(4, 0)
- 將 4 公升倒入 3 公升(1, 3)
- 倒空 3 公升(1, 0)
- 將 4 公升中的 1 公升倒入 3 公升(0, 1)
- 裝滿 4 公升(4, 1)
- 將 4 公升倒入 3 公升(2, 3)→ 4 公升壺中剩下 2 公升
正確! 推理步驟清晰,而且用了 Thinking 模式展示中間過程。這對 Debug 時理解模型邏輯很有幫助。
場景三:除錯建議
提示詞: 「這段程式碼有什麼問題? def add(a, b): return a + b 然後呼叫 add(1, '2')」
Mellum2 輸出:
- 問題:類型不匹配,
int和str不能直接相加 - 建議:加入類型檢查或使用
isinstance()處理不同類型 - 提供改寫範例
實用性:✅ 能正確識別類型錯誤,並給出具體解決方案,對新手友善。
與競品對比|Mellum2 vs DeepSeek-Coder vs GPT-4o
| 項目 | Mellum2-12B-A2.5B | DeepSeek-Coder-V2 | GPT-4o |
|---|---|---|---|
| 參數規模 | 12B(激活 2.5B) | 236B(激活 21B) | 未公開 |
| 開源授權 | Apache 2.0 ✅ | Apache 2.0 ✅ | ❌ 閉源 |
| 本地可跑 | ✅ 消費級 GPU | ⚠️ 需高階 GPU | ❌ 僅雲端 |
| 程式碼生成 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 推理能力 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 中文支援 | ⭐⭐⭐ | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 速度(推理) | 快(低激活參數) | 中 | 快(雲端) |
結論:
- Mellum2 的優勢:本地可跑、速度快、專注程式碼
- 劣勢:中文能力較弱、大型專案理解不如 DeepSeek-Coder
- 適合場景:日常開發輔助、小型專案、注重隱私的開發者
如何安裝 Mellum2|Ollama 與 GGUF 教學
方法一:使用 Ollama(最簡單)
# 安裝 Ollama(如果尚未安裝)
curl -fsSL https://ollama.com/install.sh | sh
# 下載 Mellum2 的 GGUF 版本
ollama pull hf.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF:Q4_K_M
# 啟動對話
ollama run hf.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF:Q4_K_M
方法二:使用 llama.cpp(進階用戶)
# 下載 GGUF 檔案
wget https://huggingface.co/unsloth/Mellum2-12B-A2.5B-Thinking-GGUF/resolve/main/Mellum2-12B-A2.5B-Thinking-Q4_K_M.gguf
# 使用 llama.cpp 執行
./main -m Mellum2-12B-A2.5B-Thinking-Q4_K_M.gguf -p "寫一個 Python 快速排序" -n 512
硬體需求:
- Q4_K_M 量化版:約 8GB VRAM(RTX 3070 以上即可)
- Q8_0 量化版:約 14GB VRAM(RTX 4090 或以上)
- FP16 原始版:約 24GB VRAM(需要專業 GPU)
定價與授權|完全免費
Mellum2 採用 Apache 2.0 授權,這代表:
- ✅ 商用免費:企業可以整合到產品中
- ✅ 修改與再發布:可以微調後重新發布
- ✅ 無需付費:不像 GPT-4o 需要訂閱
- ⚠️ 無技術支援:社群驅動,無官方支援
對比其他模型:
- GPT-4o:每月 20 美元(ChatGPT Plus)或 API 按量計費
- DeepSeek-Coder-V2:API 免費(有限制),本地部署需高階硬體
- Qwen2.5-Coder:開源免費,但中文優化較好
一句話:如果你有 GPU,Mellum2 是零成本的程式碼助手。
延伸閱讀
誰該用 Mellum2?|優缺點總結
適合的使用者
- 本地開發者:不想把程式碼上傳到雲端,注重隱私
- 預算有限:不想付 ChatGPT Plus 或 API 費用
- 硬體普通:只有消費級 GPU(RTX 3070/4070)
- JetBrains 生態用戶:未來可能整合到 IntelliJ IDEA
不適合的使用者
- 需要中文支援:Mellum2 的中文能力明顯弱於 Qwen2.5
- 大型專案分析:32K 上下文對大型程式碼庫稍嫌不足
- 追求頂尖生成:對比 GPT-4o 仍有差距
最終評價
| 項目 | 評分(滿分 5) |
|---|---|
| 程式碼生成品質 | ⭐⭐⭐⭐ |
| 推理與除錯 | ⭐⭐⭐⭐ |
| 本地部署難度 | ⭐⭐⭐⭐⭐ |
| 中文支援 | ⭐⭐⭐ |
| 開源生態 | ⭐⭐⭐⭐⭐ |
| 整體推薦 | ⭐⭐⭐⭐ |
Mellum2 不是要取代 GPT-4o,而是提供一個「夠用且免費」的本地替代方案。 對於日常的程式碼生成、除錯、解釋,它表現得相當出色。特別是在隱私敏感的專案中,Mellum2 的價值無可比擬。
一句話總結:如果你有 GPU,Mellum2 值得一試;如果你沒有,用 Ollama 跑也只要幾分鐘。開源模型的下載按鈕就在那裡,點下去就對了。