一、Ollama 安裝 QWen3
安裝步驟
-
首先嘗試運行 QWen3 模型:
ollama run qwen3
-
如果遇到版本不兼容錯誤(Error 412),表示需要升級 Ollama:
curl -fsSL https://ollama.com/install.sh | sh
-
驗證版本:
ollama -v
確保為最新版本 0.6.6。
常見問題解決
問題:反復出現版本不兼容警告
解決方案:
-
完全卸載舊版本:
# 停止 Ollama 服務 pkill -f ollama ? # 刪除主程序 sudo rm -f /usr/local/bin/ollama ? # 清除數據和模型(注意這會刪除所有已下載模型) rm -rf ~/.ollama
-
重新安裝最新版:
curl -fsSL https://ollama.com/install.sh | sh
-
確認版本:
ollama -v
二、配置外網訪問
使用 ngrok 暴露服務
-
安裝 ngrok:
curl -sSL https://ngrok-agent.s3.amazonaws.com/ngrok.asc | \sudo tee /etc/apt/trusted.gpg.d/ngrok.asc >/dev/null && \echo "deb https://ngrok-agent.s3.amazonaws.com buster main" | \sudo tee /etc/apt/sources.list.d/ngrok.list && \sudo apt update && \sudo apt install ngrok
-
配置認證令牌(從 ngrok 官網獲取):
ngrok config add-authtoken <你的TOKEN>
-
啟動端口轉發:
ngrok http 11434 --url https://xxxx.ngrok-free.app
正常會出現以下信息:
驗證外網訪問
使用獲得的 ngrok URL(如 https://xxxx.ngrok-free.app
)測試 API:
curl https://xxxx.ngrok-free.app/api/generate -d '{"model": "qwen3","prompt": "你好,你是誰?","stream": false
}'
注意事項
-
安全警告:直接暴露 Ollama 到公網存在風險,建議:
-
添加身份驗證
-
限制訪問IP
-
僅在內網使用或通過VPN訪問
-
-
性能考慮:通過 ngrok 的免費隧道有帶寬限制,對于大模型響應可能較慢
-
備選方案:可以考慮使用 Cloudflare Tunnel 或其他內網穿透工具替代 ngrok
-
服務管理:對于生產環境,建議配置 ngrok 為系統服務:
sudo systemctl enable ngrok sudo systemctl start ngrok
如需更長期穩定的域名,建議升級 ngrok 付費計劃或使用自有域名配置。