Google 正式開放香港地區使用 Gemini AI 助理,方便唔少,但免費用戶會受到 Token 限制,日前 Google 也推出了開源模型 Gemma 4 ,可以俾大家用離線方式用自家電腦進行 AI 運算。不過別以為改用 Gemma 4 開源模型會令執行 AI 變得複雜。Google 剛推出名為 Google AI Edge Gallery 的手機應用,讓用家可以直接使用 iOS 或 Android 裝置,就能離線執行包括 Google Gemma 4 模型。對於香港用戶來說,最大賣點在於它是免費下載、無需使用 VPN,以及下載模型後即可完全離線運作。今次我們就試用 iPhone 17 Pro 並在開啟「飛行模式」下,測試其實際表現,到底用手機離線 AI 是否真的可行?

AI Edge Gallery 是 Google AI Edge 項目的一部分,原本以實驗性 Alpha 版本在 GitHub 上低調推出,短短兩個月 APK 下載量已突破 50 萬次。現已正式推出的 Android 及 iOS 版本,是專為行動裝置打造的離線生成式 AI 體驗 App。讓用戶能夠直接在手機上運行開源大型語言模型(LLM),無需依賴雲端伺服器。App 內建多款優化後的開源模型,例如 Google 最新的 Gemma 系列(包括 Gemma 4),這些模型專為手機硬體設計,能夠處理文字聊天、圖像理解、語音轉錄,甚至簡單的 Agent 任務。
與 Gemini 有無分別?
不過要留意 AI Edge Gallery 與傳統雲端 AI(如 Gemini、Grok)不同,AI Edge Gallery 的所有推理過程都在裝置本地完成。用戶需先連網下載模型(模型大小從幾百 MB 到數 GB 不等),之後即使斷網也能使用。官方強調「100% 裝置端隱私」,提示、圖像和敏感資料不會上傳雲端,適合注重私隱或經常處於離線環境的用戶,例如旅行、出差或訊號不穩的地區。但當然封閉式模型在資料完整性和更新時效方面,可能會及不上雲端 AI。

從 App Store 下載及打開 AI Edge Gallery,會看到主頁有不同的區塊,包括 Ask Image、AI Chat、Audio Scribe 和 Tiny Garden 等等。而不同的區塊都可使用包括 Gemma 4 的 E2B 或 E4B 模型,分別在於較高階的手機型號可試試較完整的 E4B,而一般入門的手機則建議使用 E2B。用家需要將模型下載到手機,即使用入門的 E2B 也有 2.52GB,所以建議在接連 Wi-Fi 的環境下下載,並確保手機有足夠的儲傳空間。

Ask Image
其中的 Ask Image(圖像提問),用戶上傳照片後,可用自然語言提問,例如「這張圖有什麼文字?請翻譯成英文」或「描述這張圖的內容」。實測顯示,模型能有效進行 OCR(文字辨識)、圖像理解及簡單分析。即使開啟「飛行模式」斷網後,也能清楚描述相片的內容,可用於文件掃描、菜單翻譯等日常場景。不過,當問到能否辨認公仔的角色時,Gemma 4 似乎就無法辨認到到相片中的公仔其實是 Snoopy 和輕鬆小熊。而另一測試,看看圖中的臘腸,雖然 Gemma 不能分辨到甚麼是臘腸,但會懂得判斷它是屬於醃製肉類食品,並能說出右邊的臘腸較長一點。

AI Chat / Thinking Mode
AI Chat / Thinking Mode(AI 聊天與思考模式):提供多輪對話功能,用戶可與模型進行連續聊天。Thinking Mode 會顯示模型的推理過程,適合學習或腦 storm。離線測試下,回應速度取決於所選模型(如 Gemma 4 E2B 較快但能力較弱,E4B 則更智能但需更多 RAM)。我們試試請 Gemma 4 E2B 代為建議 11 月到東京旅行的行程,後續也輸入了人數、喜好和預算等資料,而 Gemma 4 提供的建議其實很籠統,但至少所提供的地標都的確是在東京中心範圍,也不似早期 ChatGPT 或 Copilot 那樣會建議你一天跑很多地方。

Audio Scribe(語音轉錄)
支援離線語音轉文字,可即時轉錄講話內容,甚至進行簡單翻譯或摘要。在離線狀態下錄音轉寫,表現穩定,適合會議記錄或語音筆記。不過每次只能使用 1 段 30 秒內的對話,如果要轉錄一些較長訪問內容,就未必很適合。

Agent Skills(代理技能)
這是 AI Edge Gallery 中較進階的功能,包括簡單的設備控制或自動化任務,由優化後的 FunctionGemma 等模型支援。實測顯示,在離線環境下能執行基本操作,但目前仍處於示範階段,尚未達到生產級複雜度。

小總結一下,在開啟 Airplane Mode 斷網後,AI Edge Gallery 所有功能均可正常運作,證明真正離線可用。生成速度在 iPhone 17 Pro 上表現不錯,不過一些較舊或入門機款則可能會建議使用像 Gemma 4 E2B 等較小模型。由於使用前,會需要將整個模型包下載到裝置上,所以要確保手機有足夠的儲存空間。至於內容的廣泛性和準確程度,封閉式模型當然不能與傳統雲端 AI 相比,也不能做到以文字生成圖片或影片。不過因為封閉式模型只能使用你投餵的資料,對於個人和企業數據安全會更有保障,而且在使用上沒有額度限制,用家可以放心 Try and Error。



