原文整理页

Garry Tan 展示了 Google Gemma 4 E2B 模型在 iPhone 17 Pro 上的运行表现,推理速度达 40tk/s 并支持离线思考模式

来源作者:Garry Tan (@garrytan)原始来源:https://x.com/garrytan/status/2040895318544588876

中文导读

Garry Tan 展示了 Google Gemma 4 E2B 模型在 iPhone 17 Pro 上的运行表现,推理速度达 40tk/s 并支持离线思考模式。

正文 Markdown

Incredible possibilities for on-device small models. Here @adrgrondin is running Google’s Gemma 4 E2B on iPhone 17 Pro. ~40tk/s with MLX optimized for Apple Silicon SOTA coding & math on mobile with 128K context. Fully offline with thinking mode.