研究 · 产品 · 开发者

将 AI 带到边缘设备

我们是一家独立 AI 研究机构——通过新颖的研究、免费产品和开发者工具,将强大智能带到每一台设备。

We don't sell tokens. We set them free.

我们进行端侧 AI 原创研究,构建完全运行在你设备上的免费消费级产品,并打造让任何人都能在边缘部署 AI 的开发者工具。不依赖云端,数据不离开你的设备。

MLXLayerStream

按层流式卸载:在 8GB 边缘设备上运行 9B+ 大模型

通过从 NVMe 存储按层流式加载权重,使超出设备内存的模型能在 iPad 和 iPhone 上推理。

88% 峰值内存减少 — 27B 模型仅需 1.7 GB 峰值内存

推测解码 × MoE

推测解码对混合专家模型有帮助吗?

306 次实验的实证研究,揭示了 MoE 模型的全新批量验证摊销机制。

1.30× MoE 加速,草稿接受率仅 <4%

Prism

消费级硬件上的跨域个人数据整合

在设备端整合财务、饮食、情绪和阅读数据,零数据泄漏。

1.48× 洞察涌现 · 125.5× 联邦压缩

开发者工具

探索开发者工具

Edge Studio

预览

AI 驱动的模型分析与精准优化。以神经元级别精度压缩模型。

Edge Runtime

预览

Apple Silicon 专属推理算法。ANE-GPU 协同调度,预填充加速 11.3 倍。

Edge Scaffold

预览

从优化模型到上架 App Store 的端到端流水线。无需云端。

Vanilla

已发布

大模型推理实时可视化——VLM 图片输入、注意力热力图(Metal加速)、层激活粒子流、概率分布动画过渡,48个模型全覆盖。v1.0.4 已发布。

关于

AtomGradient 是一家独立研究机构,致力于构建端侧 AI 的未来。我们在模型压缩、硬件感知推理和个人数据整合方面进行原创研究——然后将这些突破转化为完全运行在你设备上的免费产品。

我们相信智能属于边缘。我们构建的每个模型都在本地运行。我们发布的每款产品都是免费的。你的每一个字节数据都留在你的设备上。

边缘 AI端侧智能隐私优先新颖研究Apple Silicon

与我们一起构建

我们正在寻找想要突破端侧 AI 边界的研究人员和工程师。

查看开放职位