所有人都说模型训练完就不会变了——我们让ta随你而生长

AI模型为你而生长

一个为你而生的模型，无论岁月如何流过、世界如何变化，ta是你最忠实的伙伴，像你一样直面世界，一起学习、成长，不离不弃。

“We don't sell tokens. We set them free.”

具身智能的大脑

不是机器人的肢体，是它思考、记忆、学习的中枢

等机器人成熟、可穿戴普及、智能家居互联那一天——每一个产品都会需要这样一个大脑。云端 AI 永远到不了那里：网络会断、时延会高、订阅会停、数据回不来。具身智能必须把大脑装进本体。

记

记得住

跨时间、跨场景、跨设备的连续记忆。不是每次对话重来，不是从零认识你。

学

学得到

从真实交互里学习用户偏好、节奏、语境。不是出厂时锁死的能力曲线。

属

属于本体

装在设备里，不是云端租赁。换设备时，记忆跟着走，不是上传到别人那里。

“We are not making another AI tool. We are making the brain.”

“断网的那一刻，机器人不该停止思考。”

254

真实使用记录

30 天用户日常 dogfood

画像方向

从行为里抽取的偏好维度

92%

个性化判官评分

vs base 模型 33%, 不损基础能力

iPhone 跑得稳

实际占用 5.5GB, Jetsam 边缘

协同仓库

算子 / 训练 / 推理 / SDK / App

字节上云

数据物理上从不离设备

产品

大脑已经在你日常用的 App 里

端侧 AI 应用，将智能带入日常生活——私密、免费、人人可用。

Narrus

跨语言阅读

端侧翻译与语音转写，适用于任何电子书。用任何语言阅读，用你的语言聆听。

Dailyn

个人财务

多模态消费追踪——拍照、语音或文字输入，追踪和分析你的消费模式。

Mealens

食物分析

视觉餐食分析，即时获取营养洞察和饮食模式识别。

Ururu

情绪智能

情感计算 AI 伙伴，能感知和回应你的情绪。

研究

不是论文综述, 是为产品奠基的原创研究

查看全部研究

MLXLayerStream

按层流式卸载：在 8GB 边缘设备上运行 9B+ 大模型

通过从 NVMe 存储按层流式加载权重，使超出设备内存的模型能在 iPad 和 iPhone 上推理。

推测解码 × MoE

推测解码对混合专家模型有帮助吗？

306 次实验的实证研究，揭示了 MoE 模型的全新批量验证摊销机制。

Prism

消费级硬件上的跨域个人数据整合

在设备端整合财务、饮食、情绪和阅读数据，零数据泄漏。

与我们一起构建

我们正在寻找想要突破端侧 AI 边界的研究人员和工程师。

查看开放职位试用 Vanilla