我们是谁
从 C++ 推理内核到端侧 App 模板,六层代码全部自研。我们不包装别人的 API,不卖云端算力——我们让开发者和企业在自己的设备上拥有持续进化的 AI,数据不经过任何第三方服务器。
核心突破
在端侧跑大模型已不是难题。但整个行业都卡在同一个问题上——端侧 AI 能不能随用户一起进化?我们已在真机上跑通了完整闭环。
✕
对话越长越占内存,本质是"贴便签"不是"记住"
✕
会"学了你、忘了别的"(灾难性遗忘),端侧没有足够算力做训练
Neural Imprint(神经烙印)
我们绕开了这两堵墙。不改一个权重、不做微调、不需要端侧训练算力,模型就能"认识你"——用户画像直接烙进模型内部状态,不是拼在上下文里的便签。这项能力已申请 12 件发明专利保护。
你正常使用 App——记账、聊天、拍照、阅读
设备本地理解你的行为模式,形成对"你是谁"的认知
这份认知被烙进模型内部状态——下次开机,模型立即认识你
全程数据不离开你的设备,不经过任何第三方服务器
实证,不讲故事
我们用自有资金把最难的部分验证完了。以下每一条 ✅ 都有真机日志和数据支撑。
200
大模型 200 轮连续对话在三款真机全部跑满零崩溃
16/16
八领域 × 双真机 = 16/16 场景全过
1,000+
六仓全栈自研
0
真实数据经设备间加密通道回流
Neural Imprint 完整链路在真机端到端跑通
八领域 × 双真机 = 16/16 场景全过
大模型 200 轮连续对话在三款真机全部跑满零崩溃
用户校准循环:纠正→重新生成→模型更新,dogfood 真机闭环已验证
个性化画像提取在真机上运行,可度量改善已观测
真实数据经设备间加密通道回流,不经任何第三方服务器
六仓全栈自研 · 1,000+ 个自动化测试 · 五层测试体系
🔭 下一步
智能路由已在影子模式运行,真实决策逐步切换
每台设备出厂内置持续学习引擎——手机、机器人、AR 眼镜、汽车、工业终端,都需要一个能在本地思考和进化的大脑,我们正在造它
具身智能的学习层——机器人每天产生海量私有实时数据,不可能全部上云再学。我们今天在手机上跑通的那套能力,天然是具身智能绕不过的基础设施
隐私从"承诺"变成"架构"——数据始终留在用户自己的设备上,不经过任何第三方服务器。当每台设备都在本地进化,数据经济的价值重心从"谁囤的数据多"变成"谁的设备最懂它的主人"
护城河
01
OpenAI / Google / Anthropic 靠卖算力赚钱——用户 AI 在本地进化直接动摇他们的商业根基,他们不会做这件事
02
不是某个算法的突破——要同时控制从 C++ 推理内核到终端 App 的六层全栈才能跑通。据我们所知,尚无公开可用的同类全栈方案
03
开源层(Apache 2.0 + 专利授予)· 专利层(12 件发明专利)· 闭源层(Edge Runtime + 商业秘密)
六仓全栈自研:C++ 推理内核 → 端侧 SDK → 自学习编排 → App 脚手架 → 优化工作台 → Python 核心算法
产品矩阵
免费工具
桌面工作台:模型分析→量化→剪枝→蒸馏→benchmark→导出
免费工具
开源端侧 App 脚手架(Apache 2.0),优先支持 Apple 平台,跨平台扩展中
免费工具
LLM 推理可视化(已上线)
收入主体:Edge Runtime
唯一能正确加载我们优化后模型、恢复 Neural Imprint 个性化状态的运行时。端侧推理避免云端 token 成本,具备软件基础设施的毛利结构。
Dailyn(记账)、Narrus(阅读)、Mealens(食物)、Ururu(陪伴)、SpriteSpeak(儿童故事)——全部免费、不含广告、不卖数据。它们是算法研究的实验场,不是公司主体业务。
市场机会
TAM
¥3,500–5,600 亿
全球端侧 AI 软件+应用(2028)
SAM
¥7,000–8,000 亿
中国端侧 AI + 信创软件(2027)
数据来源:IDC、Canalys/Omdia、MarketsandMarkets、前瞻信创、艾媒大模型等第三方公开数据测算
来自字节、百度、京东、微博、华为及世界 500 强,兼具原创研究、国际视野与产品落地能力。

Shuhong
创始人

Siqi Chen
联合创始人 & 首席科学家

Jay Tian
联合创始人 & 首席产品官

Xi Wu
首席运营官 & 政府关系
个性化质量证不到生产级
基准营收不依赖个性化——工具链+推理引擎本身可支撑
平台厂商开放端侧 SDK
结构性矛盾(控体验 vs 开放 SDK);且我们跨平台、厂商中立
竞品复刻
12 件专利 + 六层全栈 + 商业秘密三层保护