← 所有公司

Exla

运营中

一个能在任何地方运行 Transformer 模型的 SDK

W25·Winter 2025·B2B 企业服务·San Francisco, CA, USA·2 人团队·2025 年成立

官网 ↗YC 页面 ↗LinkedIn ↗Twitter ↗

公司简介

Exla 对 AI 模型进行激进量化，以最小化内存使用并最大化推理速度。无论是部署 LLM、VLM、VLA 还是自定义模型，Exla 都能通过寥寥数行代码将内存占用减少高达 80%，并将推理速度提升 3–20 倍。 https://cal.com/exla-ai/schedule

创始团队

Pranav Nair· Co-Founder
Exla的首席技术官。此前在苹果公司担任操作系统工程师，负责所有苹果设备的睡眠/休眠功能。普渡大学计算机科学学士。
LinkedIn ↗
Viraat Das· Founder
Exla 的首席执行官。此前在亚马逊担任机器学习工程师。
LinkedIn ↗Twitter ↗

产品发布 · 1 次发布

Exla – 在边缘设备上运行数据中心模型 ↗▲ 272025年2月27日
优化模型以在边缘设备（如 Jetsons）上运行，推理速度提升 3-20 倍，内存需求减少 80%

变化历史 · 4 条记录

2026年7月12日
- 更新了一句话简介19:00
- 重写了公司简介19:00
- 更新了行业19:00
- 更新了标签19:00