← 所有公司

Exla
运营中一个能在任何地方运行 Transformer 模型的 SDK
W25·Winter 2025·B2B 企业服务·San Francisco, CA, USA·2 人团队·2025 年成立
公司简介
Exla 对 AI 模型进行激进量化,以最小化内存使用并最大化推理速度。无论是部署 LLM、VLM、VLA 还是自定义模型,Exla 都能通过寥寥数行代码将内存占用减少高达 80%,并将推理速度提升 3–20 倍。 https://cal.com/exla-ai/schedule
创始团队
产品发布 · 1 次发布
优化模型以在边缘设备(如 Jetsons)上运行,推理速度提升 3-20 倍,内存需求减少 80%