← 所有公司

Cumulus Labs
运营中最快的多模态推理操作系统
W26·Winter 2026·B2B 企业服务·San Francisco, CA, USA·2 人团队·2025 年成立
公司简介
Cumulus Labs 是一家专为 AI 团队打造的高速多模态推理提供商,旨在为微调及开源模型提供更快性能、更低成本且零基础设施运维工作。 当前大多数团队被迫在糟糕的选项中做出选择。自托管推理意味着要费力处理配置并维护基础设施,这在规模化时会导致性能下降或故障。Fireworks 等大型提供商虽便捷,但成本极高且存在 GPU 闲置问题。 Cumulus 推出 Ion,这是一款专有推理引擎,能够以高性能和低成本运行大语言模型(LLM)、视觉语言模型(VLM)以及音视频生成任务。
创始团队
Veer Shah· FounderVeer 在威斯康星大学麦迪逊分校攻读计算机科学,将于 2025 年 12 月毕业。在大学期间,他在一家航空航天初创公司工作,曾领导美国太空军 SBIR 合同项目,负责军事卫星通信,并参与了多个 NASA SBIR 项目,其中两个已实现商业化,目前正进行太空飞行测试。大学之前,他曾担任 FIRST 机器人团队 5422: Stormgears 的队长,连续四年晋级世界锦标赛。
Suryaa Rajinikanth· FounderSuryaa Rajinikanth 在佐治亚理工学院攻读计算机科学,期间在 TensorDock 担任首席工程师,打造了首个面向数千名消费者和企业的分布式 GPU 市场。 随后,他在 Palantir 的高性能环境中部署了关键的 AI 系统和基础设施。
产品发布 · 1 次发布
遇见Cumulus,GPU云服务平台,按物理资源使用量计费,节省50%-70%成本。