← 所有公司

Trainy
运营中用于管理用于训练/服务的 GPU 集群的基础设施。
S23·Summer 2023·B2B 企业服务·San Francisco, CA, USA; Remote·3 人团队·2023 年成立
公司简介
告别 Slurm,欢迎 Konduktor。 Trainy Konduktor 是一款面向 AI 团队的工作负载调度软件平台,支持按优先级调度、控制资源分配并提升 GPU 可靠性。通过 Konduktor,团队可将作业提交至健康的 GPU 池,借助简洁的用户界面设置作业优先级,彻底告别硬件故障的困扰。
创始团队

Andrew Aikawa· FounderTrainy 联合创始人兼 CTO,正在构建一个加速深度学习的训练平台。此前曾担任 Hive AI 物体检测产品的高级机器学习工程师。我在加州大学伯克利分校获得物理学博士学位(2022 届),博士论文聚焦于将计算机视觉和深度学习应用于纳米科学。拥有加州大学伯克利分校物理学与计算机科学学士学位(2017 届)。
产品发布 · 2 次发布
适用于运行AI工作负载团队的Neptune兼容实验追踪
帮助机器学习工程师在训练大型模型时隔离性能瓶颈并提升训练速度的仪表盘。