
Expanse
运营中释放闲置的GPU算力。
公司简介
Expanse 释放被浪费的 GPU 算力。我们通过三项能力回收闲置计算资源:资源预测(在作业提交至调度器前进行精准规模匹配)、优化建议(研究人员可自行实施的代码与配置改进)以及故障预测(在作业消耗大量 GPU 时间前拦截即将失败的任务)。 我们团队有四名工程师,曾在顶级量化基金和国家级超算中心运行高性能计算(HPC)和 GPU 训练工作负载。我们 firsthand 面临过这一问题,唯一的解决方案是过度配置并烧掉数百万美元。Ismaeel 在爱丁堡并行计算中心(EPCC)将首个多模态 HPC 资源预测器作为研究成果构建,其性能超越了所有已发表的基线模型。这正是我们渴望拥有的工具。
创始团队
Ismaeel Bashir· FounderIsmaeel 是 Expanse 的联合创始人兼首席执行官。他在爱丁堡并行计算中心(EPCC)构建了首个多模态高性能计算资源预测器,超越了所有已发表的基线模型。此前,他曾在全球最大的量化基金之一(QRT)运行大规模机器学习模型。在爱丁堡大学攻读计算机科学。
Nikodem Bieniek· FounderNiko 是 Expanse 的联合创始人兼 CTO。曾在 GPU 集群上训练和优化语音识别模型。此前,曾在全球最大的对冲基金之一 Millennium 管理研究人员和工程师所依赖的平台。在爱丁堡大学攻读计算机科学。
Yafet Melake· FounderYafet 是 Expanse 的联合创始人兼 COO。在爱丁堡并行计算中心(EPCC)构建了首个基于 GNN 的集群图网络,用于预测 SLURM 队列等待时间。此前曾在全球最大量化基金之一 G-Research 为研究人员提供工具与基础设施支持。毕业于爱丁堡大学计算机科学专业。
Eren Mendi· FounderEren 是 Expanse 的联合创始人兼首席产品官。他构建了最先进的去中心化基础模型训练系统和性能模型。此前,他在 G-Research 从事量化金融新兴技术的原型开发。毕业于爱丁堡大学计算机科学专业。
产品发布 · 1 次发布
释放闲置的GPU算力。