About Umicore Reducing harmful vehicle emissions. Giving new life to used metals. Powering the cars of the future. As a global materials and technology group, we pioneer approaches to sustainability that continue to offer customers materials
机器学习平台研发工程师 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 -负责机器学习平台与算力基础设施的研发与演进,为模型训练、推理、评测及数据处理等流程提供稳定、高效、可扩展的平台能力,主要包括:- 参与并主导大规模算力平台的设计与研发,覆盖资源调度、任务编排、容器与运行时管理等关键方向,持续提升集群整体资源利用率,保障训练与推理场景的稳定运行;- 基于 Kubernetes、Docker 等云原生技术,参与调度器扩展及 CRD/Controller 等核心能力建设,支撑大规模分布式训练与推理场景。- 持续推进平台的易用性与性能优化,完善工具链与开发体验,降低算法与模型团队的使用门槛,提升整体研发效率。 职位要求 - 本科及以上学历,3 年及以上研发经验,有大规模容器集群或平台型系统建设经验,有千卡及以上规模集群管理或调度经验者优先;- 熟练掌握 Golang,具备扎实的数据结构与算法基础,能够独立定位和解决复杂系统问题;- 熟悉 Kubernetes 核心机制与组件(如调度、网络、存储、Controller/CRD 等),了解容器运行时及云原生相关技术体系;- 熟悉常见分布式数据处理或计算框架(如 Ray / Spark / Flink 等),理解其架构设计与运行模型;- 了解并行计算与高性能计算相关技术,具备 OpenMP
Agent Infra 运维开发工程师 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 【背景】纵观全球 AI 发展,大模型正经历从“对话式生成”向“自主执行工具与任务”的 Agentic(智能体)范式跨越。具备复杂规划、推理和行动能力的智能体,被普遍认为是下一代 AI 的核心竞争力所在,不仅是当前学术界与工业界共同瞩目的技术焦点,更蕴含着极广阔的商业落地前景。构建和评测强大的 Agentic 能力,不仅是算法层面的突破,更是对底层基础设施的极限考验。智能体在进行代码执行、工具调用、环境交互和多轮评测时,极其依赖海量、安全、高度动态的虚拟执行环境。这意味着我们需要一个能够支撑极其庞大并发量、具备极致弹性与隔离能力的大规模容器化运行底座。我们团队正是这一关键底座的建设者。在这里,你将面对的是超大规模容器调度的真实工程挑战。你参与设计的系统将直接决定 Agent 训练与评测的迭代效率,成为支撑下一代大模型能力进化的技术基石。如果您对构建极致弹性的云原生架构充满热情,并渴望在 AI 浪潮的最前沿解决极具挑战性的系统性问题,欢迎加入我们!【岗位职责】:负责容器运行时及相关生态的运维及开发,主要包括:- 参与并主导大规模容器调度系统的设计与研发,覆盖资源调度、任务编排、容器与运行时管理等关键方向,持续提升系统整体容量,保障训练与评测场景的稳定运行;- 参与容器镜像库的迭代升级,提升镜像构建、存储、代理等场景效率;- 基于 Kubernetes、CRI 等云原生技术,参与调度器扩展及 CRD / Controller 等核心能力建设,支持大规模容器调度;- 持续推进系统可观测性与性能优化,完善工具链与开发体验,降低系统使用门槛,提升整体研发效率。 职位要求 【岗位要求】:-
全栈云端计算平台工程师 广州 全职 通用智能板块 职位描述 职位描述1. 负责小鹏集团计算平台的架构设计与研发落地,构建云端模型开发,训练基础设施以及大规模数据生产基础设施;2. 设计并实现高性能数据编排与加载系统,支撑 PB 级多模态数据(文本、图像、视频、点云、传感器等)的高效处理、缓存加速,支持批式与流式数据生产;深度集成AI Coding Agent与 Data Pipeline,实现数据准备、清洗、标注、版本管理的自动化与智能化闭环;3. 负责云原生基础设施层的开发与优化,包括 GPU集群调度、弹性资源管理、容器化训练/推理工作负载编排,持续提升资源利用率与系统吞吐;4. 可以承担全栈职责,包括前端管理控制台到后端分布式服务的开发。职位要求1. 计算机 / 软件工程 / 数学 / 自动化等相关专业硕士及以上学历,或具备同等技术能力;3 年及以上后端/基础设施开发经验,其中 2 年及以上大规模 AI 平台或分布式系统研发经验;2. 精通Python,具备出色的工程化能力;熟练使用 Golang/Java/C++ 中至少一门语言进行系统性开发;3. 熟悉 AI Coding /