Refine Reset All
Sort by
Location
Job Type
Employer/Recruiter
Date Posted
Location
Job Type
Employer/Recruiter
All Filters

Crd Jobs In China - 4 Job Positions Available

Top Cities:
1 – 4 of 4 jobs
Umicore jobs

About Umicore Reducing harmful vehicle emissions. Giving new life to used metals. Powering the cars of the future. As a global materials and technology group, we pioneer approaches to sustainability that continue to offer customers materials

Umicore  26 days ago
Z.ai jobs

机器学习平台研发工程师 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 -负责机器学习平台与算力基础设施的研发与演进,为模型训练、推理、评测及数据处理等流程提供稳定、高效、可扩展的平台能力,主要包括:- 参与并主导大规模算力平台的设计与研发,覆盖资源调度、任务编排、容器与运行时管理等关键方向,持续提升集群整体资源利用率,保障训练与推理场景的稳定运行;- 基于 Kubernetes、Docker 等云原生技术,参与调度器扩展及 CRD/Controller 等核心能力建设,支撑大规模分布式训练与推理场景。- 持续推进平台的易用性与性能优化,完善工具链与开发体验,降低算法与模型团队的使用门槛,提升整体研发效率。 职位要求 - 本科及以上学历,3 年及以上研发经验,有大规模容器集群或平台型系统建设经验,有千卡及以上规模集群管理或调度经验者优先;- 熟练掌握 Golang,具备扎实的数据结构与算法基础,能够独立定位和解决复杂系统问题;- 熟悉 Kubernetes 核心机制与组件(如调度、网络、存储、Controller/CRD 等),了解容器运行时及云原生相关技术体系;- 熟悉常见分布式数据处理或计算框架(如 Ray / Spark / Flink 等),理解其架构设计与运行模型;- 了解并行计算与高性能计算相关技术,具备 OpenMP

Z.ai  5 days ago
Z.ai jobs

Agent Infra 运维开发工程师 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 【背景】纵观全球 AI 发展,大模型正经历从“对话式生成”向“自主执行工具与任务”的 Agentic(智能体)范式跨越。具备复杂规划、推理和行动能力的智能体,被普遍认为是下一代 AI 的核心竞争力所在,不仅是当前学术界与工业界共同瞩目的技术焦点,更蕴含着极广阔的商业落地前景。构建和评测强大的 Agentic 能力,不仅是算法层面的突破,更是对底层基础设施的极限考验。智能体在进行代码执行、工具调用、环境交互和多轮评测时,极其依赖海量、安全、高度动态的虚拟执行环境。这意味着我们需要一个能够支撑极其庞大并发量、具备极致弹性与隔离能力的大规模容器化运行底座。我们团队正是这一关键底座的建设者。在这里,你将面对的是超大规模容器调度的真实工程挑战。你参与设计的系统将直接决定 Agent 训练与评测的迭代效率,成为支撑下一代大模型能力进化的技术基石。如果您对构建极致弹性的云原生架构充满热情,并渴望在 AI 浪潮的最前沿解决极具挑战性的系统性问题,欢迎加入我们!【岗位职责】:负责容器运行时及相关生态的运维及开发,主要包括:- 参与并主导大规模容器调度系统的设计与研发,覆盖资源调度、任务编排、容器与运行时管理等关键方向,持续提升系统整体容量,保障训练与评测场景的稳定运行;- 参与容器镜像库的迭代升级,提升镜像构建、存储、代理等场景效率;- 基于 Kubernetes、CRI 等云原生技术,参与调度器扩展及 CRD / Controller 等核心能力建设,支持大规模容器调度;- 持续推进系统可观测性与性能优化,完善工具链与开发体验,降低系统使用门槛,提升整体研发效率。 职位要求 【岗位要求】:-

Z.ai  5 days ago
XPENG jobs

全栈云端计算平台工程师 广州 全职 通用智能板块 职位描述 职位描述1. 负责小鹏集团计算平台的架构设计与研发落地,构建云端模型开发,训练基础设施以及大规模数据生产基础设施;2. 设计并实现高性能数据编排与加载系统,支撑 PB 级多模态数据(文本、图像、视频、点云、传感器等)的高效处理、缓存加速,支持批式与流式数据生产;深度集成AI Coding Agent与 Data Pipeline,实现数据准备、清洗、标注、版本管理的自动化与智能化闭环;3. 负责云原生基础设施层的开发与优化,包括 GPU集群调度、弹性资源管理、容器化训练/推理工作负载编排,持续提升资源利用率与系统吞吐;4. 可以承担全栈职责,包括前端管理控制台到后端分布式服务的开发。职位要求1. 计算机 / 软件工程 / 数学 / 自动化等相关专业硕士及以上学历,或具备同等技术能力;3 年及以上后端/基础设施开发经验,其中 2 年及以上大规模 AI 平台或分布式系统研发经验;2. 精通Python,具备出色的工程化能力;熟练使用 Golang/Java/C++ 中至少一门语言进行系统性开发;3. 熟悉 AI Coding /

XPENG  1 day ago

Subscribe for job alerts and resources to make your job search easier!

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

Receive the latest job openings for:

crd

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

All Filters Apply
Sort by
Location
Job Type
Employer/Recruiter