Python Infra Jobs In Beijing (Peking) (Hiring near me)

AI Infra 模型部署实习生

XPENG ( Beijing )

AI Infra 模型部署实习生北京实习互联网 / 电子 / 网游 27届AI人才专项计划（实习生专场）职位描述参与公司 AI 基础设施的建设，重点围绕模型部署流程的效率优化。通过工程化手段、智能体（Agent）与自动化工具链，减少人工介入，缩短模型从训练完成到上线的周期，提高部署的可靠性与效率。岗位职责模型部署流程的效率优化- 深度参与现有模型部署，分析各个阶段（模型转换、模型验证、上线等）的耗时与瓶颈，提出并实现改进方案。- 设计并构建基于 Agent + Skill 的模型验证与发布助手：将模型格式检查、精度校验、性能基准测试等能力封装为可复用的 Skill；通过 Agent 调度这些 Skill，实现部署任务的自动化。- 设计模型验证等工具，提升多版本或高频部署场景下的效率。可观测性与问题排查- 收集并分析部署全流程的日志、耗时、资源占用等数据，建立部署任务的监控看板，展示部署耗时、成功率、资源消耗等关键指标。- 开发基于 Agent 的故障诊断 Skill：自动识别部署失败常见原因。- 协助构建部署任务的监控看板，展示部署耗时、成功率、资源消耗等关键指标。基础设施与工具链建设- 参与部署平台的设计与开发，推动模型部署从“脚本化”向“服务化+智能化”演进。- 建设 Agent 与

Premium Full-time AI Kernel

XPENG 29 days ago

AI infra工程师

度小满科技（北京）有限公司 Du Xiaoman Technology ( Beijing )

AI infra工程师北京技术 - 算法硕士及以上小满星AGI顶尖人才专项职位描述 1、利用算子优化，显存/KV cache管理优化、分布式加速等技术开发和改进推理框架；2、参与高并发场景下大模型推理的性能分析与优化工作，定位系统瓶颈并提出改进方案；3、探索低资源下的大模型轻量化方案：量化、投机采样、sparse attention等技术；4、与团队协作，推动优化技术在业务中的应用。职位要求 1、计算机、人工智能、软件工程等相关专业硕士及以上；2、熟悉大模型推理优化方法，对主流开源推理框架tensorRT_llm、vllm、sglang 有开发经验者优先；3、精通 Python/C++ 编程，具有 CUDA 开发及 GPU 调优经验者优先；4、有顶会论文、竞赛获奖或相关实习经验者优先；5、有infra相关实习经验者优先。职位信息部门：智能技术发展部投递...

Premium Full-time CUDA AI

度小满科技（北京）有限公司 Du Xiaoman Technology 21 days ago

大模型训练与推理Infra工程师-MiMo

Xiaomi ( Beijing )

大模型训练与推理Infra工程师-MiMo 北京社招全职职位 ID：A14015 职位描述 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台，优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架，确保平台的高性能和稳定性（如基于 PyTorch、TensorFlow 或 JAX）。 - 集成和优化高性能计算技术（如 CUDA、MPI、NCCL 等）。2. 模型推理基础设施开发 - 构建高效的推理框架，支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗，支持多种硬件架构（GPU、NPU等）。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。3. 性能监控与优化 - 开发工具链和监控系统，跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。4. 跨团队协作 - 与模型研究团队密切合作，理解模型需求，定制训练和推理策略。

Premium Remote Friendly Full-time AI Python

Xiaomi 6 days ago

VLA训练infra算法工程师 - XiaomiRobotics

Xiaomi ( Beijing )

VLA训练infra算法工程师 - XiaomiRobotics 北京社招全职职位 ID：A243642 职位描述 1. 基于 PyTorch 生态（FSDP / DeepSpeed / Megatron 等）设计并实现 VLA 模型的分布式训练方案（DP / TP / PP / MoE），构建稳定高效的训练框架2. 推动混合精度（BF16 / FP8）与算子融合（FlashAttention / Triton kernel）3. 构建高吞吐数据pipeline，设计数据格式与 shard 策略，实现高效的数据加载4. 支持大规模实验追踪、管理、指标可视化职位要求

Premium Remote Friendly Full-time PyTorch Linux Python CUDA Kernel

Xiaomi 7 days ago

端云协同 AI Infra 专家 / 工程师

ModelBest ( Beijing )

端云协同 AI Infra 专家 / 工程师北京社招全职技术 - 基础架构职位 ID：A25180 职位描述 1. 负责端云协同 AI 架构设计，明确云侧模型、私有化服务、边缘节点、端侧设备之间的职责边界、数据流、控制流和安全边界。2. 围绕面壁miniCPM等系列产品，面向运营商营业厅、客服坐席、现场运维、企业办公终端、边缘网关等场景，建设端云协同的数字员工能力。3. 与 Infra 团队协作，打通云侧模型服务、RAG、Workflow、权限审计、日志监控和端侧运行环境。4. 负责端侧资源约束下的性能优化，包括量化、KV Cache、批处理、缓存策略、网络降级、异构算力调度和功耗控制。5. 沉淀端云协同部署规范、设备适配清单、性能 benchmark、故障排查手册和行业交付模板。职位要求 1. 本科及以上学历，计算机、电子信息、自动化、通信、人工智能等相关专业。2. 3 年以上端侧 AI、边缘计算、推理优化、嵌入式系统、客户端基础架构或云边端协同系统经验。3. 熟悉 C/C++、Python，了解端侧或边缘设备上的性能调优、资源管理和系统问题排查。4. 熟悉至少一种推理框架或部署工具，如 llama.cpp、ONNX Runtime、TensorRT、SGLang 等。5.

Premium Remote Friendly Full-time AI

ModelBest 1 day ago

AI 院-MOE 训练/推理Infra工程师

Z.ai ( Beijing )

AI 院-MOE 训练/推理Infra工程师北京全职互联网 / 电子 / 网游职位描述我们正在寻找一位经验丰富的 MOE 训练/推理 Infra 开发工程师，负责设计、实现并优化我们的 MOE（Mixture of Experts）训练和推理框架。该职位需要您具备扎实的分布式系统、高性能计算、深度学习框架以及硬件加速优化的相关知识，能够解决 MOE 训练和推理过程中的各种技术难题，并与算法团队紧密合作，确保算法的顺利实现。主要职责：1、设计并实现高效的 MOE 训练/推理框架：•设计并开发支持大规模分布式训练和推理的 MOE 框架，确保其在各种硬件配置下的高效运行；•优化训练和推理性能，通过算法优化、并行计算、缓存策略等方式，缩短训练和推理时间，提高效率；2、解决 MOE 训练/推理过程中的技术难题：•针对专家网络的选择问题，研究和实现有效的专家选择算法，确保模型在训练和推理过程中的稳定性和准确性；• 解决负载均衡问题，通过动态调整专家网络的负载分配，提高系统资源的利用率，避免过载或空闲状态；• 优化通信过程，减少分布式训练和推理中的通信开销，提高数据传输效率，缩短训练和推理时间3、与算法团队密切合作：•与算法团队保持密切沟通，了解算法需求，根据需求调整和优化训练和推理基础设施，确保算法的顺利实现；•跟踪业界最新技术动态，引入适合项目需求的新技术、新方法，提升团队整体技术水平；职位要求关键技能：分布式训练技术：•掌握分布式训练框架（如 Horovod、PyTorch Distributed）的使用和优化。•具备设计和实现高效分布式训练系统的能力。硬件加速优化：•熟悉 GPU、TPU 等硬件架构，能够进行硬件级性能调优。•了解 CUDA、cuDNN 等相关技术，能够利用硬件加速提升训练和推理效率。模型优化技术：•了解量化、剪枝、压缩等模型优化方法，以提升推理效率•能够在实际项目中应用这些技术，优化模型大小和推理速度•负载均衡与通信优化•能够设计高效的负载均衡策略和通信机制，以应对 MOE

Premium Full-time MOE Linux AI

Z.ai 2 hours ago

Get Hired 2x Faster
Connect with Top Employers Directly

AI院-训练Infra工程师

Z.ai ( Beijing )

AI院-训练Infra工程师北京全职互联网 / 电子 / 网游职位描述 1、负责大规模预训练框架的研发、优化和维护，根据业务需求持续改进训练框架和策略，提升模型训练效率；2、分析和定位训练中的性能瓶颈，实施针对性优化措施，提升训练效率和稳定性；3、跟进业界技术进展，不断同步与集成最新训练优化策略。职位要求 1、对自然语言处理、计算机视觉和多模态算法有深入理解，熟悉主流的 LLM 和 VLM 模型架构，有分布式训练经验；2、精通 Python 编程语言，熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架；3、有大规模预训练优化 / MoE 训练优化经验的优先考虑。投递...

Premium Full-time MOE PyTorch Python

Z.ai 2 hours ago

AI院-GLM后训练团队-推理优化/推理Infra工程师（RL）

Z.ai ( Beijing )

AI院-GLM后训练团队-推理优化/推理Infra工程师（RL）北京全职互联网 / 电子 / 网游 - 研发职位描述 1. 基于SGLang进行大模型推理引擎与服务侧开发，提升吞吐、降低时延与成本，保障线上稳定性。2. 支持RL训练相关的推理链路，包括rollout生成、打分/奖励模型推理等，优化训练闭环效率与资源利用。3. 建设推理侧的监控与性能分析能力，参与线上问题定位与故障处理。4. 与算法/训练团队协作，将模型与训练需求落地到可运行、可维护的推理系统，并输出必要的技术文档。职位要求 1. 熟练使用Python/C++（至少一种），具备良好的工程能力与性能意识。2. 熟悉GPU推理与常见深度学习框架（如 PyTorch），了解分布式通信与并行基本概念（NCCL 等）。3. 了解并使用过SGLang（或能快速上手并承担核心模块开发与调优）。4. 理解RL训练中推理侧的作用，能够与训练流程协同推进落地。5. 具备线上系统排障能力，能通过日志/指标定位性能与稳定性问题。加分项6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。7. 有推理性能profiling、算子/运行时优化经验。8. 有MoE模型优化经验。投递...

Premium Full-time

Z.ai 2 hours ago

大模型研究和工程实习生-MiMo

小米科技 Xiaomi Technology ( Beijing )

大模型研究和工程实习生-MiMo 北京校招实习算法类职位描述 1.创新模型结构设计： - 参与大型语言模型核心架构设计与优化 - 探索Transformer及其变种的改进方案2. 原生多模态探索： - 研发原生多模态架构，实现文本、图像、音频等模态信息的深度融合 - 研究多模态对齐技术，实现不同模态的语义一致性3. 模型推理能力提升： - 借助强化学习+CoT，提升大语言模型推理能力 - 自研强化学习算法，搭建强化学习训练框架，设计奖励函数、构建环境、优化模型提升性能4. 大模型训练推理Infra - 开发和优化大规模分布式训练推理系统 - 优化大模型训练的内存使用和通信效率5. 科学评测体系构建： - 构建科学严谨的算法评测方法，系统评估模型的性能 - 探索模型能力的潜在机制，推动模型优化和创新职位要求职位要求1. 学术能力： - 精通深度学习、强化学习（RL）、自然语言处理（NLP）等领域，具备创新研究能力 -

Premium Full-time

小米科技 Xiaomi Technology 29 days ago

端到端算法工程师实习生

小米科技 Xiaomi Technology ( Beijing )

端到端算法工程师实习生北京校招实习软件研发类职位描述 1. Develop quantization, sparsity, pruning, and distillation techniques to enhance the production-level autonomous driving models.2. Optimize, convert, and deploy autonomous driving models (e.g., ONNX models) that operate efficiently on diverse

Premium Full-time Deep Learning CUDA Systematics Python AI

小米科技 Xiaomi Technology 21 days ago

AI Infrastructure Software Engineer — CosmosLab

Nvidia ( Beijing )

NVIDIA has been transforming computer graphics, PC gaming, and accelerated computing for more than 25 years. It’s a unique legacy of innovation that’s fueled by great technology—and amazing people. Today, we’re tapping into the unlimited potential

Premium Full-time AI High Throughput Eras Frontier Data Flow

Nvidia 13 days ago

MiMo算法研究员-音频&语音

Xiaomi ( Beijing )

MiMo算法研究员-音频&语音北京社招全职职位 ID：A32353 职位描述我们在做什么？我们在通过探索 scaling 语音预训练和后训练，来让模型涌现出真正的语音超级智能。1. Data - 海量语音数据处理：建设超大规模真实语音数据发掘、采集、预处理与清洗的流水线 - 高质量语音数据处理：搭建在海量真实语音中对高质量数据进行定义、召回、标注的流水线2. Backbone & Infra - 语音原生架构：探索随着语音数据 scaling 收益上限最高的建模架构，不限于离散或者连续建模 - 高效训推框架：适配最契合语音模型架构的训练和推理框架，兼顾性能和效率3. Pretrain & Post-train - 定义语音生成式预训练：围绕可泛化的语音预训练模型展开前沿探索性研究，坚定 scaling 路线 - 强化学习后训练：为语音预训练模型的强大能力提供语音对话的交互方式，激发预训练潜力4. Evaluation & Product -

Premium Full-time C++ Python

Xiaomi 7 days ago

大模型推理优化工程师

Xiaomi ( Beijing )

大模型推理优化工程师北京社招全职职位 ID：A234561 职位描述 1. 负责图像/视频/多模态等方向AIGC大模型推理加速研究，包括模型蒸馏、模型量化、模型剪枝、推理加速框架移植等2.实现高性能LLM/VLM/AIGC模型推理引擎，优化计算图编译、动态Batching及KV Cache管理，打造极致低延迟与高吞吐的线上服务架构3.续跟进业界最新的Infra技术（如FlashAttention演进、高效通信库、FP8/INT8量化、稀疏蒸馏等训练部署方案），配合实际业务驱动技术预研并转化为生产力职位要求 1、本科及以上学历，计算机相关专业优先，熟练掌握C++/Python，精通数据结构与算法，并有并发编程基础；2、熟练使用PyTorch/TensorFlow或其他深度学习框架，熟练掌握深度学习性能加速技术包括但不限于算子性能优化，通信优化等；3、具有AIGC（VLM、Diffusion）模型训练/推理优化经验，熟悉TensorRT-LLM、vLLM、LightX2V等推理效率优化工具；4、熟悉大模型蒸馏、量化、剪枝等常用压缩技术，熟练使用常见推理加速工具，如TensorRT、vLLM等；5、积极主动有热情，具备较强的沟通能力以及优秀的团队协作能力投递...

Premium Full-time

Xiaomi 7 days ago

【基座模型】软件研发工程师

Li Auto ( Beijing )

【基座模型】软件研发工程师北京全职互联网 / 电子 / 网游职位描述负责 AI 应用与 Agent 系统的后端开发与架构设计构建高可用、可扩展的 AI 服务与中间件集成参与 LLM Agent 框架的设计与实现优化 AI 系统的性能、稳定性与成本职位要求熟练掌握至少一门主流后端语言（Python / TypeScript / Go）熟练使用常见中间件：Redis、Kafka、MySQL、MongoDB熟悉工作流编排工具（如 Temporal、Airflow、LangGraph 等）了解容器化技术（Docker、Kubernetes）理解 LLM 与 Agent 的基本原理与常见范式（ReAct、Plan-and-Execute 等）加分项：有复杂 Agent 框架或分布式系统架构经验有

Premium Full-time TypeScript AI

Li Auto 4 days ago

Forward Deployed Engineer（数字员工 / Agentic Workflow）

ModelBest ( Beijing )

Forward Deployed Engineer（数字员工 / Agentic Workflow）北京社招全职技术 - 基础架构职位 ID：A52304 职位描述 1. 深入客户现场，与业务用户一起梳理原工作流，识别高频、重复、知识密集、跨系统协同的任务，并判断是否适合数字员工或 Agentic Workflow 改造。2. 基于客户场景快速开发 0-1 原型，包括 RAG、Prompt、Tool Calling、Workflow 编排、多轮对话、表单/审批/工单/知识库/CRM/客服系统对接等。3. 与解决方案架构师协同，将业务需求拆成技术任务，定义 MVP 范围、数据接入方式、模型能力边界、验收指标和风险点。4. 负责现场技术问题闭环，包括接口联调、数据清洗、权限配置、模型调用、日志排查、结果评测和体验优化。5. 将 0-1 项目中的工程实践沉淀为可复用组件，如行业工具包、Agent 模板、工作流模板、评测脚本和交付手册。6. 将客户现场遇到的产品缺口、模型短板等反馈给产品、算法、Infra 团队，推动平台能力迭代。职位要求

Premium Full-time Demos

ModelBest 1 day ago

MaaS-大客户技术服务经理

Z.ai ( Beijing )

MaaS-大客户技术服务经理北京全职互联网 / 电子 / 网游职位描述【岗位职责】1. 售后服务管理：作为智谱MaaS战略客户售后第一责任人，全面负责客户售后技术服务与关系维护，深入理解客户AI业务场景，与技术支持团队配合落地项目交付、主动运维、质量管控与风险治理；总结智谱AI产品（大模型API、AI推理服务、AI工具链等）在客户实际场景中的最佳实践，沉淀可复用的行业AI服务案例，助力客户实现AI应用价值最大化，夯实客户留存基础，推动老客户续约与转介绍。2. 问题闭环与客户满意度提升：主动对接大客户KP，建立常态化沟通机制，及时响应客户在AI产品及服务使用过程中的核心问题（如模型效果优化、推理性能、AI安全合规等），快速协调内部技术团队（AI算法、产品、研发）协作解决，形成问题闭环；深度挖掘客户在AI驱动复杂业务场景（如AI Agent部署、大模型微调落地等）下的核心诉求与潜在需求，结合客户业务痛点输出针对性技术服务建议；追踪客户关键业务稳定性问题，协助客户完成治理优化，持续提升客户产品使用体验与满意度，规避客户流失风险，超越客户服务预期；负责设计应急预案，推动故障快速修复和复盘。3. AI创新落地与增购商机挖掘：充分了解客户AI应用场景需求和AI发展规划，运用AI大模型与平台工具，挖掘客户长期技术服务需求与增购商机，助力客户价值升级与公司业绩增长。4. 跨团队协作与交付保障：联动销售、售前、运维、研发等跨部门团队，高效推进大模型落地，确保交付质量与进度符合客户预期；从客户架构与价值视角出发，开展问题处置、护航保障与风险治理，沉淀输出行业最佳实践及工具产品，主动为大客户提供专项高阶技术服务，强化客户合作粘性。5. 抽象客户需求到模型能力：深度了解、挖掘并沉淀客户场景业务需求，精准解读其AI数字化转型诉求，为模型迭代提供有效输入。职位要求【职位要求】1. 学历与专业：本科及以上学历，计算机、人工智能、数据科学、信息技术、工程等相关专业优先；具备客户成功、大客户服务相关意识，理解B端大客户服务逻辑。2. 技术能力与经验：5年以上企业开发、运维、方案架构设计经验，其中至少1-2年AI相关项目（如大模型应用、AI Agent开发、机器学习）经验；熟悉JAVA、Python、GO中至少一门开发语言，熟悉常见中间件（如Redis、Nacos、Kafka等），有2年以上软件开发经验优先，能快速处理客户技术相关问题。3. 其他技术要求：对业务场景容灾、高可用系统架构及AI算力集群架构有深入理解，能快速响应客户技术需求。具备公有云、多云管理、容器、微服务、数据库、分布式存储等多方向交付运维经验；熟悉云计算产品（计算、存储、网络、数据库等）与技术原理，并有实操经验，能为客户提供专业技术支撑。了解AI infra、AI Agent等前沿技术应用者优先，能助力客户AI创新落地。4. 项目管理和团队协作经验：善于推动跨部门复杂AI项目实施（如跨算法、研发、产品团队的大模型落地项目），具备较强的资源整合能力；能够独立承担大客户项目，为客户提供全流程技术解决方案，保障项目落地与客户价值实现。5. 客户服务与沟通能力：具备优秀的客户成功思维，能够对话客户关键决策；擅长持续深度服务大客户，敏锐把控客户AI相关需求与新商机，协助销售拓展业务、推动续约增购；具备优秀的沟通表达、呈现与逻辑思维能力，有极强的服务意识和协作意识，责任心强；具备优秀的文档编写、演讲及技术培训能力，能输出专业的客户汇报材料，传递产品与服务价值。6. 其他要求：能够适应定期客户拜访或长期驻场，具备较强的抗压能力和执行力，高效响应客户需求。三、【加分项】1. 熟悉大模型开发框架（LangChain、Spring AI等），有提示词调优、大模型微调、RAG应用构建、大模型Agent开发等经验；有基于智谱相关平台构建大模型应用经验者优先，能更好适配公司产品服务客户2. 有客户成功经理、大客户技术服务、售前售后支撑相关工作经验者优先，熟悉B端大客户全生命周期管理流程。3. 有ACP（阿里云认证工程师）、ACE（阿里云认证专家）、RHCE & RHCSA、华为云HCIP&HCIE、ITIL、PMP等相关认证和实战经验者优先，能更好为客户提供专业技术服务。4. 有2年以上泛娱乐、零售、金融、教育等行业大型互联网或集团型企业应用的解决方案、架构设计、DevOps、AIOps、高可用改造经验者优先，能快速适配行业客户需求。5. 具备优秀的客户需求挖掘、续约谈判技巧，有成功推动大客户续约、增购的案例者优先。投递...

Premium Full-time

Z.ai 2 hours ago

Python Infra Jobs In Beijing (Peking) - 16 Job Positions Available

AI Infra 模型部署实习生

AI infra工程师

大模型训练与推理Infra工程师-MiMo

VLA训练infra算法工程师 - XiaomiRobotics

端云协同 AI Infra 专家 / 工程师

AI 院-MOE 训练/推理Infra工程师

AI院-训练Infra工程师

AI院-GLM后训练团队-推理优化/推理Infra工程师（RL）

大模型研究和工程实习生-MiMo

端到端算法工程师实习生

AI Infrastructure Software Engineer — CosmosLab

MiMo算法研究员-音频&语音

大模型推理优化工程师

【基座模型】软件研发工程师

Forward Deployed Engineer（数字员工 / Agentic Workflow）

MaaS-大客户技术服务经理

Subscribe for job alerts and resources to make your job search easier!