Refine Reset All
通过
工作职位
位置
工作类型
雇主/招聘方
经验要求
发布日期
工作职位
技能
位置
工作类型
雇主/招聘方
经验要求
所有筛选

Python Infra 招聘 在 中国 - 55 Job Positions Available

主要城市:
1 – 20 的 55 招聘
MiniMax 招聘

AI Infra研发工程师-稳定性方向上海社招全职互联网 / 电子 / 网游职位描述1. 负责Minimax大规模AI推理场景下稳定性技术体系的设计与迭代2. 负责梳理Minimax主要服务相关的推理框架,模型服务,算力中台,基础设施等各层技术栈以及依赖。3. 负责稳定性相关工具链的开发,迭代以及落地,提升稳定性研发效能。4. 负责设计与推进稳定性工作流构建与建立,包括但不限于:E2E可观测性与告警,变更以及研发流程,容灾,故障处理,混沌工程,容量评估与压测等。职位要求1. 计算机及相关专业,本科及以上学历; 2. 3年以上稳定性工作经验;3. 能熟练使用一种编程语言,包括不限于Python/Shell/Golang/C++/C; 4. 有Devops与Agile思维与经验5. 有良好的团队沟通和协作能力,有良好的责任心;投递...

Premium Full-time AI
MiniMax  24天前发布
XPENG 招聘

【26届校招】AI Infra 工程师广州、上海、北京正式研发 - 算法职位描述【岗位职责】1.负责自动驾驶系统基础设施的搭建与优化,包括模型训练、serving和数据挖掘等;2.与其他团队紧密协作,将机器学习方案部署到嵌入式或者云端测试平台;为自动驾驶算法和应用提供良好运行环境。配合算法工程师配置硬件和软件环境,解决算法运行中的基础设施相关问题;3.承担自动驾驶系统的数据闭环工作相关工作,提高数据的数量和质量;4.参与自动驾驶系统的集成与测试。配合其他工程师进行模块集成,确保系统兼容性,制定测试计划对基础设施进行性能和压力测试等;5.编写和维护相关技术文档,记录基础设施设计、搭建和优化过程,为团队成员提供参考。职位要求【任职要求】1.2026 届应届毕业生,计算机科学与技术、电子工程、通信工程、自动化等相关专业;2.具有扎实的计算机基础知识,包括操作系统、计算机网络、数据库等;3.熟悉至少一种编程语言,如 C/C++、Python 等,具备一定编程能力;4.了解云计算、大数据相关技术和概念,有实践经验者优先;5.对自动驾驶技术有浓厚兴趣和热情,愿意投身该领域基础设施建设工作;6.具备良好团队合作精神和沟通能力,能与不同专业背景人员协同工作;7.有较强学习能力和问题解决能力,能快速适应新技术新环境;8.注重细节,有责任心,具备良好抗压能力,能承担一定工作压力。投递...

Premium Full-time
XPENG  24天前发布
MiniMax 招聘

系统研发实习生- AI infra北京、上海校招实习研发 - 基础架构2027届实习生招聘职位描述加入AI基础设施团队,你将在导师指导下参与核心平台系统的学习和实践:1. 参与平台建设: 协助开发与维护CMDB、工单系统、流程引擎等AI Infra关键平台。2. 开发实践: 参与功能模块开发、测试及基础性能调优,提升代码质量。3. 数据链路学习: 协助整合资源编排、调度平台与CMDB/工单等系统数据流。4. 支持资源管理: 开发辅助工具,支持AI平台对底层资源(GPU/CPU)的基础获取与监控。5. 协作体验: 与算法、调度、运维团队协作,了解需求对接流程。你将收获:1. 深度参与工业级AI Infra项目实践(CMDB、工单、资源管理等)。2. 在导师指导下,提升Go/Java/Python开发及微服务架构能力。3. 了解AI训练平台、资源调度等前沿技术,为未来职业奠基。职位要求1. 在读学生: 2027届及以后本科/硕士,计算机、软件工程等相关专业。2. 编程基础: 熟练掌握 Go/Java/Python 至少一门,具备良好编码习惯。3. 技术热情: 对微服务、中间件、数据库及平台系统(CMDB/工单等)有浓厚兴趣。4. 核心素质: 学习能力强、动手实践积极、沟通协作良好。加分项 (非必需):1. 有项目/开源经验(Web开发、系统设计、自动化工具)。2. 了解Kubernetes、AI训练平台或GPU管理基础概念。3. 对可观测性(监控/日志)有初步了解或有开源/社区参与经历。投递...

Premium Full-time AI
MiniMax  24天前发布
XPENG 招聘

大模型 Infra 研发实习生(Agentic RL 方向)深圳实习互联网 / 电子 / 网游职位描述我们正在构建面向 Agentic RL 与具身智能 的评测与训练基础设施。支撑长程、有状态、依赖外部环境(工具、代码执行器、仿真器、机器人)的智能体任务。你将作为 infra 工程师参与平台核心模块建设:1、设计并实现统一的任务/环境抽象层,支持异构环境的接入;2、构建大规模并发的rollout 与评测调度系统,提升吞吐、资源利用率与稳定性;3、搭建智能体轨迹数据管道:采集、存储、检索、回放、版本管理,以及失败案例的可视化诊断系统;4、集成实验管理、监控告警、链路追踪等能力,保障平台在大规模任务下的可观测性与可恢复性。职位要求1、Python 工程能力扎实,代码风格规范,有中型以上工程或开源项目经验;2、熟悉 Linux 开发环境与常用工具链(Git / Shell / Docker / Make 等);3、了解分布式系统、并发与异步编程基本原理;4、对大模型、Agent、RL 训练流程有基本理解;5、能从复杂工程链路中定位瓶颈,主动设计可扩展、可观测的系统;6、每周到岗至少 4 天,可连续实习 3 个月以上。【加分项】1、熟悉 Ray、Kubernetes、Slurm 等分布式调度/编排系统;2、熟悉 vLLM、SGLang 等推理服务框架,理解其性能特性;3、做过自动化评测平台、benchmark 系统、judge service、训练数据闭环等系统;4、有 OpenAI Gym/Gymnasium、ManiSkill、Isaac

XPENG  17天前发布
千寻智能(杭州)科技有限公司 招聘

AI Infra实习生 北京 实习 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年及之后毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、能至少保障3个月以上的实习时间,每周4天以上出勤;4、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...

Premium Full-time AI
千寻智能(杭州)科技有限公司  13天前发布
智元创新(上海)科技有限公司 招聘

具身智能算法实习生(后训练 Infra 方向) 上海 实习 职位描述 1. 参与具身智能后训练框架的设计与迭代,构建支撑真机强化学习的规模化训练能力。2. 理解强化学习、模仿学习等后训练算法(PPO/SAC/DAgger 等),参与基于算法特性的训练架构设计与实现。3. 参与云端多机多卡训练 + 边缘多机多本体 rollout 的分布式异步训练系统开发。4. 参与多种后训练算法的框架侧适配与验证。5. 参与云边通信模块开发(权重同步、数据回传、时延隐藏)。6. 跟进后训练领域前沿进展,参与新算法的复现与工程化验证。 职位要求 - 计算机、AI、机器人等相关专业硕士在读或优秀本科生。- 熟悉 Python,熟练使用 PyTorch,有深度学习项目经验。- 对强化学习(PPO/SAC/DAgger 等)有基础理解或强烈兴趣。- 具备良好的工程意识与代码规范,愿意深入理解底层原理。- 实习 3 个月以上优先,能长期实习更佳。加分项- 有分布式系统或通信框架(RPC / gRPC / ZMQ 等)使用经验。- 有真机强化学习或仿真器(RoboSuite /

Premium Full-time Rollout
智元创新(上海)科技有限公司  9天前发布
智元创新(上海)科技有限公司 招聘

具身智能算法实习生(预训练 Infra 方向) 上海 实习 职位描述 1. 参与具身智能统一预训练框架的设计与迭代,支撑 VLA、大模型、世界模型、大小脑等多种模型架构的高效训练。2. 理解 VLA、多模态大模型、世界模型等前沿算法,参与基于算法特性的框架优化方案设计与实现。3. 参与多模态数据加载体系的开发,支持图片、视频、点云、触觉等多种数据格式的高效接入与预处理。4. 参与分布式并行策略(数据并行、模型并行、流水线并行等)的开发与测试。5. 参与数据全生命周期闭环能力建设,包括数据版本管理、质量筛选、配比策略等工具链开发。6. 跟进预训练领域前沿进展,参与新算法的复现与工程化验证。 职位要求 - 计算机、AI 等相关专业硕士在读或优秀本科生。- 熟悉 Python,熟练使用 PyTorch,有深度学习项目经验。- 对多模态模型(VLM/VLA)、视频生成、世界模型等方向有基础理解或强烈兴趣。- 具备良好的工程意识与代码规范,愿意深入理解底层原理。- 实习 3 个月以上优先,能长期实习更佳。加分项- 有分布式训练框架使用或开发经验(DeepSpeed / Megatron / FSDP 等)。- 有论文复现或相关研究经验。- 有开源项目贡献经历。 投递...

Premium Full-time
智元创新(上海)科技有限公司  9天前发布
ZERON 零一汽车 招聘

Infra开发工程师 上海 全职 职位描述 - 负责公司级AI Infra平台建设,为智能驾驶场景提供数据闭环、算力平台、AIOps等基础能力支持。 - 负责数据闭环的构建,建立高效的数据流转设施,搭建稳定的数据闭环链路 - 负责AI平台的设计与研发,建设GPU及异构加速卡的资源池化、任务调度与虚拟化能力。 - 负责向量检索、图数据库等AI基础能力的构建与性能优化。 - 探索并落地面向智能汽车行业的前沿AI Infra技术演进方案。 职位要求 - 具有计算机、人工智能、软件工程、电子信息等相关学科本科/硕士学历。 - 具备以下一项或多项经验: 1. 具备数据闭环、数据链路的开发经验;2. 大规模分布式训练/推理系统、AI平台、资源调度系统、向量检索或图数据库的设计与研发经验;3. 熟悉Linux环境下的Python与C++语言,具备良好的工程与代码规范;4. 熟悉PyTorch/TensorFlow等深度学习框架,具备底层优化或二次开发经验; - 具有良好的工作态度、团队合作精神、主观能动性和跨团队沟通能力。符合以下条件者优先: - 熟悉LLM、图像、多模态或VLA/VLM等模型的训练与推理优化; - 具备自动驾驶、机器人或智能汽车相关领域软件系统开发经验; - 有大模型预训练、RL训练或高性能推理引擎(如vLLM、TensorRT-LLM)的实战经验; - 具备高性能网络、分布式存储或集群调度系统经验。 投递...

Premium Full-time
ZERON 零一汽车  9天前发布
Pony.ai 招聘

Infra 开发工程师(云资源与存储工具链方向)-广州 广州 全职 职位描述 岗位职责:1. 负责自动驾驶项目基础设施能力的开发和落地,重点支持云资源使用和存储工具链建设。2. 参与公有云资源的接入、管理和优化,包括存储、网络、权限、监控等组件。3. 开发存储相关工具和平台能力,支持数据上传下载、迁移、清理、权限管理、容量统计和问题排查。4. 参与对象存储、文件存储、分布式存储等系统的接入、优化和稳定性建设。5. 维护相关技术文档、使用规范和自动化流程,支持项目持续交付。 职位要求 任职要求:1. 计算机相关专业本科或以上学历。2. 熟悉至少一家公有云厂商及其存储、网络、监控组件,如阿里云、腾讯云、Azure等。3. 了解常见存储系统和使用场景,如对象存储、NAS、HDFS、Ceph、S3 等。4. 熟练掌握 C++、Java、Python 中至少一门编程语言,具备良好的编码与调试能力。5. 熟悉 Linux 环境,具备基本的问题排查和自动化脚本开发能力。6. 有责任心,沟通积极,有良好的文档习惯;有使用 AI 辅助开发的经验。加分项:1. 具备存储相关运维或开发经验,有分布式存储或大数据存储项目经验者优先。2. 有容器化(Docker、Kubernetes)和云原生实践经验。3. 有云资源治理、成本优化、监控告警或内部工具链开发经验。 投递...

Premium Full-time Linux AI
Pony.ai  6天前发布
Xiaomi 招聘

大模型训练与推理Infra工程师-MiMo 北京 社招 全职 职位 ID:A14015 职位描述 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。 - 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。2. 模型推理基础设施开发 - 构建高效的推理框架,支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。3. 性能监控与优化 - 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。4. 跨团队协作 - 与模型研究团队密切合作,理解模型需求,定制训练和推理策略。

Xiaomi  5天前发布
Xiaomi 招聘

VLA训练infra算法工程师 - XiaomiRobotics 北京 社招 全职 职位 ID:A243642 职位描述 1. 基于 PyTorch 生态(FSDP / DeepSpeed / Megatron 等)设计并实现 VLA 模型的分布式训练方案(DP / TP / PP / MoE),构建稳定高效的训练框架2. 推动混合精度(BF16 / FP8)与算子融合(FlashAttention / Triton kernel)3. 构建高吞吐数据pipeline,设计数据格式与 shard 策略,实现高效的数据加载4. 支持大规模实验追踪、管理、指标可视化 职位要求

Xiaomi  5天前发布
Z.ai 招聘

AI 院-MOE 训练/推理Infra工程师 北京 全职 互联网 / 电子 / 网游 职位描述 我们正在寻找一位经验丰富的 MOE 训练/推理 Infra 开发工程师,负责设计、实现并优化我们的 MOE(Mixture of Experts)训练和推理框架。该职位需要您具备扎实的分布式系统、高性能计算、深度学习框架以及硬件加速优化的相关知识,能够解决 MOE 训练和推理过程中的各种技术难题,并与算法团队紧密合作,确保算法的顺利实现。主要职责:1、设计并实现高效的 MOE 训练/推理框架:•设计并开发支持大规模分布式训练和推理的 MOE 框架,确保其在各种硬件配置下的高效运行;•优化训练和推理性能,通过算法优化、并行计算、缓存策略等方式,缩短训练和推理时间,提高效率;2、解决 MOE 训练/推理过程中的技术难题:•针对专家网络的选择问题,研究和实现有效的专家选择算法,确保模型在训练和推理过程中的稳定性和准确性;• 解决负载均衡问题,通过动态调整专家网络的负载分配,提高系统资源的利用率,避免过载或空闲状态;• 优化通信过程,减少分布式训练和推理中的通信开销,提高数据传输效率,缩短训练和推理时间3、与算法团队密切合作:•与算法团队保持密切沟通,了解算法需求,根据需求调整和优化训练和推理基础设施,确保算法的顺利实现;•跟踪业界最新技术动态,引入适合项目需求的新技术、新方法,提升团队整体技术水平; 职位要求 关键技能:分布式训练技术:•掌握分布式训练框架(如 Horovod、PyTorch Distributed)的使用和优化。•具备设计和实现高效分布式训练系统的能力。硬件加速优化:•熟悉 GPU、TPU 等硬件架构,能够进行硬件级性能调优。•了解 CUDA、cuDNN 等相关技术,能够利用硬件加速提升训练和推理效率。模型优化技术:•了解量化、剪枝、压缩等模型优化方法,以提升推理效率•能够在实际项目中应用这些技术,优化模型大小和推理速度•负载均衡与通信优化•能够设计高效的负载均衡策略和通信机制,以应对 MOE

Premium Full-time MOE Linux AI
Z.ai  3天前发布
Z.ai 招聘

AI院-GLM后训练团队-推理优化/推理Infra工程师(RL) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性。2. 支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用。3. 建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理。4. 与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档。 职位要求 1. 熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识。2. 熟悉GPU推理与常见深度学习框架(如 PyTorch),了解分布式通信与并行基本概念(NCCL 等)。3. 了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)。4. 理解RL训练中推理侧的作用,能够与训练流程协同推进落地。5. 具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题。加分项6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。7. 有推理性能profiling、算子/运行时优化经验。8. 有MoE模型优化经验。 投递...

Premium Full-time
Z.ai  3天前发布
Z.ai 招聘

AI院-训练Infra工程师 北京 全职 互联网 / 电子 / 网游 职位描述 1、负责大规模预训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率;2、分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性;3、跟进业界技术进展,不断同步与集成最新训练优化策略。 职位要求 1、对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 和 VLM 模型架构,有分布式训练经验;2、精通 Python 编程语言,熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架;3、有大规模预训练优化 / MoE 训练优化经验的优先考虑。 投递...

Z.ai  3天前发布
Z.ai 招聘

AI院-推理Infra工程师(量化算法研究/推理框架优化/GPU优化) 北京、上海 全职 互联网 / 电子 / 网游 职位描述 【方向一】量化算法研究员-职位描述通过前沿的模型量化、压缩与推理加速技术,显著降低大语言模型及多模态模型的存储占用与计算成本,推动 LLM 的大规模部署。-工作内容1、研发及改进 PTQ(训练后量化)、QAT(量化感知训练)、混合精度量化等核心算法,针对LLM/VLM(大语言模型/视觉语言模型)设计定制化量化方案,持续优化模型精度与推理效率的平衡;2、探索并实践低比特量化(如INT8/INT4/FP8/FP4)、权重稀疏化、知识蒸馏等协同压缩技术,提升压缩率同时控制精度损失;3、开发及优化量化工具链,完成对 GLM 系列模型的转换、量化校准及部署集成;4、 跟踪学术界与工业界前沿量化技术,通过论文复现、实验对比推动技术迭代。-职位要求1、计算机科学、电子工程、数学等相关专业硕士及以上学历,3 年以上模型量化或推理加速经验;或优秀本科生具备扎实项目履历;2、深入理解 Transformer 架构及 LLM 推理流程,精通 Python,熟悉常见的开源 LLM 推理框架(sglang/vllm/trtllm 等);3、掌握量化原理(校准策略、量化粒度、误差分析)及主流算法(如GPTQ、AWQ);4、具有 CUDA/Triton 编程经验,能自主实现高性能算子或优化内核计算加分。【方向二】推理框架优化工程师-职位描述1、高性能算子开发与优化:负责AI模型(尤其是大语言模型及多模态模型)在GPU上的核心算子(Kernel)的设计、开发与极致性能优化,支撑训练和推理场景的高效运行。2、性能分析与调优:深入分析GPU应用程序的性能瓶颈,通过优化内存访问模式、线程调度、执行效率等手段,显著提升计算密集型任务的吞吐量和降低延迟。3、技术集成与应用:研究并应用业界前沿的优化技术(如模型量化QAT/PTQ、算子融合、动态形状支持、FlashAttention等),并将其集成至推理/训练引擎。-职位要求1、编程能力:具备3年及以上GPU编程与高性能计算优化经验,深入理解GPU架构、并行计算原理、计算机体系结构,具备高性能计算内核的开发与优化经验。2、精通C/C++,具备扎实的编程基础、良好的编程风格和丰富的调试经验;熟练掌握Python;熟悉Linux开发环境。3、性能优化经验:能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具,有实际的性能优化案例和成果,能独立定位和解决复杂的性能问题。4、算法基础:熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法,了解深度学习常见算子的计算方式。【方向三】GPU优化工程师-职位描述利用对 cuda 生态软件和底层体系结构的了解,帮助团队优化训练和推理的计算效率。-工作内容1、高性能算子开发与优化:负责AI模型(尤其是大语言模型及多模态模型)在GPU上的核心算子(Kernel)的设计、开发与极致性能优化,支撑训练和推理场景的高效运行。2、性能分析与调优:深入分析GPU应用程序的性能瓶颈,通过优化内存访问模式、线程调度、执行效率、多流并行协同等手段,显著提升计算密集型任务的吞吐量和降低延迟。3、技术选型:对 GPU 领域相关的 DSL/编译器(例如 triton/cuteDSL/tilelang)等进行尝试和了解,确定团队内的 DSL/编译器的技术选型,为未来的迭代做好技术储备。-职位要求1、编程能力:具备3年及以上GPU编程与高性能计算优化经验,深入理解GPU架构、并行计算原理、计算机体系结构,具备高性能计算内核的开发与优化经验。2、精通C/C++,具备扎实的编程基础、良好的编程风格和丰富的调试经验;熟练掌握Python;熟悉Linux开发环境。3、性能优化经验:能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具,有实际的性能优化案例和成果,能独立定位和解决复杂的性能问题。4、算法基础:熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法,了解深度学习常见算子的计算方式。 职位要求 -

Z.ai  3天前发布
Z.ai 招聘

AI院-训练Infra工程师 北京、上海 全职 互联网 / 电子 / 网游 职位描述 1、负责大规模预训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率2、分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性3、跟进业界技术进展,不断同步与集成最新训练优化策略 职位要求 1、对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 和 VLM 模型架构,有分布式训练经验2、精通 Python 编程语言,熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架3、有大规模预训练优化 / MoE 训练优化经验的优先考虑加分项:1、在ACM、NOI、IOI、超算比赛中有获奖经历者优先2、具有 cuda 算子优化/profiling 能力者优先 投递...

Z.ai  3天前发布
NIO 招聘

AI Infra系统研发工程师/专家 上海 社招 全职 数字技术 本科及以上 3-5 年 职位描述 1. 参与构建NIO公司级AI Infra,为智企、智舱、智能辅助驾驶等多个AI场景提供算力平台、引擎优化、AIOps等基础能力支持。2. 负责模型训练和推理端到端性能优化,包含分布式训练策略、分布式RL Tuning和AgenticRL、分布式推理策略、算子优化、显存优化、通信优化、训练和推理框架整体优化等。3. 负责AI平台设计和研发。4. 负责GPU和各类异构加速卡资源池化和任务调度、虚拟化等基础能力建设。5. 负责向量检索、图数据库等AI基础能力建设和性能优化。6. 探索智能汽车行业AI Infra的技术演进机会。 职位要求 1. 全日制本科学历,计算机相关专业,3年以上相关工作经验。2. 具有大规模分布式训练系统 / 推理系统 / AI平台 / 资源调度系统 / 向量检索系统 / 图数据库的设计、研发、优化经验。3. 精通 Python/Go/C++ 中至少一门编程语言,有良好的代码风格。4. 有CUDA、Triton、主流国产卡生态等算子开发经验者优先。5. 有汽车工业、智能辅助驾驶等相关领域软件系统开发经验者优先。6. 熟悉LLM/图像/多模态等模型算法者优先。

Premium Full-time AI
NIO  2天前发布
NIO 招聘

端到端模型infra专家/工程师 蔚来自动驾驶研发团队 上海、北京 社招 全职 数字技术 本科及以上 3-5 年 职位描述 职位描述:打造面向端到端模型量产的算法研发框架,包括但不限于:1.建设与维护基础的模型训练、推理框架,推进前沿高效的大模型infra工作落地2.制定规范、高效的数据、研发、发版流程,提升发版效率3.提升端到端模型的训练效率与业务使用效率,突破数据、算法、通信等层面的性能瓶颈4.与平台、端侧研发工程师合作,共同提升驾驶研发全链路的自动化水平 职位要求 职位要求:1.本科及以上学历,计算机 / 软件工程 / 人工智能等相关专业。2.3 年以上相关工作经验,优秀者可降低年限要求。3.良好的 Python / C++ 编程基础和工程规范。4.熟悉 PyTorch / TensorFlow 等深度学习框架的使用。5.对驾驶行业有浓厚兴趣。 投递...

NIO  2天前发布
无问芯穹 Infinigence AI 招聘

Al infra推理优化研究员 上海 社招 全职 互联网 / 电子 / 网游 职位 ID:A144366 职位描述 1. 下一代超节点系统探索:研究面向万亿参数大模型推理的超节点架构设计,开展多芯片互联、异构算力协同、分布式推理调度、内存层级与 10 优化等关键技术攻关,构建高吞吐、低时延、高密部署的下一代推理超节点仿真原型与评测体系。2. 智能体驱动的算子生成研究:基于大模型与智能体技术,开展自动算子生成、算子融合、硬件感知代码生成与编译优化研究,构建自适应算子搜索与生产工具链,覆盖 GPU/NPU/ 国产AI 芯片,持续突破推理算子性能极限。3. Alinfra 全栈优化技术研究:从模型、编译、运行时、系统与硬件协同层面开展推理全栈优化,包括模型压缩/量化、计算图优化、分布式推理、推理引擎与调度器设计、端云协同推理等,形成可工程化的技术方案与标准。4. 研究与成果建设:跟踪国际顶会与产业前沿,独立设计研究路线、开展实验验证、发表高水平论文;参与技术标准制定、开源项目建设与产学研合作,推动研究成果转化为平台能力与业务竞争力。 职位要求 1. 基本条件:计算机、电子工程、自动化、人工智能等相关专业,硕士及以上学历;3-5 年及以上 Alinfra、推理优化、高性能计算或系统研发相关工作经验,优秀博士可放宽。2. 核心能力:具备独立研究与课题主导能力,能自主定义问题、设计方案、完成实验与成果交付;有顶会论文(MLSyS/OSDI/NeUrIPS/ICML/ASPLOS 等)、知名开源项目贡献者优先。3. 专业技能:a. 深入理解计算机体系结构、操作系统、分布式系统、编译原理与并行计算;b. 精通 C++/Python,熟悉 CUDA/Triton/MLIR/TVM/Torchinductor 等至少一种编译/算子栈;c. 熟悉

Premium Full-time AI
无问芯穹 Infinigence AI  14小时前发布
Qualcomm 招聘

Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: We are seeking a strong software engineer to do NPU Infrastructure development. This role focuses on AI Infrastructure related feature and capability developement. The

Qualcomm  16小时前发布

Subscribe for job alerts and resources to make your job search easier!

确认邮件已发送至

请检查邮件并点击链接,开始接收招聘提醒。

接收这类最新招聘:

python infra

You also might be interested in:

实习生

AI

Shell

PyTorch

Docker

确认邮件已发送至

请检查邮件并点击链接,开始接收招聘提醒。

所有筛选 Apply
通过
工作职位
位置
工作类型
雇主/招聘方
经验要求