AI Infra研发工程师-稳定性方向上海社招全职互联网 / 电子 / 网游职位描述1. 负责Minimax大规模AI推理场景下稳定性技术体系的设计与迭代2. 负责梳理Minimax主要服务相关的推理框架,模型服务,算力中台,基础设施等各层技术栈以及依赖。3. 负责稳定性相关工具链的开发,迭代以及落地,提升稳定性研发效能。4. 负责设计与推进稳定性工作流构建与建立,包括但不限于:E2E可观测性与告警,变更以及研发流程,容灾,故障处理,混沌工程,容量评估与压测等。职位要求1. 计算机及相关专业,本科及以上学历; 2. 3年以上稳定性工作经验;3. 能熟练使用一种编程语言,包括不限于Python/Shell/Golang/C++/C; 4. 有Devops与Agile思维与经验5. 有良好的团队沟通和协作能力,有良好的责任心;投递...
【26届校招】AI Infra 工程师广州、上海、北京正式研发 - 算法职位描述【岗位职责】1.负责自动驾驶系统基础设施的搭建与优化,包括模型训练、serving和数据挖掘等;2.与其他团队紧密协作,将机器学习方案部署到嵌入式或者云端测试平台;为自动驾驶算法和应用提供良好运行环境。配合算法工程师配置硬件和软件环境,解决算法运行中的基础设施相关问题;3.承担自动驾驶系统的数据闭环工作相关工作,提高数据的数量和质量;4.参与自动驾驶系统的集成与测试。配合其他工程师进行模块集成,确保系统兼容性,制定测试计划对基础设施进行性能和压力测试等;5.编写和维护相关技术文档,记录基础设施设计、搭建和优化过程,为团队成员提供参考。职位要求【任职要求】1.2026 届应届毕业生,计算机科学与技术、电子工程、通信工程、自动化等相关专业;2.具有扎实的计算机基础知识,包括操作系统、计算机网络、数据库等;3.熟悉至少一种编程语言,如 C/C++、Python 等,具备一定编程能力;4.了解云计算、大数据相关技术和概念,有实践经验者优先;5.对自动驾驶技术有浓厚兴趣和热情,愿意投身该领域基础设施建设工作;6.具备良好团队合作精神和沟通能力,能与不同专业背景人员协同工作;7.有较强学习能力和问题解决能力,能快速适应新技术新环境;8.注重细节,有责任心,具备良好抗压能力,能承担一定工作压力。投递...
系统研发实习生- AI infra北京、上海校招实习研发 - 基础架构2027届实习生招聘职位描述加入AI基础设施团队,你将在导师指导下参与核心平台系统的学习和实践:1. 参与平台建设: 协助开发与维护CMDB、工单系统、流程引擎等AI Infra关键平台。2. 开发实践: 参与功能模块开发、测试及基础性能调优,提升代码质量。3. 数据链路学习: 协助整合资源编排、调度平台与CMDB/工单等系统数据流。4. 支持资源管理: 开发辅助工具,支持AI平台对底层资源(GPU/CPU)的基础获取与监控。5. 协作体验: 与算法、调度、运维团队协作,了解需求对接流程。你将收获:1. 深度参与工业级AI Infra项目实践(CMDB、工单、资源管理等)。2. 在导师指导下,提升Go/Java/Python开发及微服务架构能力。3. 了解AI训练平台、资源调度等前沿技术,为未来职业奠基。职位要求1. 在读学生: 2027届及以后本科/硕士,计算机、软件工程等相关专业。2. 编程基础: 熟练掌握 Go/Java/Python 至少一门,具备良好编码习惯。3. 技术热情: 对微服务、中间件、数据库及平台系统(CMDB/工单等)有浓厚兴趣。4. 核心素质: 学习能力强、动手实践积极、沟通协作良好。加分项 (非必需):1. 有项目/开源经验(Web开发、系统设计、自动化工具)。2. 了解Kubernetes、AI训练平台或GPU管理基础概念。3. 对可观测性(监控/日志)有初步了解或有开源/社区参与经历。投递...
大模型 Infra 研发实习生(Agentic RL 方向)深圳实习互联网 / 电子 / 网游职位描述我们正在构建面向 Agentic RL 与具身智能 的评测与训练基础设施。支撑长程、有状态、依赖外部环境(工具、代码执行器、仿真器、机器人)的智能体任务。你将作为 infra 工程师参与平台核心模块建设:1、设计并实现统一的任务/环境抽象层,支持异构环境的接入;2、构建大规模并发的rollout 与评测调度系统,提升吞吐、资源利用率与稳定性;3、搭建智能体轨迹数据管道:采集、存储、检索、回放、版本管理,以及失败案例的可视化诊断系统;4、集成实验管理、监控告警、链路追踪等能力,保障平台在大规模任务下的可观测性与可恢复性。职位要求1、Python 工程能力扎实,代码风格规范,有中型以上工程或开源项目经验;2、熟悉 Linux 开发环境与常用工具链(Git / Shell / Docker / Make 等);3、了解分布式系统、并发与异步编程基本原理;4、对大模型、Agent、RL 训练流程有基本理解;5、能从复杂工程链路中定位瓶颈,主动设计可扩展、可观测的系统;6、每周到岗至少 4 天,可连续实习 3 个月以上。【加分项】1、熟悉 Ray、Kubernetes、Slurm 等分布式调度/编排系统;2、熟悉 vLLM、SGLang 等推理服务框架,理解其性能特性;3、做过自动化评测平台、benchmark 系统、judge service、训练数据闭环等系统;4、有 OpenAI Gym/Gymnasium、ManiSkill、Isaac
AI Infra实习生 北京 实习 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年及之后毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、能至少保障3个月以上的实习时间,每周4天以上出勤;4、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...
具身智能算法实习生(后训练 Infra 方向) 上海 实习 职位描述 1. 参与具身智能后训练框架的设计与迭代,构建支撑真机强化学习的规模化训练能力。2. 理解强化学习、模仿学习等后训练算法(PPO/SAC/DAgger 等),参与基于算法特性的训练架构设计与实现。3. 参与云端多机多卡训练 + 边缘多机多本体 rollout 的分布式异步训练系统开发。4. 参与多种后训练算法的框架侧适配与验证。5. 参与云边通信模块开发(权重同步、数据回传、时延隐藏)。6. 跟进后训练领域前沿进展,参与新算法的复现与工程化验证。 职位要求 - 计算机、AI、机器人等相关专业硕士在读或优秀本科生。- 熟悉 Python,熟练使用 PyTorch,有深度学习项目经验。- 对强化学习(PPO/SAC/DAgger 等)有基础理解或强烈兴趣。- 具备良好的工程意识与代码规范,愿意深入理解底层原理。- 实习 3 个月以上优先,能长期实习更佳。加分项- 有分布式系统或通信框架(RPC / gRPC / ZMQ 等)使用经验。- 有真机强化学习或仿真器(RoboSuite /
具身智能算法实习生(预训练 Infra 方向) 上海 实习 职位描述 1. 参与具身智能统一预训练框架的设计与迭代,支撑 VLA、大模型、世界模型、大小脑等多种模型架构的高效训练。2. 理解 VLA、多模态大模型、世界模型等前沿算法,参与基于算法特性的框架优化方案设计与实现。3. 参与多模态数据加载体系的开发,支持图片、视频、点云、触觉等多种数据格式的高效接入与预处理。4. 参与分布式并行策略(数据并行、模型并行、流水线并行等)的开发与测试。5. 参与数据全生命周期闭环能力建设,包括数据版本管理、质量筛选、配比策略等工具链开发。6. 跟进预训练领域前沿进展,参与新算法的复现与工程化验证。 职位要求 - 计算机、AI 等相关专业硕士在读或优秀本科生。- 熟悉 Python,熟练使用 PyTorch,有深度学习项目经验。- 对多模态模型(VLM/VLA)、视频生成、世界模型等方向有基础理解或强烈兴趣。- 具备良好的工程意识与代码规范,愿意深入理解底层原理。- 实习 3 个月以上优先,能长期实习更佳。加分项- 有分布式训练框架使用或开发经验(DeepSpeed / Megatron / FSDP 等)。- 有论文复现或相关研究经验。- 有开源项目贡献经历。 投递...
Infra开发工程师 上海 全职 职位描述 - 负责公司级AI Infra平台建设,为智能驾驶场景提供数据闭环、算力平台、AIOps等基础能力支持。 - 负责数据闭环的构建,建立高效的数据流转设施,搭建稳定的数据闭环链路 - 负责AI平台的设计与研发,建设GPU及异构加速卡的资源池化、任务调度与虚拟化能力。 - 负责向量检索、图数据库等AI基础能力的构建与性能优化。 - 探索并落地面向智能汽车行业的前沿AI Infra技术演进方案。 职位要求 - 具有计算机、人工智能、软件工程、电子信息等相关学科本科/硕士学历。 - 具备以下一项或多项经验: 1. 具备数据闭环、数据链路的开发经验;2. 大规模分布式训练/推理系统、AI平台、资源调度系统、向量检索或图数据库的设计与研发经验;3. 熟悉Linux环境下的Python与C++语言,具备良好的工程与代码规范;4. 熟悉PyTorch/TensorFlow等深度学习框架,具备底层优化或二次开发经验; - 具有良好的工作态度、团队合作精神、主观能动性和跨团队沟通能力。符合以下条件者优先: - 熟悉LLM、图像、多模态或VLA/VLM等模型的训练与推理优化; - 具备自动驾驶、机器人或智能汽车相关领域软件系统开发经验; - 有大模型预训练、RL训练或高性能推理引擎(如vLLM、TensorRT-LLM)的实战经验; - 具备高性能网络、分布式存储或集群调度系统经验。 投递...
Infra 开发工程师(云资源与存储工具链方向)-广州 广州 全职 职位描述 岗位职责:1. 负责自动驾驶项目基础设施能力的开发和落地,重点支持云资源使用和存储工具链建设。2. 参与公有云资源的接入、管理和优化,包括存储、网络、权限、监控等组件。3. 开发存储相关工具和平台能力,支持数据上传下载、迁移、清理、权限管理、容量统计和问题排查。4. 参与对象存储、文件存储、分布式存储等系统的接入、优化和稳定性建设。5. 维护相关技术文档、使用规范和自动化流程,支持项目持续交付。 职位要求 任职要求:1. 计算机相关专业本科或以上学历。2. 熟悉至少一家公有云厂商及其存储、网络、监控组件,如阿里云、腾讯云、Azure等。3. 了解常见存储系统和使用场景,如对象存储、NAS、HDFS、Ceph、S3 等。4. 熟练掌握 C++、Java、Python 中至少一门编程语言,具备良好的编码与调试能力。5. 熟悉 Linux 环境,具备基本的问题排查和自动化脚本开发能力。6. 有责任心,沟通积极,有良好的文档习惯;有使用 AI 辅助开发的经验。加分项:1. 具备存储相关运维或开发经验,有分布式存储或大数据存储项目经验者优先。2. 有容器化(Docker、Kubernetes)和云原生实践经验。3. 有云资源治理、成本优化、监控告警或内部工具链开发经验。 投递...
大模型训练与推理Infra工程师-MiMo 北京 社招 全职 职位 ID:A14015 职位描述 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。 - 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。2. 模型推理基础设施开发 - 构建高效的推理框架,支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。3. 性能监控与优化 - 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。4. 跨团队协作 - 与模型研究团队密切合作,理解模型需求,定制训练和推理策略。
VLA训练infra算法工程师 - XiaomiRobotics 北京 社招 全职 职位 ID:A243642 职位描述 1. 基于 PyTorch 生态(FSDP / DeepSpeed / Megatron 等)设计并实现 VLA 模型的分布式训练方案(DP / TP / PP / MoE),构建稳定高效的训练框架2. 推动混合精度(BF16 / FP8)与算子融合(FlashAttention / Triton kernel)3. 构建高吞吐数据pipeline,设计数据格式与 shard 策略,实现高效的数据加载4. 支持大规模实验追踪、管理、指标可视化 职位要求
AI 院-MOE 训练/推理Infra工程师 北京 全职 互联网 / 电子 / 网游 职位描述 我们正在寻找一位经验丰富的 MOE 训练/推理 Infra 开发工程师,负责设计、实现并优化我们的 MOE(Mixture of Experts)训练和推理框架。该职位需要您具备扎实的分布式系统、高性能计算、深度学习框架以及硬件加速优化的相关知识,能够解决 MOE 训练和推理过程中的各种技术难题,并与算法团队紧密合作,确保算法的顺利实现。主要职责:1、设计并实现高效的 MOE 训练/推理框架:•设计并开发支持大规模分布式训练和推理的 MOE 框架,确保其在各种硬件配置下的高效运行;•优化训练和推理性能,通过算法优化、并行计算、缓存策略等方式,缩短训练和推理时间,提高效率;2、解决 MOE 训练/推理过程中的技术难题:•针对专家网络的选择问题,研究和实现有效的专家选择算法,确保模型在训练和推理过程中的稳定性和准确性;• 解决负载均衡问题,通过动态调整专家网络的负载分配,提高系统资源的利用率,避免过载或空闲状态;• 优化通信过程,减少分布式训练和推理中的通信开销,提高数据传输效率,缩短训练和推理时间3、与算法团队密切合作:•与算法团队保持密切沟通,了解算法需求,根据需求调整和优化训练和推理基础设施,确保算法的顺利实现;•跟踪业界最新技术动态,引入适合项目需求的新技术、新方法,提升团队整体技术水平; 职位要求 关键技能:分布式训练技术:•掌握分布式训练框架(如 Horovod、PyTorch Distributed)的使用和优化。•具备设计和实现高效分布式训练系统的能力。硬件加速优化:•熟悉 GPU、TPU 等硬件架构,能够进行硬件级性能调优。•了解 CUDA、cuDNN 等相关技术,能够利用硬件加速提升训练和推理效率。模型优化技术:•了解量化、剪枝、压缩等模型优化方法,以提升推理效率•能够在实际项目中应用这些技术,优化模型大小和推理速度•负载均衡与通信优化•能够设计高效的负载均衡策略和通信机制,以应对 MOE
AI院-GLM后训练团队-推理优化/推理Infra工程师(RL) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性。2. 支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用。3. 建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理。4. 与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档。 职位要求 1. 熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识。2. 熟悉GPU推理与常见深度学习框架(如 PyTorch),了解分布式通信与并行基本概念(NCCL 等)。3. 了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)。4. 理解RL训练中推理侧的作用,能够与训练流程协同推进落地。5. 具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题。加分项6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。7. 有推理性能profiling、算子/运行时优化经验。8. 有MoE模型优化经验。 投递...
AI院-训练Infra工程师 北京 全职 互联网 / 电子 / 网游 职位描述 1、负责大规模预训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率;2、分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性;3、跟进业界技术进展,不断同步与集成最新训练优化策略。 职位要求 1、对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 和 VLM 模型架构,有分布式训练经验;2、精通 Python 编程语言,熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架;3、有大规模预训练优化 / MoE 训练优化经验的优先考虑。 投递...
AI院-推理Infra工程师(量化算法研究/推理框架优化/GPU优化) 北京、上海 全职 互联网 / 电子 / 网游 职位描述 【方向一】量化算法研究员-职位描述通过前沿的模型量化、压缩与推理加速技术,显著降低大语言模型及多模态模型的存储占用与计算成本,推动 LLM 的大规模部署。-工作内容1、研发及改进 PTQ(训练后量化)、QAT(量化感知训练)、混合精度量化等核心算法,针对LLM/VLM(大语言模型/视觉语言模型)设计定制化量化方案,持续优化模型精度与推理效率的平衡;2、探索并实践低比特量化(如INT8/INT4/FP8/FP4)、权重稀疏化、知识蒸馏等协同压缩技术,提升压缩率同时控制精度损失;3、开发及优化量化工具链,完成对 GLM 系列模型的转换、量化校准及部署集成;4、 跟踪学术界与工业界前沿量化技术,通过论文复现、实验对比推动技术迭代。-职位要求1、计算机科学、电子工程、数学等相关专业硕士及以上学历,3 年以上模型量化或推理加速经验;或优秀本科生具备扎实项目履历;2、深入理解 Transformer 架构及 LLM 推理流程,精通 Python,熟悉常见的开源 LLM 推理框架(sglang/vllm/trtllm 等);3、掌握量化原理(校准策略、量化粒度、误差分析)及主流算法(如GPTQ、AWQ);4、具有 CUDA/Triton 编程经验,能自主实现高性能算子或优化内核计算加分。【方向二】推理框架优化工程师-职位描述1、高性能算子开发与优化:负责AI模型(尤其是大语言模型及多模态模型)在GPU上的核心算子(Kernel)的设计、开发与极致性能优化,支撑训练和推理场景的高效运行。2、性能分析与调优:深入分析GPU应用程序的性能瓶颈,通过优化内存访问模式、线程调度、执行效率等手段,显著提升计算密集型任务的吞吐量和降低延迟。3、技术集成与应用:研究并应用业界前沿的优化技术(如模型量化QAT/PTQ、算子融合、动态形状支持、FlashAttention等),并将其集成至推理/训练引擎。-职位要求1、编程能力:具备3年及以上GPU编程与高性能计算优化经验,深入理解GPU架构、并行计算原理、计算机体系结构,具备高性能计算内核的开发与优化经验。2、精通C/C++,具备扎实的编程基础、良好的编程风格和丰富的调试经验;熟练掌握Python;熟悉Linux开发环境。3、性能优化经验:能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具,有实际的性能优化案例和成果,能独立定位和解决复杂的性能问题。4、算法基础:熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法,了解深度学习常见算子的计算方式。【方向三】GPU优化工程师-职位描述利用对 cuda 生态软件和底层体系结构的了解,帮助团队优化训练和推理的计算效率。-工作内容1、高性能算子开发与优化:负责AI模型(尤其是大语言模型及多模态模型)在GPU上的核心算子(Kernel)的设计、开发与极致性能优化,支撑训练和推理场景的高效运行。2、性能分析与调优:深入分析GPU应用程序的性能瓶颈,通过优化内存访问模式、线程调度、执行效率、多流并行协同等手段,显著提升计算密集型任务的吞吐量和降低延迟。3、技术选型:对 GPU 领域相关的 DSL/编译器(例如 triton/cuteDSL/tilelang)等进行尝试和了解,确定团队内的 DSL/编译器的技术选型,为未来的迭代做好技术储备。-职位要求1、编程能力:具备3年及以上GPU编程与高性能计算优化经验,深入理解GPU架构、并行计算原理、计算机体系结构,具备高性能计算内核的开发与优化经验。2、精通C/C++,具备扎实的编程基础、良好的编程风格和丰富的调试经验;熟练掌握Python;熟悉Linux开发环境。3、性能优化经验:能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具,有实际的性能优化案例和成果,能独立定位和解决复杂的性能问题。4、算法基础:熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法,了解深度学习常见算子的计算方式。 职位要求 -
AI院-训练Infra工程师 北京、上海 全职 互联网 / 电子 / 网游 职位描述 1、负责大规模预训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率2、分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性3、跟进业界技术进展,不断同步与集成最新训练优化策略 职位要求 1、对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 和 VLM 模型架构,有分布式训练经验2、精通 Python 编程语言,熟悉 PyTorch 深度学习框架和 Megatron 分布式训练框架3、有大规模预训练优化 / MoE 训练优化经验的优先考虑加分项:1、在ACM、NOI、IOI、超算比赛中有获奖经历者优先2、具有 cuda 算子优化/profiling 能力者优先 投递...
AI Infra系统研发工程师/专家 上海 社招 全职 数字技术 本科及以上 3-5 年 职位描述 1. 参与构建NIO公司级AI Infra,为智企、智舱、智能辅助驾驶等多个AI场景提供算力平台、引擎优化、AIOps等基础能力支持。2. 负责模型训练和推理端到端性能优化,包含分布式训练策略、分布式RL Tuning和AgenticRL、分布式推理策略、算子优化、显存优化、通信优化、训练和推理框架整体优化等。3. 负责AI平台设计和研发。4. 负责GPU和各类异构加速卡资源池化和任务调度、虚拟化等基础能力建设。5. 负责向量检索、图数据库等AI基础能力建设和性能优化。6. 探索智能汽车行业AI Infra的技术演进机会。 职位要求 1. 全日制本科学历,计算机相关专业,3年以上相关工作经验。2. 具有大规模分布式训练系统 / 推理系统 / AI平台 / 资源调度系统 / 向量检索系统 / 图数据库的设计、研发、优化经验。3. 精通 Python/Go/C++ 中至少一门编程语言,有良好的代码风格。4. 有CUDA、Triton、主流国产卡生态等算子开发经验者优先。5. 有汽车工业、智能辅助驾驶等相关领域软件系统开发经验者优先。6. 熟悉LLM/图像/多模态等模型算法者优先。
端到端模型infra专家/工程师 蔚来自动驾驶研发团队 上海、北京 社招 全职 数字技术 本科及以上 3-5 年 职位描述 职位描述:打造面向端到端模型量产的算法研发框架,包括但不限于:1.建设与维护基础的模型训练、推理框架,推进前沿高效的大模型infra工作落地2.制定规范、高效的数据、研发、发版流程,提升发版效率3.提升端到端模型的训练效率与业务使用效率,突破数据、算法、通信等层面的性能瓶颈4.与平台、端侧研发工程师合作,共同提升驾驶研发全链路的自动化水平 职位要求 职位要求:1.本科及以上学历,计算机 / 软件工程 / 人工智能等相关专业。2.3 年以上相关工作经验,优秀者可降低年限要求。3.良好的 Python / C++ 编程基础和工程规范。4.熟悉 PyTorch / TensorFlow 等深度学习框架的使用。5.对驾驶行业有浓厚兴趣。 投递...
Al infra推理优化研究员 上海 社招 全职 互联网 / 电子 / 网游 职位 ID:A144366 职位描述 1. 下一代超节点系统探索:研究面向万亿参数大模型推理的超节点架构设计,开展多芯片互联、异构算力协同、分布式推理调度、内存层级与 10 优化等关键技术攻关,构建高吞吐、低时延、高密部署的下一代推理超节点仿真原型与评测体系。2. 智能体驱动的算子生成研究:基于大模型与智能体技术,开展自动算子生成、算子融合、硬件感知代码生成与编译优化研究,构建自适应算子搜索与生产工具链,覆盖 GPU/NPU/ 国产AI 芯片,持续突破推理算子性能极限。3. Alinfra 全栈优化技术研究:从模型、编译、运行时、系统与硬件协同层面开展推理全栈优化,包括模型压缩/量化、计算图优化、分布式推理、推理引擎与调度器设计、端云协同推理等,形成可工程化的技术方案与标准。4. 研究与成果建设:跟踪国际顶会与产业前沿,独立设计研究路线、开展实验验证、发表高水平论文;参与技术标准制定、开源项目建设与产学研合作,推动研究成果转化为平台能力与业务竞争力。 职位要求 1. 基本条件:计算机、电子工程、自动化、人工智能等相关专业,硕士及以上学历;3-5 年及以上 Alinfra、推理优化、高性能计算或系统研发相关工作经验,优秀博士可放宽。2. 核心能力:具备独立研究与课题主导能力,能自主定义问题、设计方案、完成实验与成果交付;有顶会论文(MLSyS/OSDI/NeUrIPS/ICML/ASPLOS 等)、知名开源项目贡献者优先。3. 专业技能:a. 深入理解计算机体系结构、操作系统、分布式系统、编译原理与并行计算;b. 精通 C++/Python,熟悉 CUDA/Triton/MLIR/TVM/Torchinductor 等至少一种编译/算子栈;c. 熟悉
Company: Qualcomm China Job Area:Engineering Group, Engineering Group Software Engineering General Summary: We are seeking a strong software engineer to do NPU Infrastructure development. This role focuses on AI Infrastructure related feature and capability developement. The