Refine Reset All
Sort by
Skills
Employer/Recruiter
Experience
Date Posted
Skills
Location
Job Type
Employer/Recruiter
Experience
All Filters

Kernel Jobs In 北京 - 20 Job Positions Available

1 – 19 of 20 jobs
Canonical Ltd. jobs

Ubuntu is the most widely used Linux distribution in the world, delivering kernels across a vast matrix of versions, architectures, and configurations – with up to 15 years of security and maintenance commitments for Long Term Support

Canonical Ltd.  13 days ago
千寻智能(杭州)科技有限公司 jobs

机器学习系统工程师(应届) 北京 正式 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...

Premium Full-time
千寻智能(杭州)科技有限公司  21 days ago
千寻智能(杭州)科技有限公司 jobs

AI Infra实习生 北京 实习 研发 - 基础架构 职位描述 1、负责构建支撑具身智能体的核心机器学习系统,开发面向机器人场景的VLA大模型训练与推理系统,支撑多模态感知、运动控制、任务规划等核心能力的持续进化;2、研发新一代具身智能系统工具链,涵盖数据采集、仿真训练、物理部署、持续优化全生命周期。 职位要求 1、计算机、人工智能、软件工程等相关专业,硕士及以上学历,2026年及之后毕业; 2、熟练使用C++/Python/Pytorch/CUDA开发生态,具有嵌入式系统开发经验者优先;3、能至少保障3个月以上的实习时间,每周4天以上出勤;4、加分项:在以下一个或多个领域有深度实践: a. 大模型训练推理:多模态大模型分布式训练、端上推理加速、Transformer模型优化; b. 高性能计算:GPU Kernel编写,高性能通信(NCCL、RDMA),AI编译器(TVM、Triton),模型量化等; c. 机器人系统:ROS2、运动控制算法、传感器数据处理pipeline。 投递...

Premium Full-time AI
千寻智能(杭州)科技有限公司  21 days ago
Nvidia jobs

NVIDIA is seeking for an experienced Software Engineer with a strong background in networking and virtualization technologies. This full-time position requires close collaboration with other NVIDIA SW and SW architecture teams, pre-sale teams and different industry

Nvidia  16 days ago
Xiaomi jobs

Linux内核调度专家 北京 社招 全职 职位 ID:A123340 职位描述 1. 基于Linux Kernel进行调度优化,结合Android应用生态设计和优化内核调度器。2. 熟悉SoC资源管控机制,构建CPU/GPU/DDR/Cache等资源的统一频率管控和性能瓶颈拆解3. 熟悉微架构,能够拆解指令的微架构性能瓶颈并进行优化,基于微架构指标进行调度器的优化和改造4. 跟踪和调研行业最新的调度优化方向,快速进行方案验证和产品导入5. 逆向分析领先的友商技术,对于下一代调度器的方向有一定的认知6. 跟踪和解决内核调度器相关的问题,包括死锁、优先级反转以及稳定性问题;7. 对于调度器进行评估,能够建立调度器的评价体系 职位要求 1. 本科及以上学历,计算机相关专业2. 熟悉Linux操作系统和内核开发,具有扎实的C/C++编程能力3. 熟悉操作系统调度算法和和原理,,了解EEVDF/CFS/EAS等调度算法,关注Linux的新型特性4. 具有良好的架构设计能力,有过一定的移动端方案设计经验,能够快速洞察行业内新技术并进行快速落地5. 具有良好的团队合作精神和沟通能力,能够与其他团队合作完成项目 投递...

Premium Full-time
Xiaomi  13 days ago
Xiaomi jobs

MiMo-大模型推理框架开发工程师 北京 社招 全职 职位 ID:A252073 职位描述 - 负责基于 vLLM、SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能,以满足不同规模大模型的实时推理需求- 复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能。- 负责Cuda Kernel优化,开发高性能的GPU算子, 提升大模型推理性能 职位要求 - 硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验,在深度学习领域有深入研究与实践。- 精通 Python,熟练掌握至少一种深度学习框架(如 PyTorch),理解深度学习原理算法,有丰富模型开发与调优经验,能独立搭建复杂模型并优化性能。- 熟悉 C++ 和 CUDA 编程,具备代码优化能力,能针对 GPU 等硬件高效编写和优化代码,了解硬件体系结构并进行针对性优化。- 熟悉大模型推理框架的基本原理和流程,了解 vLLM、SGLang 等大模型推理框架的核心技术和实现优先- 有良好团队协作与沟通能力,能与不同背景成员有效沟通协作,责任心强、敬业热情,能承受工作压力,保证项目按时高质量交付。 投递...

Premium Full-time CUDA C++
Xiaomi  13 days ago
Xiaomi jobs

Google合作技术规划专家 北京 社招 全职 职位 ID:A45091 职位描述 1. 生态技术洞察与前沿布局:深度跟踪Google技术路线(含Android OS迭代、Google ML Kit、Jetpack等核心技术)及全球移动OS生态前沿趋势,输出针对性洞察报告;牵头与Google团队联合开展技术预研评估,搭建面向合作场景的技术雷达,为双方合作技术选型、生态适配决策提供核心依据。2. 联合技术战略落地:主导澎湃OS与Google/Android生态协同的中长期技术战略及路线图制定,对齐双方业务目标(含生态兼容、功能共创、性能优化等);统筹内外部资源,优化跨企业协作架构,牵头突破合作中的核心技术瓶颈(如系统兼容性、生态互联互通、安全能力协同等)。3. 跨企业技术管理体系:搭建并完善面向Google/Android合作的技术对接、项目管控、成果验收及人才联合培养体系;联动内外部团队优化研发效能流程,保障联合项目交付质量与效率,提升跨企业技术协作效能。4. 合作创新与远期规划:制定3-5年澎湃OS与Google/Android生态深度合作的远期技术规划,牵引TMG及Google相关团队承接下一层级技术创新(如AI原生应用协同、下一代移动计算技术联合研发等),持续强化澎湃OS在Android生态中的技术竞争力与差异化优势。5. 合作生态统筹:牵头搭建基于Google/Android合作框架的产学研合作体系,对接国内外政务及产业链技术需求并联合推进项目落地;统筹内外部资源,保障与Google/Android官方及生态伙伴的合作成效,拓展合作边界。 职位要求 1. 教育背景:计算机科学与技术、人工智能、电子信息工程、软件工程等相关专业硕士及以上学历,博士优先。2. 工作经验:10年以上技术相关工作经验,其中5年以上技术规划、架构设计或技术管理经验;具备大型科技企业(尤其具备Google/Android生态合作经验者优先)或高端研发机构技术战略制定、远期规划落地的实战经验;有跨企业(特别是与国际科技巨头)联合技术项目统筹经验者优先。3. 核心能力: - 具备极强的生态技术洞察能力,能精准把握Google/Android技术路线及全球移动OS生态发展趋势,有成功的前沿技术预研或跨企业联合创新项目落地案例。 - 精通技术战略制定方法论,深刻理解跨企业合作逻辑,具备从双方业务协同需求反向推导技术规划的系统思维,能有效推动跨组织技术战略落地。 - 具备完善的跨企业技术管理体系搭建经验,擅长跨文化、跨组织团队管理、资源统筹与流程优化,能高效协调内外部资源提升整体协作效能。 - 具备丰富的产学研合作或政务技术合作项目统筹经验,熟悉Google/Android生态合作对接流程,有成功的跨企业联合合作项目落地案例。4. 技能要求:精通Android OS核心子系统技术栈(如Framework、Kernel、HAL等),同时熟悉澎湃OS或其他主流移动OS技术架构;具备扎实的系统架构设计能力,熟悉分布式系统、内核、AI、移动生态适配等核心技术;具备优秀的英文文档撰写、方案宣讲能力及跨文化跨部门协作能力,能高效对接Google/Android官方团队。5. 其他要求:对前沿技术及跨企业合作有强烈的探索欲与创新意识,具备高度的责任心、韧性及跨文化沟通素养,能适应复杂跨企业项目的统筹推进。 投递...

Premium Full-time Ml
Xiaomi  13 days ago
Xiaomi jobs

MiMo算法研究员-预训练 北京 社招 全职 职位 ID:A180229 职位描述 我们在做什么?核心预训练(Core Pre-training)我们不仅是在训练模型,更是在探索智能的本质边界。我们致力于从零构建下一代通用的智能基座:1. Backbone & Architecture - 下一代基座:Model size scaling & context length scaling - 原生多模态:设计文本、视觉、音频原生融合的统一架构,实现端到端的物理世界感知与推理。 - Co-design:坚持 Algorithm-Infra Co-design,结合底层硬件特性(Kernel/拓扑)设计架构,突破训练与推理的效率瓶颈。2. Data - 真实数据 scaling:建设超大规模多模态数据发掘、采集、清洗与配比流水线,覆盖所有人类已有数据。 - 合成数据 scaling:攻克高质量合成数据的生成与验证难题,解决数据稀缺性,提升数据知识密度、推理密度、推理长度。3. Optimization - 极致收敛:研发适应万卡集群、超大 Batch

Xiaomi  13 days ago
Xiaomi jobs

VLA训练infra算法工程师 - XiaomiRobotics 北京 社招 全职 职位 ID:A243642 职位描述 1. 基于 PyTorch 生态(FSDP / DeepSpeed / Megatron 等)设计并实现 VLA 模型的分布式训练方案(DP / TP / PP / MoE),构建稳定高效的训练框架2. 推动混合精度(BF16 / FP8)与算子融合(FlashAttention / Triton kernel)3. 构建高吞吐数据pipeline,设计数据格式与 shard 策略,实现高效的数据加载4. 支持大规模实验追踪、管理、指标可视化 职位要求

Xiaomi  13 days ago
Z.ai jobs

高性能推理优化算法工程师 北京 全职 互联网 / 电子 / 网游 职位描述 1、高性能算子开发与优化:负责AI模型(尤其是大语言模型及多模态模型)在GPU上的核心算子(Kernel)的设计、开发与极致性能优化,支撑训练和推理场景的高效运行。2、性能分析与调优:深入分析GPU应用程序的性能瓶颈,通过优化内存访问模式、线程调度、执行效率等手段,显著提升计算密集型任务的吞吐量和降低延迟。3、技术集成与应用:研究并应用业界前沿的优化技术(如模型量化QAT/PTQ、算子融合、动态形状支持、FlashAttention等),并将其集成至推理/训练引擎。 职位要求 1、编程能力:具备3年及以上GPU编程与高性能计算优化经验,深入理解GPU架构、并行计算原理、计算机体系结构,具备高性能计算内核的开发与优化经验。2、精通C/C++,具备扎实的编程基础、良好的编程风格和丰富的调试经验;熟练掌握Python;熟悉Linux开发环境。3、性能优化经验:能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具,有实际的性能优化案例和成果,能独立定位和解决复杂的性能问题。4、算法基础:熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法,了解深度学习常见算子的计算方式 投递...

Premium Full-time
Z.ai  11 days ago
Z.ai jobs

AI院-GLM团队-训练/推理infra算法工程师 北京 全职 互联网 / 电子 / 网游 职位描述 岗位职责 1. 与算法团队深度协作,参与 下一代 GLM 大模型架构设计与系统实现 ,推动模型结构与系统效率的协同优化2. 构建 大模型推理成本分析与模拟系统 ,从算力、通信、KV cache、并行策略等维度优化推理效率3. 设计与优化 超大规模训练基础设施(万卡级) ,提升训练稳定性、资源利用率与训练效率4. 探索 MoE、Sparse Attention、长上下文等新架构在训练与推理系统中的高效落地 你将参与 * 下一代 GLM 系列基础模型(百亿到万亿参数级) 的系统设计* 万卡规模训练系统 的优化与稳定性工程* 推理系统的 极致效率优化(吞吐

Z.ai  11 days ago
XPENG jobs

大模型训练加速工程师 / 高级专家 北京 全职 通用智能板块 职位描述 【岗位职责】训练加速与优化: 负责大模型训练场景下的性能分析 (Profiling) 与全链路优化,包括显存管理、计算加速及通信优化 (NCCL),提升集群训练吞吐率。算子开发与协同设计 (Co-design): 负责高性能算子 (Kernel) 的开发与调优;与算法团队紧密协作,针对特定模型结构(如 Transformer, MoE)进行定制化算子设计。分布式框架建设: 基于 Megatron-LM, DeepSpeed, FSDP 等框架进行二次开发与优化,设计适应大规模集群的并行训练方案。稳定性保障: 负责大规模训练过程中的问题定位与解决,包括但不限于 NCCL 超时、显存溢出 (OOM)、训练速度波动等,保障训练任务的高效稳定运行。 职位要求 理论基础: 计算机基础扎实,深刻理解深度学习训练原理(计算图、自动微分、混合精度),熟悉主流并行策略及 FlashAttention 等加速算法。编程能力: 熟练掌握 Python/C++,熟悉 GPU 编程模型,具备 CUDA

XPENG  7 days ago
Pony.ai jobs

C++实习生 - 性能优化 - 北京海淀 北京 实习 职位描述 职位描述1. 负责自动驾驶系统感知在线模块的性能优化;2. 使用AI等工具分析感知模块,定位性能瓶颈并推动CPU、GPU等多维度优化落地。 职位要求 职位要求1. 计算机或相关专业本科以上学历;2. 优秀的编程能力,Linux开发经验、扎实的C++基础;3. 扎实的数据结构与算法基础;4. 有较强的独立解决问题能力,学习能力,动手能力及沟通能力。若能满足如下条件的其中一个,会适当加分1. 具备良好的代码风格、代码品味与工程化意识;2. 了解常用的 CPU/GPU 性能分析方法或工具,如 gprof、Nsight System、perf等;3. 了解多线程优化、并发性能优化、 GPU 编程模型、显存管理、kernel 调优等相关知识;4. 在自动驾驶行业有实习经验、或由高性能计算工程项目;5. 实习期6个月及以上,能尽快入职。 投递...

Premium Full-time
Pony.ai  7 days ago
ThunderSoft jobs

系统开发工程师(稳定性) 北京 全职 智能制造 / 工业互联网 / 工业自动化 职位描述 岗位职责:1. 负责Android/Linux/QNX车机平台相关产品的驱动开发和维护;2. 负责Linux kernel层的优化3. 分析和解决系统集成期间发现的问题。 职位要求 任职要求:1. 本科及以上学历,计算机或相关专业;2. 3年及以上Linux bsp开发经验4. 熟悉C语言及常用数据结构;5. 熟悉U-Boot、Linux内核开发,熟悉GPIO、I2C、SPI、UART、触摸屏、DDR等常见驱动开发;6. 掌握Linux驱动程序的开发流程和工作原理,熟悉Linux内核常用调试方法和工具;7. 熟悉yocto开发环境或汽车电子产品开发经验优先;8. 熟悉高通Linux平台驱动开发优先考虑;9. 熟悉QNX 驱动开发;9. 良好的英文书写及口语交流能力; 投递...

Premium Full-time
ThunderSoft  3 days ago
小米科技 Xiaomi Technology jobs

顶尖应届-大模型推理框架研发工程师-基础技术平台 北京 校招 正式 软件研发类 27届未来星 职位描述 1、负责基于 SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能。以满足不同规模大模型的实时推理需求复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能。2、负责Cuda Kernel优化,开发高性能的GPU算子, 提升大模型推理性能。 职位要求 1、计算机/电子/数学等相关专业硕士及以上学历;2、精通C/C++,熟悉Python,具备扎实的数据结构与算法基础,ACM/ICPC、NOI等竞赛获奖者优先;3、熟悉NVIDIA GPU架构及编程模型,掌握CUDA核函数优化、显存管理、多流并发等技术,有实际性能调优经验;4、熟悉PyTorch、Megatron、vLLM/SGLang等深度学习训练和推理框架;5、有分布式系统开发经验,熟悉MPI、NCCL等通信库,或参与过大模型训练/推理项目者优先。 投递...

Premium Full-time
小米科技 Xiaomi Technology  3 days ago
Canva jobs

Company Description 该岗位现面向所有经验阶段的候选人开放,包括社会招聘、应届毕业生,同时开放实习生岗位。工作地点为北京。欢迎申请,期待你的加入! Notice: This position is open to candidates at all experience levels, including experienced candidates, graduates, as well as internship opportunities. The role is based in Beijing. We welcome your application and look forward

Canva  1 day ago
千寻智能(杭州)科技有限公司 jobs

【校招实习】机器人嵌入式开发工程师 北京 实习 互联网 / 电子 / 网游 - 研发 千寻智能2027届校招实习招聘项目 职位描述 1、底层核心开发实战:参与机器人/数采设备嵌入式底层软件开发、系统配置、功能集成,负责MCU/Linux底层基础功能、音视频、设备控制模块迭代。2、外设驱动从零调试:独立参与 GPIO、SPI、I2C、CAN、ADC、PWM、DMA、Flash 等芯片外设驱动开发、配置与功能验证,积累扎实的底层驱动落地经验。3、软硬件联合联调:配合硬件、应用团队完成底层接口联调,精准定位软硬件耦合Bug,迭代优化系统稳定性与实时性。4、设备智能化功能开发:参与设备云端对接、设备状态管理、远程控制、整机OTA升级等核心功能开发,掌握智能设备云端一体化架构。5、技术沉淀与规范搭建:梳理底层开发文档、驱动适配规范、问题复盘清单,助力团队软件标准化、模块化建设。 职位要求 1、 C语言功底扎实,熟练掌握指针、结构体、位操作、内存管理、回调机制等底层核心编程思想,代码风格规范。2、熟悉嵌入式开发流程,熟练使用 Keil / GCC 交叉编译等开发工具链,具备独立编译、烧录、调试能力。3、了解 UART、I2C、SPI、CAN、以太网等至少一种通信总线原理,具备底层通信调试认知。4、优先加分项:有 STM32、RK 平台实际项目开发经验;有 RTOS、Linux Kernel、设备驱动移植、内核调试经验;熟练使用AI辅助开发(SPEC Coding、Skill、Agent工具),高效落地编码调试;参与过电赛、智能车、机器人竞赛、嵌入式科创项目者。 投递...

千寻智能(杭州)科技有限公司  11 hours ago
上海得物信息集团有限公司 jobs

【27届实习】算法工程师(C++方向) 杭州、北京 实习 技术类 2027届实习生项目 职位描述 2027届实习生项目:面向27届毕业生(毕业时间2026年9月-2027年8月),为符合岗位要求的同学提供转正机会;1、负责参与得物预估服务、深度学习分布式训练框架和平台的研发,重点研发GPU分布式训练系统,支持搜广推稀疏大模型离线训练和在线学习等算法需求,支持AIGC大模型分布式训练需求;2、负责参与TensorFlow/PyTorch框架的后端GPU训练性能优化,自定义GPU算子的cuda kernel开发和优化;3、参与模型训练,模型服务,资源调度等重要方向的研发,提升平台的效率和易用性,加速得物算法团队的模型迭代效率。 职位要求 1、2027届毕业生,硕士及以上学历,人工智能、计算机、软件工程、电子、数学等相关专业,精通数据结构/算法,操作系统,,网络通信等核心理论知识;2、有较强的动手能力,具备优秀的编码能力,熟练掌握C++/Python编程语言,ACM参赛者优先,参与过深度学习框架开发的优先,熟悉GPU编程的优先;3、有较好的逻辑思考能力,快速识别关键问题,清晰描述问题和沟通解决方案,有一个或者多个技术点深入思考者优先;4、有较好的主动性,开放心态,能大胆,主动问问题,思考问题,大胆提出自己的想法和建议,开源社区积极参与者或者活跃者优先;5、具有良好的沟通协作能力,主动分享意愿,主动和师兄思考问题,解决问题,共同成长。 投递...

Premium Full-time
上海得物信息集团有限公司  11 hours ago

Company Description 该岗位现面向所有经验阶段的候选人开放,包括社会招聘、应届毕业生,同时开放实习生岗位。工作地点为北京。欢迎申请,期待你的加入! Notice: This position is open to candidates at all experience levels, including experienced candidates, 2025 and 2026 graduates, as well as internship opportunities. The role is based in Beijing. We welcome your application

Canva  12 days ago

Subscribe for job alerts and resources to make your job search easier!

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

Also try:

Receive the latest job openings for:

kernel jobs in 北京

You also might be interested in:

CUDA

PyTorch

C++

AI

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

All Filters Apply
Sort by
Skills
Employer/Recruiter
Experience