Refine Reset All
Sort by
Skills
Location
Job Type
Employer/Recruiter
Experience
Date Posted
Skills
Location
Job Type
Employer/Recruiter
Experience
All Filters

Cache Jobs In China - 38 Job Positions Available

Top Cities:
1 – 20 of 38 jobs
后摩智能科技有限公司 HOUMO.AI jobs

大模型量化算法研究与评测体系工程师 / 研究员南京全职互联网 / 电子 / 网游职位描述主要负责面向自研芯片的大模型量化算法研究、工程实现与量化精度评估体系建设,支撑 LLM、VLM 及多模态大模型在低比特、高性能场景下的部署与持续迭代。1.负责面向自研 AI 芯片的大模型量化算法研究与开发,包括但不限于 Weight-only 量化、Activation 量化、KV Cache 量化、混合精度量化、低比特量化、无标定 / 少标定量化等方向; 2.结合芯片计算特性、数据格式、访存结构和算子支持能力,设计适配硬件的量化方案,提升大模型在自研芯片上的推理效率与精度保持能力; 3.负责 LLM、VLM 及音视频多模态模型的量化精度评估体系建设,包括评测指标设计、评测集构建、评测流程自动化、误差分析与精度回归分析等; 4.搭建大模型量化评测框架,支持不同模型、不同量化算法、不同 bit-width、不同硬件后端之间的系统化对比评测; 5.负责量化算法在大模型推理链路中的落地验证,包括模型加载、算子替换、图优化、端到端性能分析、精度损失定位与优化; 6.构建面向业务场景的大模型量化评测体系,支持对话、代码、数学推理、视觉理解、多模态生成、音视频理解等任务的量化效果评估; 7.建设大规模快速分布式评测能力,支持大量模型版本、量化配置和芯片后端的自动化评测、结果管理与可视化分析; 8.参与量化评测平台研发,支持量化实验管理、评测任务调度、结果可视化、精度榜单发布和异常样本分析; 9.跟踪 GPTQ、AWQ、SmoothQuant、HQQ、QuaRot、SpinQuant、MXFP/FP8/INT4 等前沿量化算法和低精度计算技术,并结合自研芯片特点进行改进和创新。 职位要求任职要求1.研究生及以上学历,计算机、电子信息、人工智能、自动化、数学等相关专业优先; 2.熟悉大模型基本结构与推理流程,了解 Transformer、Attention、MLP、KV Cache、Norm、Embedding 等核心模块; 3.熟悉大模型量化相关技术,包括 INT8、INT4、FP8、Weight-only

后摩智能科技有限公司 HOUMO.AI  28 days ago
知合计算 Zhihe Computing jobs

互联设计工程师/专家深圳全职研发 - 电子 / 半导体职位描述1. 调研业界前沿互联设计,探索推动互联创新;2. 与架构团队协同,定义高性能互联总线实现方案;3. 完成RTL代码实现和优化;4. 与验证团队协同,不断提升验证完备性,保证产品稳定可靠;5. 与性能团队协同,软硬件高效迭代分析,达到业界一流性能;6. 与后端团队协同,前后端深度协同优化,实现业界一流PPA。职位要求1. 计算机、微电子、通信等相关专业背景,有良好的数字系统理论知识;2. 熟悉CHI、AMBA等总线和cache coherence协议;3. 熟悉Verilog,有实际项目经验;4. 具备时序/功耗/面积(PPA)分析优化经验;5. 具备良好的团队协作能力和抽象归纳能力;投递...

Premium Full-time
知合计算 Zhihe Computing  26 days ago
Nvidia jobs

At NVIDIA, we’re solving the world’s most ambitious problems with our groundbreaking developments in Artificial Intelligence, High-Performance Computing and Visualization. We are looking for a Developer Relations Manager to work with China industrial/research community to integrate

Nvidia  27 days ago
Insta360 jobs

高性能计算工程师深圳社招全职职位描述1.负责AI及传统图像、视频算法工程化2.负责各个算法在特定处理器上的极致优化,包括但不限于指令集、cache、带宽、GPU优化3.负责分析各个算法的性能瓶颈点,并与算法同事进行反馈,进一步保效提速降负载4.负责算法SDK的封装,输出到下游部门进行集成,并进行性能和效果对齐职位要求1.统招本科及以上学历,计算机、软件工程、通信工程、电子信息工程、自动化等专业优先2.精通计算机体系结构,精通c++,并且有3年以上的c++开发经验3.掌握simd/asm/gpu/cache等优化技巧,能熟练使用其中一种或者多种优化技术4.熟练使用intel vtune profile/perf等一种或者多种性能分析工具的优先5.熟练掌握tensorrt,openvino,onnx等推理框架开发的优先投递...

Premium Full-time Vtune
Insta360  25 days ago
MiniMax jobs

大模型训练框架研发工程师-生成模型方向紧急北京、上海社招全职研发 - 基础架构大模型系统职位描述你将加入一支把“把万卡集群跑到极致”当日常的团队,与业内领先的通用大模型一起成长。你的核心任务是:突破大规模训练的速度、成本与稳定性的极限。你将负责的核心工作:1. 大规模分布式训练系统研发(Scale Matters)- 主导 Data / Tensor / Pipeline / Expert 并行 策略的研发与优化。- 优化高性能通信、计算通信掩盖、显存复用,提升近万卡训练的集群利用率。- 面向上百亿〜万亿参数模型,实践高效并行范式。2. 性能极限优化(Performance Engineering)- 系统性分析训练吞吐瓶颈(comm / compute / IO / kernel / memory)。- 针对关键路径做深度优化:算子融合、精度压缩、通信调度、显存管理策略。- 与推理体系协同推进量化、MoE、Speculative Training 等最新机制的训练端落地。3. 前沿训练技术探索(Frontier Research → Engineering)根据你的兴趣及特长,可主导其中一类:-

MiniMax  23 days ago
MiniMax jobs

存储架构与性能优化工程师(大模型 / AI 基础设施方向)上海社招全职研发 - 运维职位描述1. 面向大模型训练、推理与数据清洗场景,负责存储软件与硬件方案的选型、测试、交付与运维,制定存储产品技术路线,支撑大规模 GPU/AI 集群稳定运行。2. 设计并实施 AI 场景下的存储性能测试体系,覆盖: 大模型训练(Checkpoint / Dataset / .IO 伴生负载) 推理服务(低延迟、高并发、小 IO) 数据清洗与特征工程(高吞吐、顺序/混合 IO)3. 输出性能评估与优化报告,指导架构决策。4. 深入分析训练与推理链路中的 IO 瓶颈(CPU / GPU / 网络 / 存储协同),提出针对性的性能调优方案,包括但不限于: 存储协议与参数优化 数据布局与访问模式优化 Cache / Buffer

MiniMax  23 days ago
无问芯穹 Infinigence AI jobs

推理框架开发工程师北京、上海社招全职互联网 / 电子 / 网游 - 研发职位 ID:A100292职位描述1. 负责大模型推理引擎的基础软件框架研发,构建高性能、高可靠的推理核心系统;2. 对接上层大模型算法与部署组件,高效集成自研推理框架与异构算子库,实现端到端推理链路优化;3. 参与设计并实现低开发门槛、用户友好的大模型中间层软件栈,提升模型部署效率与易用性。职位要求1. 计算机相关专业背景,基础扎实,熟练掌握 C/C++ 和 Python,具备良好的数据结构与算法能力,有系统级软件架构设计经验;2. 熟悉大模型推理核心技术,熟悉 PagedAttention、FlashAttention、KV Cache 多级管理与跨节点传输、PD 分离 等关键机制;3. 有 vLLM、SGLang、TensorRT-LLM 等主流大模型推理框架的使用或开发经验;4. 熟悉 华为昇腾(Ascend)、沐曦 等国产 AI 芯片生态,具备相关平台适配与性能优化经验者优先;5. 熟悉 NCCL/HCCL 等通信库,掌握分布式推理中的张量/流水线并行、显存优化等技术者优先。职位信息部门: 推理计算投递...

Premium Full-time AI
无问芯穹 Infinigence AI  23 days ago
XPENG jobs

【27届暑期】IP验证实习生上海、深圳、武汉实习研发 - 电子 / 半导体职位描述1.参与核心模块功能的开发和验证,确保开发质量。2.理解产品功能,制定验证计划,细化测试点。3.使用验证语言(systemverilog/uvm)搭建 Testbench,编写testcase,完成coverage收敛。4.支持架构设计,代码设计,原型开发过程中的验证工作职位要求1. 硕士及以上学历,微电子,电子工程,电子技术、光电子,通信、信息,计算机、自动化,测试,软件,材料等专业方向。2. 较好学习过数字电路,CMOS电路原理,信号与系统,线性代数,计算机原理,C语言等。3. 熟悉数字电路的开发流程。4. 能够熟练使用Verilog编写代码,并搭建testbench运行仿真测试。5. 熟悉流行的验证方法学(UVM,SVA等)。有如下经验或技术者更佳:有过实际Verilog开发或者验证经验. 对神经网络算法有一定的了解。对数字电路结构有一定的了解, cpu, gpu, npu, cache, noc, etc;对图像处理算法有一定的了解; 熟悉linux命令,Makefile,python,vim等. 较强的编程能力。投递...

Premium Full-time
XPENG  19 days ago
Desay SV jobs

数字化工程师(实验室)惠州全职职位描述1、实验室信息数据平台设计、建设与实施2、信息数据平台对接、现场数据对接、应用数据对接及现场实施3、大数据相关数据分析、数据处理、接入方案编写与实施4、实验室信息化、数据化相关的内外部交流、人员协调及相关开发工作5、实验室信息管理系统的日常维护及使用过程中的问题解决6、实验室信息管理系统的持续改进职位要求1.硕士及以上学历(有优秀工作经验者可以放宽到本科),具备平台级架构经验和商业化业务应用研发经验,熟悉Java语言与Java生态,熟悉SpringFramework、SpringMVC、.SpringBoot、SpringCloud、Mybatis、Dubbo等Java或信息数字化开发主流框架的使用及其原理和特性;2.熟悉SQL、NoSQL、Cache、Search等相关中间件的使用及其特性;有大型分布式、高并发、高性能、高可用系统的设计开发经验;了解前端技术栈更佳;3.精通设计模式,具备高质量代码编写能力,对业务有良好的理解能力,有强烈的责任心,对代码质量的高要求。注重代码质量,有良好的Test Driven习惯;4.熟悉领域建模,能构建优秀的领域模型,以简化业务层的研发复杂度;有能力设计复杂业务、高并发和大数据量的系统。具备复杂需求及技术的研究能力;5.具备业务视角,能够主动理解业务需求,并为业务发展提供良好建议;善于技术突破,擅长团队的沟通协作,具备亲和力;6.全栈或了解其他技术栈者优先;有PaaS平台研发经验优先。投递...

Premium Full-time
Desay SV  16 days ago
Texas Instruments jobs

Change the world. Love your job. In your first year with TI, you will participate in the Career Accelerator Program (CAP), which provides professional and technical training and resources to accelerate your ramp into TI and

Texas Instruments  13 days ago
鉴智机器人 PhiGent Robotics jobs

自动驾驶软件架构师 杭州、上海 全职 智能制造 / 工业互联网 / 工业自动化 职位描述 1、为鉴智下一代汽车平台以及自动驾驶系统设计、架构并交付与车载计算平台和核心功能相关的系统级工具链、框架以及SDK;保证其可靠性、实时性、稳定性、高性能;2、负责自动驾驶端侧工具链的总体架构设计,打造业界领先的自动驾驶工具链,包括海量数据的Bag、Cache、Persist、Trigger、Replay 等核心系统研发工作,并对关键技术问题把握其方案架构、设计实现和产品交付;3、主导产品研发过程中的技术攻坚工作,跟进中间件、影子模式等前沿技术,持续推进架构演进,不断提高工具链自动化水平。 职位要求 1、本科及以上学历,计算机/通信相关专业,五年以上相关工作经验;2、精通Linux环境下的开发,熟悉现代主流的C++设计模式,熟练掌握各种调试手段和系统调试工具,掌握复杂系统的性能优化方法;3、熟悉一种或多种嵌入式SoC体系架构以及软件栈,如:NVIDIA DRIVE/Jetson、TDAx、Horizon J3/J5等;4、具备大型系统的完整设计&实现经验,善于拆解需求到技术实现,超强的求知欲、学习能力以及工程能力;5、优秀的沟通能力和团队合作能力;满足以下条件为加分项:(1)编码能力强悍,对操作系统/计算机体系结构原理深入理解,思维敏捷,善于攻克技术难题;(2)熟悉一种或多种量产级中间件,如:CyberRT,地平线TROS.A,NVIDIA Driveworks,ROS2等;(3)熟悉域控制器平台传感器接入,深刻理解时间同步、图像编解码、数据存储等相关技术,具备丰富实战经验。 投递...

Premium Full-time
鉴智机器人 PhiGent Robotics  13 days ago
Coupang jobs

Our mission to build the future of commerce is real. We push the boundaries of what’s possible to solve problems and break traditional tradeoffs. Join Coupang now to create an epic experience in this always-on, high-tech,

Coupang  12 days ago
上海得物信息集团有限公司 jobs

【27届实习】中间件AI开发工程师(JAVA方向) 上海 实习 技术类 2027届实习生项目 职位描述 1、参与AI Native及相关工具设计、开发与迭代,包括 AI workflow 编排,Agentic Ops,AI 智能 Agent , LLM 网关,AI Agent 推理请求调度及 Claw 个人研发助手开发优化等;2、参与 AI Infr 和传统中间件设计、开发与迭代,包括大模型 API Gateway ,AI 向量数据库开发,以及传统中间件分布式缓存、RPC框架、消息队列等性能优化和稳定性保障;3、参与微服务架构技术攻关和 AI 探索,包括服务治理、热点探测、 AI 短信、AI 语音等中间件核心领域;探索Service Mesh 和容器化在 AI

上海得物信息集团有限公司  11 days ago
上海得物信息集团有限公司 jobs

生成式重排 上海 实习 技术类 研究型实习生项目 职位描述 项目描述:基于transformer、LLM构建重排模型,充分挖掘上下文信息,提升模型预估准确率;通过列表级(List-wise)损失函数、强化学习等手段,优化list级点击、时长、多样性及生态等多目标全局收益; 模型性能优化,通过多 Token 预测(MTP)、KV Cache、模型量化、算子融合等技术,实现高并发下的低延迟推理。岗位职责:1. 跟进和设计基于强化学习的生成式Listwise混排框架,重点研究探索多目标reward设计、强化学习优化算法、兼顾激励相容原则等方向;2. 结合以上方向的探索和研究,撰写发表论文,和业界、学术界保持良好的交流。 职位要求 1. 2028届及以后毕业,本科及以上学历在读,自然语言处理、机器学习、数据挖掘、人工智能等相关专业; 2. 熟练掌握Tensorflow深度学习框架,扎实的编程基础,具备独立的算法实现能力; 3. 有强化学习实操经验,参与过业界强化学习大规模项目者优先; 4. 良好的逻辑分析能力和数理基础,对算法原理及应用有较深入的理解,在人工智能相关的各类国际顶级会议/期刊中发表过论文者优先本项目为得物研究型实习生项目。该项目岗位最低实习时长为3个月,岗位非纯业务开发岗位,主要目的为发表顶级期刊。 投递...

Premium Full-time Tokens
上海得物信息集团有限公司  11 days ago
无问芯穹 Infinigence AI jobs

算法研究主管 上海 社招 全职 互联网 / 电子 / 网游 - 研发 职位 ID:A170403 职位描述 1. 提出并验证突破性的算法模型架构,探索长文本处理优化、Memory机制、混合专家模型(MoE)的极致演进,以算法层面的创新大幅降低推理时的Token消耗与计算成本。2. 设计更智能的Agent协同机制与推理框架,探索Agentic Workflow、自我反思与进化(Self-evolving)、复杂任务拆解与多步规划等前沿方向。3. 主导团队在 NeurIPS、ICLR、ICML、CVPR、ACL 等人工智能顶会发表高质量(一作或通讯)学术论文,申请核心发明专利,提升无问芯穹在AI算法领域的全球学术影响力。4. 敏锐捕捉学术界最新SOTA成果,完成前沿算法的PoC(概念验证)或原型系统搭建。5. 与公司上层应用及算法工程团队紧密联动,将经过验证的“省Token算法”或“新型Agent框架”平滑移交,指导其在真实业务场景中的落地验证。6.从零搭建并带领一支约5人规模的精锐学术团队,负责研究选题规划与日常学术指导。 职位要求 1. 计算机、人工智能、数学等相关专业博士学历;在国内顶尖AI实验室(如上海AI Lab、智谱等)或大厂AI Lab有相关研究经验者优先。2. 硬性指标:以第一作者在 NeurIPS、ICLR、ICML、CVPR、ACL 等顶会/顶刊发表过多篇高影响力论文,具备独立科研与定义前沿问题的能力。3. 极强的数学直觉与算法功底,能将学术直觉快速转化为可验证的实验(如DeepSeek模式)。4. 深刻理解并有实战经验于:RLHF/PPO/DPO等对齐算法、大模型训练微调(SFT等)、Agent多步推理、KV Cache优化等。5. 有指导博士生或带领小型科研团队产出顶会论文的成功经验。 职位信息 部门:

无问芯穹 Infinigence AI  8 days ago
Xiaomi jobs

Miclaw-大模型训练推理方向实习生 AI人才专项 热招 北京 校招 实习 软件研发类 实习生招聘计划 职位描述 1. 研究并复现业界与学术界 SOTA 的大模型推理优化技术,包括但不限于极低比特量化、FlashAttention、投机解码(Speculative Decoding)、KV Cache 优化等关键方向,并在真实端侧场景中进行性能评估与对比分析。2. 面向端侧算力与内存受限场景,探索高效的大模型结构与推理策略,如端侧友好的 MoE 方案、稀疏与线性注意力、长上下文推理优化等,推动模型在性能、效果与资源消耗之间的最优权衡。3. 参与大模型与芯片协同设计(Model–Chip Co-design),从模型结构、算子设计到推理系统层面进行联合优化,深入理解端侧 NPU / GPU / CPU 架构对模型推理性能的影响。4. 与模型、系统、芯片团队深度协作,将研究成果转化为可落地的工程方案,并有机会参与核心模块的设计与实现,产生可量化的性能提升结果。 职位要求 1. 计算机科学、人工智能、电子工程或相关专业在读本科 / 硕士 / 博士,对大模型、系统或芯片方向有强烈兴趣。2. 具备扎实的算法与系统基础,对复杂系统的性能瓶颈具有较强分析能力,愿意深入到实现细节解决“难而重要”的问题。3. 至少在以下一个或多个方向具备良好基础或实践经验:-

Xiaomi  8 days ago
Mercedes-Benz Group AG jobs

Tätigkeitsbereich:Forschung & Entwicklung incl. Design Fachabteilung:MBOS Software Architecture & Base Software Gesellschaft:Mercedes-Benz Digital Tech Ltd. Standort:Shanghai, Xingchi Tower, No. 399, Keqiao Road, Jinqiao, Pudong Startdatum:sofort Veröffentlichungsdatum:26.05.2026 Stellennummer:MER0003XSU Arbeitszeit:Vollzeit Bewerben Aufgaben Objective: Lead a small-scale outsourcing engineer

Mercedes-Benz Group AG  8 days ago
智元创新(上海)科技有限公司 jobs

具身算法引擎开发实习生 上海 实习 职位描述 1. 训练框架开发:参与VLA等大模型训练框架研发与优化,包括数据并行、模型并行、流水并行等分布式训练能力的建设,提升千卡规模的训练稳定性与资源利用率。2. 推理系统优化:参与VLA等大模型的推理引擎开发与性能优化,包括算子优化、KV Cache管理、Prefill/Decode优化、Batch调度、低延迟Serving等核心能力建设,提升推理吞吐与响应速度。3. 分布式系统优化:参与多机多卡训练与推理系统建设,优化NCCL通信、AllReduce效率及IB/RDMA网络性能,提升大规模集群运行效率。4. 稳定性保障:解决大规模训练中的故障恢复、Checkpoint 管理、梯度异常等问题,确保长时间训练任务的稳定运行。5. 平台工程建设:参与训练/推理平台工程化建设,包括模型部署、监控、自动化测试、性能Benchmark及稳定性保障。 职位要求 1. 本科及以上学历,计算机、人工智能、自动化、机器人等相关专业优先2. 熟悉Python或C++开发,具备良好的代码能力与工程习惯3. 精通 PyTorch 分布式训练机制(DDP/FSDP),熟悉 DeepSpeed、Megatron-LM 、vLLM、SGLang等大规模训练/推理框架的原理与使用4. 深入理解 3D 并行(Data Parallel / Tensor Parallel / Pipeline Parallel)的实现原理与适用场景,能够根据模型特点设计最优并行策略5. 熟练使用 PyTorch Profiler、NVIDIA Nsight 等工具进行性能分析,能够定位并解决计算、通信、I/O 瓶颈加分项:1.

智元创新(上海)科技有限公司  5 days ago
Xiaomi jobs

Miclaw-移动端 AI 性能专家 (Engine & Efficiency) 北京 社招 全职 职位 ID:A240371 职位描述 1. 引擎调优:负责 Android/iOS、与云端 Mimo 或本地 ExecuTorch/ncnn 的底层接入与硬件加速(NPU/GPU/Metal)。2. 效率突破:实现 Speculative Decoding (投机采样) 或 Prompt Caching,在手机端将 TTFT(首包延迟)降至极致。3. 性能监控:建立全链路监控指标体系,关注 Tokens/sec、ITL (Token 间延迟) 以及 Agent 后台运行时的功耗曲线。4. 资源调度:解决多 Agent

Premium Full-time AI MIMO
Xiaomi  4 days ago
Xiaomi jobs

Linux内核调度专家 北京 社招 全职 职位 ID:A123340 职位描述 1. 基于Linux Kernel进行调度优化,结合Android应用生态设计和优化内核调度器。2. 熟悉SoC资源管控机制,构建CPU/GPU/DDR/Cache等资源的统一频率管控和性能瓶颈拆解3. 熟悉微架构,能够拆解指令的微架构性能瓶颈并进行优化,基于微架构指标进行调度器的优化和改造4. 跟踪和调研行业最新的调度优化方向,快速进行方案验证和产品导入5. 逆向分析领先的友商技术,对于下一代调度器的方向有一定的认知6. 跟踪和解决内核调度器相关的问题,包括死锁、优先级反转以及稳定性问题;7. 对于调度器进行评估,能够建立调度器的评价体系 职位要求 1. 本科及以上学历,计算机相关专业2. 熟悉Linux操作系统和内核开发,具有扎实的C/C++编程能力3. 熟悉操作系统调度算法和和原理,,了解EEVDF/CFS/EAS等调度算法,关注Linux的新型特性4. 具有良好的架构设计能力,有过一定的移动端方案设计经验,能够快速洞察行业内新技术并进行快速落地5. 具有良好的团队合作精神和沟通能力,能够与其他团队合作完成项目 投递...

Premium Full-time
Xiaomi  4 days ago

Subscribe for job alerts and resources to make your job search easier!

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

Receive the latest job openings for:

cache

You also might be interested in:

AI

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

All Filters Apply
Sort by
Skills
Location
Job Type
Employer/Recruiter
Experience