ABOUT THE POSITION We are looking for a Senior AI Engineer to help design and deliver agentic AI systems that power R&D tooling for video game asset pipelines and production workflows. You will help shape the technical direction
AI模型部署与性能优化工程师 深圳 社招 全职 数字技术 - 芯片研发 本科及以上 3-5 年 职位描述 1. 负责将客户常见智能辅助驾驶算法模型(CNN,Transformer,LLM,多模态等)部署到公司大算力芯片平台,解决过程中可能涉及的算子不支持、模型规格不匹配的兼容性问题。2. 运用性能分析工具对模型进行全栈性能剖析,识别计算、内存、调度瓶颈,通过图融合、算子替换、内存优化以及其他软硬件优化技术,提升推理速度和吞吐量。3. 配合客户实施PTQ/QAT量化方案,定位并解决量化或其他过程引入的精度损失问题。4. 系统性地诊断并解决单模型部署和多模型并发场景下的稳定性问题。深入定位Core Dump / Crash的根本原因(内存越界、资源竞争等)并推动解决。5. 深入理解客户需求,提供部署、性能调优方案和建议。建设并维护车载/机器人场景 Model Zoo,输出最佳实践案例文档,降低客户使用门槛。 职位要求 1. 硕士以上学历,具备2年以上AI模型在端/边/云平台部署优化经验。有车载或机器人芯片平台项目经验者优先。2. 精通Python和C++编程,熟悉PyTorch、TensorFlow、ONNX等深度学习框架中的一种或多种。3. 熟悉TensorRT、TVM、ONNX Runtime、vLLM、llama.cpp等主流推理引擎中的一种或多种。4. 熟悉常见网络模型结构和算子,具备模型部署、算子开发和调优经验。掌握系统级别和算子级别 Debug & Profiling 实战技能,熟悉Nsight Systems、perf、Vtune等性能分析工具。5. 熟悉GPGPU或NPU等AI加速芯片硬件特性、了解AI软件栈,有软硬协同经验者优先。6. 积极主动,勇于承担, 具备良好的团队合作精神、沟通协调能力和技术推动力。 投递...
大模型端侧推理优化工程师上海、北京社招全职互联网 / 电子 / 网游 - 研发职位 ID:A93398职位描述1. 负责端侧推理框架和推理产品的研发,支持LLM、SD等模型在端侧的部署应用;2. 负责推理前沿优化技术在自研产品的落地,跟进学术与社区最新进展;3. 负责标杆模型在端侧异构系统上的高效适配和硬件推理加速优化的研发;4. 参与端侧大模型项目的研发规划,协同配合项目落地。职位要求1. 本科及以上学历,计算机相关专业,具有扎实的计算体系结构的基础;2. 熟悉C++/python/java,有较强的工程编程能力;3. 熟悉使用1种或者多种业界常用大模型推理框架的设计和实现,如:TVM,Llama.cpp;4. 熟悉CPU、GPU、NPU等计算后端的算子开发和优化技巧,如:CUDA、Opencl、Vulkan或主流Npu;5. 具有1年及以上大模型部署推理相关工作经验,或者端侧AI模型落地经验;6. 具有大模型核心算子的优化加速经验者更佳。职位信息部门: 智能终端产研投递...
具身大模型推理性能优化实习生上海实习职位描述1. 参与到面向具身机器人本体亲和的轻量化、高性能推理框架模块化开发;2. 基于GPU/NPU的具身多模态算子开发与性能优化,实现内存复用、算子融合、数据排布优化、多流并行等通用加速策略; 3. 开发模型解析、转换、性能剖析、可视化profiling工具;4. 洞察算子融合、低精度量化、AI KernelGen、投机推理等在具身本体上的模型高效推理适配技术并复现开发;5. 调研VLA、世界模型、空间智能等最新算法架构趋势;职位要求1. 熟练掌握C/C++,具备汇编(ARM/x86)或CUDA/OpenCL优化经验;2. 深入理解至少一种推理引擎架构(如tensorrt/vllm/sglang/ktransformer/llama-cpp);3. 熟悉模型量化原理(KL 散度、MinMax、LSQ、AWQ、GPTQ 等)及相关工具链;4. 熟悉常见算子实现与优化(卷积、矩阵乘、激活、LayerNorm、Softmax 等);5. 具备端上 profiling 能力(perf、简单性能计数器、硬件事件、功耗测量);投递...
Company: Qualcomm China Job Area:Sales, Business Development & Marketing Group, Sales, Business Development & Marketing Group Product Marketing - SIP General Summary: Qualcomm is a leading supplier of chipset platforms for automotive infotainment. In this role,
大模型端侧推理优化工程师 上海 工程类 硕士及以上 3-5 年 职位描述 1. 负责端侧推理框架和推理产品的研发,支持LLM、SD等模型在端侧的部署应用; 2. 负责推理前沿优化技术在自研产品的落地,跟进学术与社区最新进展; 3. 负责标杆模型在端侧异构系统上的高效适配和硬件推理加速优化的研发; 4. 参与端侧大模型项目的研发规划,协同配合项目落地。 职位要求 1. 硕士及以上学历,计算机相关专业,具有扎实的计算体系结构的基础; 2. 熟悉C++/python/java,有较强的工程编程能力; 3. 熟悉使用1种或者多种业界常用大模型推理框架的设计和实现,如:TVM,Llama.cpp; 4. 熟悉CPU、GPU、NPU等计算后端的算子开发和优化技巧,如:CUDA、Opencl、Vulkan或主流Npu; 5. 具有3年及以上大模型部署推理相关工作经验,或者端侧AI模型落地经验; 6. 具有大模型核心算子的优化加速经验者更佳。 职位信息 部门: 数字基础设施部 投递...
软件开发工程师 北京 社招 全职 职位 ID:A74944 职位描述 岗位职责:1.依据产品需求与技术方案,完成软件工具的具体开发、编程、调试与集成测试2.制定测试计划,执行功能、性能及稳定性测试,确保工具达到质量要求,并支持产品上线部署3.负责工具的现场部署、维护、故障排查及一线使用培训,收集反馈并及时响应优化4.持续跟进工具使用情况,进行性能提升、体验优化与成本改进的专项开发 职位要求 1、本科及以上学历,计算机、软件或通信相关专业;2、精通C++,熟悉.NET框架或现代C++标准,熟练掌握QT、MFC等UI框架;3、熟悉Windows底层机制,对内存管理、多线程并发、网络通信(HTTP/WebSocket)有深刻理解,;4、熟悉开源大模型(如Llama、ChatGLM等)的部署、微调和训练流程,掌握端侧模型推理框架(如llama.cpp、ONNX Runtime等)的应用。5、对AI等前沿技术有浓厚兴趣,具备优秀的快速学习能力和创新性思维。6.拥有良好的沟通能力,有较强的项目推动力; 7.有电子/通讯行业的工业软件开发经验优先(MES、PLM、APS、SCADA、QMS等) 投递...
大模型端侧推理实习生 北京 实习 互联网 / 电子 / 网游 职位描述 1. 负责大模型在端侧推理的SDK研发;2. 负责大模型与端侧平台的高效适配与推理优化;3. 参与端侧大模型研发的整体规划,协同配合大模型端侧落地 职位要求 1. 硕士学历(优秀者本科亦可),计算机类专业,基础知识扎实2. 有较强的工程能力、创新能力、学习能力;3. 熟悉C++编程,掌握Git、CMake等常见工具,有良好的软件工程习惯;4. 熟悉一种或多种端侧部署框架或工具链,如QNN、llama.cpp、Metal等;5. 熟练阅读英文文档;6. 有端侧算法落地、移动端开发经验优先。 投递...
Company: Qualcomm China Job Area:Sales, Business Development & Marketing Group, Sales, Business Development & Marketing Group Product Marketing - SIP General Summary: Job Description Qualcomm is a leading supplier of chipset platforms for automotive infotainment. In