端侧 AI 算法部署与工程化工程师 深圳 全职 互联网 / 电子 / 网游 - 研发 职位描述 负责将 CV 或 Audio算法模型,部署到 AI/AR 眼镜的端侧异构算力平台(如主控 SoC 的 NPU/DSP、低功耗视觉协处理器或 MCU)。深入分析端侧芯片的算力瓶颈,熟练运用模型剪枝(Pruning)、量化(PTQ/QAT,如 INT8/INT4 定点化)、知识蒸馏等技术,在保证精度的前提下,将模型显存占用和推理延迟压榨到极致。编写高效的 C/C++ 业务胶水代码,构建从“传感器数据采集(Camera/Mic) - 预处理 - NPU 推理 - 后处理响应”的完整高能效工程流;针对部分场景单一、逻辑简单的感知需求,能够脱离算法研究员,独立完成数据清洗、轻量级模型(如 MobileNet 等小算力网络)的训练、微调与快速工程验证。
深度学习算法实习生 深圳 职位描述 1. 负责智能座舱感知融合算法模型选型、数据集制作、训练、性能优化,包括但不限于目标检测、分割、跟踪、3D重建、大模型等。2. 负责DMS/OMS智能座舱监测算法在嵌入式产品上的软件开发,包含算法逻辑设计、接口设计和软件框架设计、平台移植和维护、硬件加速模块的使用和调试。3. 负责DMS/OMS智能座舱监测算法在嵌入式平台上的性能分析、评估和功能性能的优化。 职位要求 1. 熟练掌握C/C++、Python,有好的编程风格,熟悉linux/RTOS/QNX开发, 了解ROS等。2. 熟练掌握Pytorch、Tensorflow、HugggingFace、Open3D等。3. 熟练掌握DSP、ARM NEON、NPU相关代码优化,掌握多线程/并行计算优化方法,熟悉cache、DMA等内存读写优化方法。4. 有OpenCV,OpenCL,OpenGL,Mediapipe相关开发经验者优先。5. 有疲劳检测,危险行为,分心检测,手势识别、人脸识别、唇动识别、视线估计、3D人脸人体重建、关键点检测、活体检测、年龄、性别、表情识别、身高检测等DMS/OMS算法业务代码开发经验者优先。 投递...
【27届暑期】具身大模型部署与优化实习生 深圳 实习 互联网 / 电子 / 网游 职位描述 负责将大语言模型、多模态模型和具身智能模型高效部署到机器人端侧芯片和云端,实现低延迟实时推理。1、负责VLA(操作模型)等大模型在自研芯片上的端侧部署,完成模型量化(INT8/INT4/FP8)、图优化和推理加速;2、设计和优化模型推理服务(基于 vLLM/TensorRT-LLM),支撑 VLA 推理的低延迟需求;3、建立模型部署的标准化流程:模型转换→量化→性能基准测试→端侧验证→上线发布;4、模型优化,参与大模型的量化部署工作,探索模型在嵌入式端侧的高效运行;5、与算法团队协作,从模型设计阶段介入,提供部署可行性评估和性能预估。6、实验验证: 协助将算法部署至真实人形机器人平台,进行效果调试与性能评估。 职位要求 1、计算机、人工智能、自动化、机器人等相关专业在读硕士、博士、优秀本科生;2、 具备扎实的深度学习基础,熟悉 Transformer 架构,对 VLA 等主流模型有深入理解;3、熟悉 C++/Python,具备良好的代码风格和算法实现能力;4、有以下至少一项经验:-模型量化(PTQ/QAT/混合精度)与精度-速度 trade-off 调优;-CUDA 编程与 GPU kernel 优化;-嵌入式 NPU 部署(高通/联发科/NVIDIA Orin);-熟悉至少一种推理框架:TensorRT / ONNX Runtime / vLLM