AI芯片模型部署专家 上海 全职 芯片板块 职位描述 1、负责将复杂的AI模型优化并部署到端侧硬件平台,比如NVIDIA等系列(包括Orin、Xavier、Nano等)。2、优化模型以满足实时处理的需求,并确保在资源受限的设备上高效运行。3、负责实现优化模型中部分算子实现,使其在合适的平台(CPU/GPU/DSP等)部署运行,提升模型效率。4、参与跨部门项目,确保技术解决方案满足业务需求。5、持续跟踪最新的AI研究进展,并评估其在端侧部署中的可行性。6、编写技术文档,包括部署指南、性能评估报告和故障排除手册等。 职位要求 1、计算机科学、电子工程或相关领域硕士及以上学位。2、至少3年的端侧AI模型部署经验,对模型压缩、量化等有深入理解。3. 熟悉NVIDIA Jetson系列硬件平台,以及NVIDIA工具链(如TensorRT、NVIDIA DALI等)者优先。4、精通至少一种深度学习框架,如TensorFlow或PyTorch。5、掌握至少一种深度学习端侧推理框架,如onnx runtime或ncnn.6、有机器人、自动驾驶等感知算法开发经验者优先。7、良好的编程能力,熟练使用C/C++、Python等语言。 投递...
分布式计算与存储软件工程师 广州 全职 通用智能板块 职位描述 职位描述1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作,包括数据加载工具(XDataLoader)和数据集管理平台(XDataset),提供统一的数据加载、转换、缓存与预取能力;目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题,服务AI大模型的训练和推理;2. 开发并维护高性能 DataLoader SDK,支持自定义采样、并行读取、缓存预取与数据增强等功能,优化多线程/进程流水线,降低I/O与预处理延迟,简化算法团队接入并提升加载效率;3. 搭建通用Dataset管理系统,实现多源异构数据(图片、视频、点云、传感器等)的统一接入、解析与格式化;4. 协同算法团队及其他技术团队,深入理解业务需求,快速响应并落地实现。 职位要求 1. 计算机 / 软件工程硕士或同等经验,3年及以上大规模数据处理经验;有大规模模型训练与推理场景支持经验者优先;2. 精通 Python,具备扎实软件工程基础,良好编程规范和代码质量意识;3. 有以下至少一项实际项目经验;两项及以上者优先: a. 大规模数据加载机制(如 PyTorch DataLoader、NVIDIA DALI、TensorFlow Dataset、Hugging Face Datasets) b. Parquet/ORC 等列式存储格式及相关生态(如Petastorm),能设计高效的分区、压缩与向量化读取流程,优化批量数据访问性能。 c. Linux文件系统与网络I/O,能针对NFS、对象存储等场景进行性能调优;有云存储系统(如阿里云OSS、CPFS、火山引擎vePFS)相关经验。4. 具备关系型数据库(MySQL/PostgreSQL)与NoSQL(Redis/MongoDB等)相关经验,了解元数据与缓存管理;5. 具备大规模分布式数据处理、性能优化与问题排查经验,能定位并高效解决复杂的性能问题;熟悉Apache Ray、Kubeflow/Airflow、Prometheus等开源项目者优先;6. 具有良好的跨团队沟通能力和协作精神,责任心强,善于主动推进问题解决。加分项1.
NPU软件栈工程师 上海 全职 芯片板块 职位描述 职位描述1.负责自研芯片上AI加速器系统的SDK和内核推理软件栈的集成和优化2.负责高性能计算软件栈生态的建设3.优化自研芯片的模型推理优化和部署4.负责实现优化模型中部分算子实现,使其在合适的平台(CPU/GPU/DSP等)部署运行,提升模型效率 职位要求 职位要求1.精通C/C++,了解经典数据结构原理,具备良好的软件工程习惯2.熟悉Linux系统基本原理并具备Linux内核驱动开发经验,或者熟悉至少一种 RTOS 原理并具备相关软件开发经验3.熟悉异构高性能计算原理或者有相关经验者优先4.熟悉GPGPU/NPU软件栈,操作系统底层原理,或者有相关经验者优先。5.自我驱动力强,对新技术有钻研兴趣,并拥有良好的学习能力6.熟悉ORIN或者昇腾芯片的SDK相关的开发和优化7.熟悉NVIDIA Jetson系列硬件平台,以及NVIDIA工具链(如TensorRT、NVIDIA DALI等)者优先。8.掌握深度学习端侧推理框架优先,如onnx runtime或ncnn.9.有机器人、自动驾驶等感知算法开发经验者优先 投递...