3D生成算法推理优化专家 Beijing Experienced Full-time Responsibilities 1. 负责3D生成大模型、3D AIGC模型的推理优化、性能调优与工业化工程落地,涵盖推理链路重构、服务化适配与生产环境稳定部署;2. 负责3D生成场景全链路推理优化工作,针对Mesh生成、三维重建、UV贴图生成、骨骼动画生成、NeRF等核心场景,解决模型推理延迟高、显存占用大、吞吐低等核心痛点;3. 主导3D大模型推理优化技术方案落地,包括算子优化、推理图编译、量化压缩、显存复用、算子融合、推理精度适配等核心优化工作,持续提升模型推理效率;4. 搭建3D生成模型推理性能评测体系、基准测试流程与自动化监控体系,常态化迭代优化推理性能、稳定性与GPU资源使用效率;5. 负责GPU推理服务、多卡分布式推理、批量推理调度系统的优化与迭代,适配大规模3D资产批量生成的生产业务场景;6. 深度协同算法团队,跟进最新3D生成大模型架构与算法迭代,快速完成新模型的推理适配、优化打磨与生产落地,缩短算法落地周期;7. 负责3D模型推理优化工具链、底层SDK、内部推理优化平台的开发、迭代与维护,沉淀可复用的3D推理优化方案与技术规范。 Qualifications 必备要求1. 3年左右深度学习推理优化、AI模型工程化相关工作经验,计算机、人工智能、图形学相关专业,具备扎实的软件工程与深度学习基础;2. 熟练掌握Python开发,精通Linux环境下模型部署、调试与性能优化,具备独立设计、迭代和维护大规模推理系统的工程能力;3. 具备扎实的3D图形学基础,熟悉主流3D数据结构与处理流程,理解Mesh几何、UV贴图、法线拓扑、骨骼动画、三维点云等核心3D场景特性;4. 精通PyTorch等深度学习框架,熟练掌握模型推理部署与优化核心技术,具备GPU推理性能调优、问题排查、精度对齐实战经验;5. 熟悉以下至少部分核心能力:- 大模型量化、剪枝、蒸馏、推理编译加速- 自定义GPU算子开发、算子优化与适配- 3D生成模型推理链路瓶颈分析与专项优化- 多卡分布式推理、批量调度、显存内存优化- 模型格式转换与推理引擎适配(ONNX/TensorRT等)加分项- 有3D AIGC、3D生成大模型、NeRF三维重建模型推理优化落地经验;- 精通TensorRT、ONNX Runtime、TorchScript等主流推理加速引擎,有工业级大模型推理优化项目经验;- 熟悉CUDA编程、GPU底层架构,具备自定义算子开发、GPU高性能计算优化经验;- 熟悉分布式任务调度与推理架构(Ray/K8s/Celery等),有大规模批量推理系统优化经验;- 熟悉Blender等DCC工具自动化流程、3D资产处理Pipeline;- 熟悉Unity/Unreal等3D引擎资产流程,有端侧/云端3D模型适配优化经验;- 掌握C++开发,有图形学高性能计算、3D几何加速计算相关项目经验;- 熟悉ComfyUI等3D AIGC生态工具,有生成流程优化、插件开发经验。我们希望你-
标注平台后端高级工程师/专家 北京、上海 社招 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 负责自动驾驶数据产线,数据标注平台(图像/2D/点云工具方向)后端架构设计及开发,并参与需求讨论、产品设计及开发上线;2. 负责标注平台的性能、稳定性保障,并持续提升数据生产效率。 职位要求 1. 计算机相关专业,本科及以上学历;2. 扎实的golang编程基础,热爱编程、具有良好的代码风格,掌握RESTful API的开发思想;3. 具有构建分布式任务系统经验(Celery/RabbitMQ/Redis/Mysql等);4. 熟悉Linux操作系统,了解docker,能够进行日常服务的测试部署 ;5. 熟悉除golang以外的编程语言,如PHP/Ruby/JavaScript等优先;6. 较好的自学、独立解决问题、沟通及团队协作能力;加分项 :1. 熟悉分布式系统原理,海量数据处理经验者优先2. 熟悉原生和虚拟化技术,有kubernetes、ELK、granfa等的开发使用经验者优先;3. 有机器学习、自动驾驶平台使用或开发经验者优先。 投递...