自动驾驶基座模型(强化学习方向) 北京 社招 全职 职位 ID:A204396 职位描述 负责强化学习的框架在自动驾驶场景中的前沿算法研究,;负责强化学习的框架在自动驾驶场景中的前沿算法研究,;参与大模型基座范式下(VLA+World Model)的强化学习框架搭建;负责将大模型(AD Agent)作为基础代理,利用 RL 技术优化其在复杂自动驾驶场景中的感知、推理和长期决策能力,涵盖场景理解、语义引导决策、时空建模等核心能力,并推动大模型与安全(Safety-Critical RL)及人类偏好(RLHF/DPO/PPO for AD)的深度对齐。 职位要求 教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;精通深度强化学习理论及其核心算法(如PPO, TD3, GRPO等系列)理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器人学的知识融合,推动自动驾驶机器人领域的创新;加分项:熟悉自动驾驶系统(感知-预测-规划)架构,理解 World Model 如何支持基于 RL 的规划算法(如 MCTS)具有自动驾驶平台(如CARLA、Waymo、nuScenes等)上的实验经验。 投递...
公司描述 Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance to
Company Description Bosch China Innovation and Software Development Campus 博世创新与软件开发中心 博世创新软件开发(无锡)有限公司针对交通出行的电动化、自动化、互联化、个性化,提供面向未来的创新技术和前沿解决方案,加速针对中国市场的技术战略的实现和发展。博世软件中心主要发展方向包括智能网联汽车、智能座舱、辅助驾驶、车路云协同、工业4.0、人工智能大数据、智能家居、嵌入式软件服务。博世中国创新与软件开发中心以软件为客户赋能,在汽车辅助驾驶、氢燃料电池、重卡电驱动桥、多合一的控制器等多个领域取得创新研发成果。 Job Description 1.在无图、sd图的情况下设计实现基于搜索、博弈等的变道算法的决策规划算法,旨在提出一种基于算法的方法来解决最佳间隙查找问题。 2.与跨职能团队密切合作,将决策规划算法集成到整个自动驾驶系统架构中。 3.分析和解决与L2++自主性相关的现实挑战,包括噪声输入、不稳定预测,以获得当前Frame下的最优结果和稳定鲁棒的决策/选空逻辑。 4.不断基于论文进行优化和增强决策规划算法,以提高整体系统效率、适应性和可靠性。 5.参与项目规划、里程碑设定和进度跟踪,以确保自动驾驶功能及时交付量产。 6.具备阅读和复制论文以解决复杂问题的能力和自我意识。Qualifications 1.计算机科学、电子工程、数学或相关专业硕士及以上学历。 2.人工智能和自动驾驶专家,精通自动变道决策算法,擅长POMDP、MCTS、强化学习(RL)和人工智能搜索方法、树、图搜索方法。 3.具有C++多线程、嵌入式系统的深厚背景。熟悉A*搜索、动态规划(DP)、多智能体系统的博弈论和图搜索/树搜索。 4.需要深入思考变道的KPI,特别是系统级KPI和子系统KPI,具备体系化、场景化的KPI的能力。 5.熟悉数值优化原理和工程实现,例如图搜索、树搜索。 6.精通C++、Python等编程语言,具有较强的算法开发和实现编码能力...