多模态大模型算法实习生 北京 实习 数字技术 职位 ID:A98571 职位描述 1.参与车舱内外视觉算法和大模型算法的研究和落地;2.参与多模态大模型的数据处理、模型训练、开发部署等工作;3.协助算法工程师进行视觉和多模态大模型前沿技术的预研工作。 职位要求 1.硕士及以上的在读同学,计算机/人工智能/电子信息/自动化等专业;2.了解机器学习和深度学习相关理论知识,有pytorch深度学习框架使用经验;3.有CV/3D/VLM/VLA方向的研究或落地经验;4.有良好的工程能力以及前沿论文阅读能力;5.乐于学习,自驱力强,渴望快速成长;6.能够连续实习3个月及以上。加分项:1.有智能座舱、AI、大模型等相关行业的实习经历;2.有过相关领域的会议或期刊论文发表(CVPR、ICCV、ECCV等);3.在相关领域的学术竞赛(ImageNet、COCO、Kaggle、Waymo等)中取得较好成绩。 投递...
自动驾驶-算法优化工程师 北京 社招 全职 职位 ID:A140709 职位描述 1、承担自动驾驶算法的有损优化研发,运用算法-硬件协同设计、网络结构深度优化、训练流程加速、模型量化压缩、MTP投机采样等先进通用技术,为业务团队精心打造并提供高效的训练部署最优方案与实践经验,助力业务高效推进。 2、专注于模型轻量化结构的创新设计与性能雕琢,研发在效果、模型大小、计算量以及功耗等综合性能方面均位居业界前列的预训练模型,引领技术发展潮流。 3、投入模型加速领域的研发,涵盖模型量化、投机采样、模型压缩、模型剪枝、模型蒸馏、网络架构搜索与创新设计等方向,确保模型在效果与运行速度上达到最佳平衡,满足车端需求。 4、开展模型架构的深度探索,包括但不限于Scaling Law、MoE、Transformer、高效训推框架以及基座模型训练等前沿领域,开拓技术边界,为自动驾驶技术突破提供核心支持 。 职位要求 1、熟悉主流自动驾驶算法,熟悉CNN,Transformer以及优化架构原理2、有AutoML、模型量化,蒸馏等相关经验3、熟悉Python开发、算法和数据结构4、具备扎实的研发功底,有在相关领域(IJCV、PAMI、CVPR、ICCV、ECCV、NIPS、AAAI 等)发表论文者优先;或在相关领域竞赛(ImageNet、COCO、Kitti、Waymo、nuScenes等等)中取得较好成绩者优先。 投递...
自动驾驶基座模型(强化学习方向) 北京 社招 全职 职位 ID:A204396 职位描述 负责强化学习的框架在自动驾驶场景中的前沿算法研究,;负责强化学习的框架在自动驾驶场景中的前沿算法研究,;参与大模型基座范式下(VLA+World Model)的强化学习框架搭建;负责将大模型(AD Agent)作为基础代理,利用 RL 技术优化其在复杂自动驾驶场景中的感知、推理和长期决策能力,涵盖场景理解、语义引导决策、时空建模等核心能力,并推动大模型与安全(Safety-Critical RL)及人类偏好(RLHF/DPO/PPO for AD)的深度对齐。 职位要求 教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;精通深度强化学习理论及其核心算法(如PPO, TD3, GRPO等系列)理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器人学的知识融合,推动自动驾驶机器人领域的创新;加分项:熟悉自动驾驶系统(感知-预测-规划)架构,理解 World Model 如何支持基于 RL 的规划算法(如 MCTS)具有自动驾驶平台(如CARLA、Waymo、nuScenes等)上的实验经验。 投递...
自动驾驶基座模型(VLA方向) 北京 社招 全职 职位 ID:A83060 职位描述 负责VLA(视觉-语言-行动)多模态大模型在自动驾驶场景中的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力;参与VLA基座模型的模型开发,数据闭环和创新型技术验证,为下一代自动驾驶技术提供基础支撑 职位要求 教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;多模态研究经验:深入了解视觉-语言-行动(VLA)大模型的构建与优化方法,特别是在自动驾驶、机器人等领域的应用;理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;多模态研究经验:深入了解视觉-语言-行动(VLA)大模型的构建与优化方法,特别是在自动驾驶、机器人等领域的应用;理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器人学的知识融合,推动自动驾驶机器人领域的创新;加分项:在大规模预训练模型(如LLM、VLM、VLA等)微调、蒸馏等方面有深入研究;具有实际项目经验(如AR1等) 开发经验者优先;具有自动驾驶平台(如CARLA、Waymo、nuScenes等)上的实验经验。 投递...
自动驾驶基座模型(世界模型方向) 北京 社招 全职 职位 ID:A49702A 职位描述 负责World Action Model在自动驾驶场景中的前沿算法研究,;参与World Action Model模型开发,数据闭环构建和创新型技术研发,为下一代自动驾驶技术提供基础支撑; 职位要求 教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;世界模型,视觉表征学习,视觉自监督算法研究经验;对DIffusion-based和AE-based视频生成模型的原理有深刻的理解理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器人学的知识融合,推动自动驾驶机器人领域的创新;加分项:在大规模视觉预训练模型训练、蒸馏等方面有深入研究;具有实际项目经验,熟悉典型的算法V-JEPA, DINO系列;具有自动驾驶平台(如CARLA、Waymo、nuScenes等)上的实验经验。 投递...
小米汽车—自动驾驶与机器人多模态大模型算法研究专家(VLA方向) 北京 社招 全职 职位 ID:A210746 职位描述 负责VLA(视觉-语言-行动)多模态大模型在自动驾驶和机器人场景中的前沿算法研究,涵盖场景理解、语义引导决策、时空建模等核心能力;主导VLA模型预研,构建可泛化、高可解释性的多模态基座大模型,为未来6~12个月技术演进提供基础支撑;与高校及实习生协作,探索VLA的长期发展方向,包括表征学习,具身智能、慢系统蒸馏快系统等核心议题;撰写高水平论文、技术文档,推动VLA方向在CVPR、NeurIPS、ICLR、CoRL等会议中的学术影响力。 职位要求 教育背景:计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位,或具备等效的研究经验;多模态研究经验:深入了解视觉-语言-行动(VLA)大模型的构建与优化方法,特别是在自动驾驶、机器人等领域的应用;理论与实践能力:扎实的机器学习、深度学习理论基础,具有视觉理解、自然语言处理与行为决策的交叉领域研究背景;编程能力:熟练掌握Python及主流深度学习框架(如PyTorch、TensorFlow等),有高效模型训练与大规模数据处理经验;学术能力:具有在国际顶级会议(NeurIPS、ICLR、CVPR、ICCV等)上发表过论文的经验,或参与过具有影响力的学术竞赛(如COCO、Kitti、nuScenes等);跨学科能力:具备跨学科协作能力,能够有效将计算机视觉、自然语言处理与机器人学的知识融合,推动自动驾驶机器人领域的创新;加分项:在大规模预训练模型(如LLM、VLM、VLA等)微调、蒸馏等方面有深入研究;具有实际项目经验,尤其是涉及具身多模态大模型 (如RT2、OpenVLA、Octo等) 开发经验者优先;具有机器人或自动驾驶平台(如MuJoCo、CARLA、Waymo、nuScenes等)上的实验经验。 投递...