Coco Jobs In Beijing (Peking) - 6 Job Positions Available

Top Cities:

coco jobs nationwide

coco jobs in Beijing (Peking)

1 – 6 of 6 jobs

多模态大模型算法实习生

NIO ( Beijing )

多模态大模型算法实习生北京实习数字技术职位 ID：A98571 职位描述 1.参与车舱内外视觉算法和大模型算法的研究和落地；2.参与多模态大模型的数据处理、模型训练、开发部署等工作；3.协助算法工程师进行视觉和多模态大模型前沿技术的预研工作。职位要求 1.硕士及以上的在读同学，计算机/人工智能/电子信息/自动化等专业；2.了解机器学习和深度学习相关理论知识，有pytorch深度学习框架使用经验；3.有CV/3D/VLM/VLA方向的研究或落地经验；4.有良好的工程能力以及前沿论文阅读能力；5.乐于学习，自驱力强，渴望快速成长；6.能够连续实习3个月及以上。加分项：1.有智能座舱、AI、大模型等相关行业的实习经历；2.有过相关领域的会议或期刊论文发表（CVPR、ICCV、ECCV等）；3.在相关领域的学术竞赛（ImageNet、COCO、Kaggle、Waymo等）中取得较好成绩。投递...

Premium Full-time

NIO 15 days ago

自动驾驶-算法优化工程师

Xiaomi ( Beijing )

自动驾驶-算法优化工程师北京社招全职职位 ID：A140709 职位描述 1、承担自动驾驶算法的有损优化研发，运用算法-硬件协同设计、网络结构深度优化、训练流程加速、模型量化压缩、MTP投机采样等先进通用技术，为业务团队精心打造并提供高效的训练部署最优方案与实践经验，助力业务高效推进。 2、专注于模型轻量化结构的创新设计与性能雕琢，研发在效果、模型大小、计算量以及功耗等综合性能方面均位居业界前列的预训练模型，引领技术发展潮流。 3、投入模型加速领域的研发，涵盖模型量化、投机采样、模型压缩、模型剪枝、模型蒸馏、网络架构搜索与创新设计等方向，确保模型在效果与运行速度上达到最佳平衡，满足车端需求。 4、开展模型架构的深度探索，包括但不限于Scaling Law、MoE、Transformer、高效训推框架以及基座模型训练等前沿领域，开拓技术边界，为自动驾驶技术突破提供核心支持。职位要求 1、熟悉主流自动驾驶算法，熟悉CNN，Transformer以及优化架构原理2、有AutoML、模型量化，蒸馏等相关经验3、熟悉Python开发、算法和数据结构4、具备扎实的研发功底，有在相关领域（IJCV、PAMI、CVPR、ICCV、ECCV、NIPS、AAAI 等）发表论文者优先；或在相关领域竞赛（ImageNet、COCO、Kitti、Waymo、nuScenes等等）中取得较好成绩者优先。投递...

Premium Full-time

Xiaomi 15 days ago

Upload Your Resume — Let employers contact you directly

自动驾驶基座模型（强化学习方向）

Xiaomi ( Beijing )

自动驾驶基座模型（强化学习方向）北京社招全职职位 ID：A204396 职位描述负责强化学习的框架在自动驾驶场景中的前沿算法研究，；负责强化学习的框架在自动驾驶场景中的前沿算法研究，；参与大模型基座范式下(VLA+World Model)的强化学习框架搭建；负责将大模型（AD Agent）作为基础代理，利用 RL 技术优化其在复杂自动驾驶场景中的感知、推理和长期决策能力，涵盖场景理解、语义引导决策、时空建模等核心能力，并推动大模型与安全（Safety-Critical RL）及人类偏好（RLHF/DPO/PPO for AD）的深度对齐。职位要求教育背景：计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位，或具备等效的研究经验；精通深度强化学习理论及其核心算法（如PPO, TD3, GRPO等系列）理论与实践能力：扎实的机器学习、深度学习理论基础，具有视觉理解、自然语言处理与行为决策的交叉领域研究背景；编程能力：熟练掌握Python及主流深度学习框架（如PyTorch、TensorFlow等），有高效模型训练与大规模数据处理经验；学术能力：具有在国际顶级会议（NeurIPS、ICLR、CVPR、ICCV等）上发表过论文的经验，或参与过具有影响力的学术竞赛（如COCO、Kitti、nuScenes等）；跨学科能力：具备跨学科协作能力，能够有效将计算机视觉、自然语言处理与机器人学的知识融合，推动自动驾驶机器人领域的创新；加分项：熟悉自动驾驶系统（感知-预测-规划）架构，理解 World Model 如何支持基于 RL 的规划算法（如 MCTS）具有自动驾驶平台（如CARLA、Waymo、nuScenes等）上的实验经验。投递...

Premium Full-time

Xiaomi 3 days ago

自动驾驶基座模型（VLA方向）

Xiaomi ( Beijing )

自动驾驶基座模型（VLA方向）北京社招全职职位 ID：A83060 职位描述负责VLA（视觉-语言-行动）多模态大模型在自动驾驶场景中的前沿算法研究，涵盖场景理解、语义引导决策、时空建模等核心能力；参与VLA基座模型的模型开发,数据闭环和创新型技术验证,为下一代自动驾驶技术提供基础支撑职位要求教育背景：计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位，或具备等效的研究经验；多模态研究经验：深入了解视觉-语言-行动（VLA）大模型的构建与优化方法，特别是在自动驾驶、机器人等领域的应用；理论与实践能力：扎实的机器学习、深度学习理论基础，具有视觉理解、自然语言处理与行为决策的交叉领域研究背景；编程能力：熟练掌握Python及主流深度学习框架（如PyTorch、TensorFlow等），有高效模型训练与大规模数据处理经验；学术能力：具有在国际顶级会议（NeurIPS、ICLR、CVPR、ICCV等）上发表过论文的经验，或参与过具有影响力的学术竞赛（如COCO、Kitti、nuScenes等）；跨学科能力：具备跨学科协作能力，能够有效将计算机视觉、自然语言处理与机器教育背景：计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位，或具备等效的研究经验；多模态研究经验：深入了解视觉-语言-行动（VLA）大模型的构建与优化方法，特别是在自动驾驶、机器人等领域的应用；理论与实践能力：扎实的机器学习、深度学习理论基础，具有视觉理解、自然语言处理与行为决策的交叉领域研究背景；编程能力：熟练掌握Python及主流深度学习框架（如PyTorch、TensorFlow等），有高效模型训练与大规模数据处理经验；学术能力：具有在国际顶级会议（NeurIPS、ICLR、CVPR、ICCV等）上发表过论文的经验，或参与过具有影响力的学术竞赛（如COCO、Kitti、nuScenes等）；跨学科能力：具备跨学科协作能力，能够有效将计算机视觉、自然语言处理与机器人学的知识融合，推动自动驾驶机器人领域的创新；加分项：在大规模预训练模型（如LLM、VLM、VLA等）微调、蒸馏等方面有深入研究；具有实际项目经验（如AR1等）开发经验者优先；具有自动驾驶平台（如CARLA、Waymo、nuScenes等）上的实验经验。投递...

Premium Full-time

Xiaomi 3 days ago

自动驾驶基座模型（世界模型方向）

Xiaomi ( Beijing )

自动驾驶基座模型（世界模型方向）北京社招全职职位 ID：A49702A 职位描述负责World Action Model在自动驾驶场景中的前沿算法研究，；参与World Action Model模型开发，数据闭环构建和创新型技术研发，为下一代自动驾驶技术提供基础支撑；职位要求教育背景：计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位，或具备等效的研究经验；世界模型,视觉表征学习,视觉自监督算法研究经验；对DIffusion-based和AE-based视频生成模型的原理有深刻的理解理论与实践能力：扎实的机器学习、深度学习理论基础，具有视觉理解、自然语言处理与行为决策的交叉领域研究背景；编程能力：熟练掌握Python及主流深度学习框架（如PyTorch、TensorFlow等），有高效模型训练与大规模数据处理经验；学术能力：具有在国际顶级会议（NeurIPS、ICLR、CVPR、ICCV等）上发表过论文的经验，或参与过具有影响力的学术竞赛（如COCO、Kitti、nuScenes等）；跨学科能力：具备跨学科协作能力，能够有效将计算机视觉、自然语言处理与机器人学的知识融合，推动自动驾驶机器人领域的创新；加分项：在大规模视觉预训练模型训练、蒸馏等方面有深入研究；具有实际项目经验，熟悉典型的算法V-JEPA, DINO系列；具有自动驾驶平台（如CARLA、Waymo、nuScenes等）上的实验经验。投递...

Premium Full-time

Xiaomi 3 days ago

小米汽车—自动驾驶与机器人多模态大模型算法研究专家（VLA方向）

Xiaomi ( Beijing )

小米汽车—自动驾驶与机器人多模态大模型算法研究专家（VLA方向）北京社招全职职位 ID：A210746 职位描述负责VLA（视觉-语言-行动）多模态大模型在自动驾驶和机器人场景中的前沿算法研究，涵盖场景理解、语义引导决策、时空建模等核心能力；主导VLA模型预研，构建可泛化、高可解释性的多模态基座大模型，为未来6~12个月技术演进提供基础支撑；与高校及实习生协作，探索VLA的长期发展方向，包括表征学习，具身智能、慢系统蒸馏快系统等核心议题；撰写高水平论文、技术文档，推动VLA方向在CVPR、NeurIPS、ICLR、CoRL等会议中的学术影响力。职位要求教育背景：计算机科学、人工智能、机器人学、自动驾驶或相关领域的博士学位，或具备等效的研究经验；多模态研究经验：深入了解视觉-语言-行动（VLA）大模型的构建与优化方法，特别是在自动驾驶、机器人等领域的应用；理论与实践能力：扎实的机器学习、深度学习理论基础，具有视觉理解、自然语言处理与行为决策的交叉领域研究背景；编程能力：熟练掌握Python及主流深度学习框架（如PyTorch、TensorFlow等），有高效模型训练与大规模数据处理经验；学术能力：具有在国际顶级会议（NeurIPS、ICLR、CVPR、ICCV等）上发表过论文的经验，或参与过具有影响力的学术竞赛（如COCO、Kitti、nuScenes等）；跨学科能力：具备跨学科协作能力，能够有效将计算机视觉、自然语言处理与机器人学的知识融合，推动自动驾驶机器人领域的创新；加分项：在大规模预训练模型（如LLM、VLM、VLA等）微调、蒸馏等方面有深入研究；具有实际项目经验，尤其是涉及具身多模态大模型（如RT2、OpenVLA、Octo等）开发经验者优先；具有机器人或自动驾驶平台（如MuJoCo、CARLA、Waymo、nuScenes等）上的实验经验。投递...

Premium Full-time

Xiaomi 3 days ago