MiMo算法研究员-后训练 北京 社招 全职 职位 ID:A06427 职位描述 我们是小米MiMo团队的 Post-train 组,专注模型对齐、可扩展强化学习、AI Agent 等前沿方向,致力于产出世界级研究成果与模型。我们拥有充足算力与真实应用场景,汇聚了一批对 AGI 怀有长期信念、追求技术深度的研究者与工程师。在开放、专注的氛围中,我们鼓励从第一性原理出发,共同探索通往更高级人工智能的路径。主要研究方向1. AI 智能体 (AI Agent) - Agent 基础能力:研发大规模、高质量的 Agent 数据合成管线,提升模型在 Code、Search 及 General Tool Use 使用等场景下的能力。 - 高级 Agent 系统:探索多智能体协作、长时记忆系统及交互环境的构建,提升模型解决复杂任务能力。2. 大语言模型推理 (LLM Reasoning)