大模型推理增强研究实习生-MiMo 北京 校招 实习 算法类 职位描述 我们正在寻找专注于提升大模型在科学推理领域能力的研究员,重点优化模型在人文社会科学、文学、心理学、哲学、数学、物理、生物/医学、化学、计算机科学/人工智能、工程等领域的理解与推理能力,推动大模型在复杂科学问题上的表现,使其能够解决类似人类高水平考试中的问题。岗位职责:优化模型推理能力:研究并优化大模型在数学、物理、生物/医学、计算机科学、工程、人文社科、心理学、哲学、农学等领域的推理能力。开发科学基准测试:构建科学推理任务与评测方法,衡量模型在复杂学术问题上的表现。训练数据集构建:收集和整理高质量的科学数据,以支持模型强化学习训练。多模态推理:结合文本、公式、图像、实验数据等多种数据类型,探索提升大模型科学推理能力的方案。 职位要求 任职要求:学历要求:文学、哲学、心理学、数学、物理、化学、生物、医学、工程等相关领域,本硕博均可AI能力:会使用Python,对大模型感兴趣研究能力:具备优秀的数学推理、数据分析能力,有在AI或科学推理相关领域发表论文的经验。团队协作:良好的沟通能力,能够与不同背景的研究人员合作,共同推进复杂科研项目。 投递...
大模型研究和工程实习生-MiMo 北京 校招 实习 算法类 职位描述 1.创新模型结构设计: - 参与大型语言模型核心架构设计与优化 - 探索Transformer及其变种的改进方案2. 原生多模态探索: - 研发原生多模态架构,实现文本、图像、音频等模态信息的深度融合 - 研究多模态对齐技术,实现不同模态的语义一致性3. 模型推理能力提升: - 借助强化学习+CoT,提升大语言模型推理能力 - 自研强化学习算法,搭建强化学习训练框架,设计奖励函数、构建环境、优化模型提升性能4. 大模型训练推理Infra - 开发和优化大规模分布式训练推理系统 - 优化大模型训练的内存使用和通信效率5. 科学评测体系构建: - 构建科学严谨的算法评测方法,系统评估模型的性能 - 探索模型能力的潜在机制,推动模型优化和创新 职位要求 职位要求1. 学术能力: - 精通深度学习、强化学习(RL)、自然语言处理(NLP)等领域,具备创新研究能力 -
大模型训练与推理Infra工程师-MiMo 北京 社招 全职 职位 ID:A14015 职位描述 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。 - 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。2. 模型推理基础设施开发 - 构建高效的推理框架,支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。3. 性能监控与优化 - 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。4. 跨团队协作 - 与模型研究团队密切合作,理解模型需求,定制训练和推理策略。
大模型算法研究员-MiMo 北京 社招 全职 职位 ID:A212487 职位描述 1. 创新深度神经网络设计: - 开发新颖、开拓性的深度神经网络架构,推动深度学习领域的基础研究。 - 针对多模态(文本、图像、语音等)设计优化模型,提高模型的泛化能力和应用性能。2. 科学评测体系构建: - 构建科学严谨的算法评测方法,系统评估模型的性能。 - 探索模型能力的潜在机制,推动模型优化和创新。。3. 高质量数据合成与处理: - 通过数据生成、扩充和重写等方法,创建大规模、高质量的训练数据集。 - 结合指令调优、偏好对齐等技术提升数据质量与模型表现。4. 强化学习优化: - 研究并实施基于RLHF/RLAIF的偏好对齐技术,提升模型在多领域的应用能力。 - 探索和优化主动学习、课程学习等有效的大模型训练方法。 职位要求 1. 学术能力: - 精通深度学习、强化学习(RL)、自然语言处理(NLP)等领域,具备创新研究能力。 - 在相关领域的国际顶会或期刊发表高质量论文(如 NeurIPS、ICML、CVPR、ICLR、ACL 等)。
高级后端开发工程师-MiMo 北京 社招 全职 职位 ID:A46279 职位描述 1、参与AI应用服务端面向长期目标的架构建设工作,提升服务端整体迭代效率和服务性能;2、参与AI应用服务端架构升级,设计能适应大模型、多模态算法流程高速迭代的服务架构; 3、参与关键技术问题攻关,与客户端、算法策略等团队合作,提升用户体验及稳定性; 职位要求 1、计算机及相关专业本科及以上学历,有 Golang 或 Java 实战经验,有分布式/微服务项目落地经验,有创业经验优先;2、精通 Golang 或 Java,同时具备良好的 Python 开发能力,具备优秀的编码与问题排查能力;3、熟悉分布式系统理论,有缓存、消息队列、搜索引擎等中间件实战经验;4、具备主流数据库设计与优化能力,有架构设计及技术攻关成功案例;5、具备大模型应用、Prompt Engineering 或音视频开发经验者优先; 投递...
MiMo-大模型训练框架开发工程师 北京 社招 全职 职位 ID:A142530 职位描述 - 基于 PyTorch、DeepSpeed、Megatron-LM 等技术,参与大模型训练框架的设计、开发与优化,提升模型训练的效率、稳定性与扩展性,支撑大规模模型的高效训练和部署。- 解决万卡集群中大模型训练中的关键技术难题,包括分布式训练通信、内存显存优化、数据加载与预处理加速等,保障训练高效稳定,降低资源消耗。- 开展大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能。 职位要求 - 1–5 年高性能计算 / 分布式训练 / 深度学习系统研发经验;- 熟练阅读并修改 PyTorch/DeepSpeed/Megatron-LM 核心源码,有线上调优案例;- 熟练使用 nsight/NCCL profiler 分析任务训练性能瓶颈;- 熟悉 InfiniBand/RoCEv2 网络拓扑,能独立调优 DP/TP/PP/EP 切分策略,解决大规模下通信-计算重叠问题;- 具备 Python/C++ 混合开发能力,代码洁癖+CI/CD 意识。
MiMo-大模型推理框架开发工程师 北京 社招 全职 职位 ID:A252073 职位描述 - 负责基于 vLLM、SGLang 等技术的大模型推理框架的开发工作,包括但不限于设计和实现高效的推理引擎架构,优化推理过程中的计算流程,提高推理性能,以满足不同规模大模型的实时推理需求- 复杂大模型框架性能评估和调优工作,构建并完善性能监控体系,通过实时监测训练指标,定位性能瓶颈,提出优化方案,确保在不同硬件上达到最优性能。- 负责Cuda Kernel优化,开发高性能的GPU算子, 提升大模型推理性能 职位要求 - 硕士及以上学历,计算机、软件工程、数学等相关专业,具备扎实计算机理论基础和丰富编程经验,在深度学习领域有深入研究与实践。- 精通 Python,熟练掌握至少一种深度学习框架(如 PyTorch),理解深度学习原理算法,有丰富模型开发与调优经验,能独立搭建复杂模型并优化性能。- 熟悉 C++ 和 CUDA 编程,具备代码优化能力,能针对 GPU 等硬件高效编写和优化代码,了解硬件体系结构并进行针对性优化。- 熟悉大模型推理框架的基本原理和流程,了解 vLLM、SGLang 等大模型推理框架的核心技术和实现优先- 有良好团队协作与沟通能力,能与不同背景成员有效沟通协作,责任心强、敬业热情,能承受工作压力,保证项目按时高质量交付。 投递...
MiMo算法研究员-多模态 北京 社招 全职 职位 ID:A209770 职位描述 我们在做什么?基础研究我们致力于探索和构建多模态智能的核心模块,包括但不限于:- 全能模型 (Omni Model) — 具备全面感知与深度理解能力的多模态模型- 统一模型 (Unified Model) — 结构优雅、可优雅扩展的通用架构- 世界模型 (World Model) — 能够模拟和推理真实世界的智能系统数据与训练基建(Infrastructure for Data & Training)我们与 Infra 团队 紧密协作,共同构建:- 多样化、高复杂度的多模态强化学习环境- 稳定高效的大规模训练框架- 可扩展、高质量的数据采集流水线 职位要求 我们在寻找怎样的你?- 笃信 AGI
MiMo算法研究员-音频&语音 北京 社招 全职 职位 ID:A32353 职位描述 我们在做什么?我们在通过探索 scaling 语音预训练和后训练,来让模型涌现出真正的语音超级智能。1. Data - 海量语音数据处理:建设超大规模真实语音数据发掘、采集、预处理与清洗的流水线 - 高质量语音数据处理:搭建在海量真实语音中对高质量数据进行定义、召回、标注的流水线2. Backbone & Infra - 语音原生架构:探索随着语音数据 scaling 收益上限最高的建模架构,不限于离散或者连续建模 - 高效训推框架:适配最契合语音模型架构的训练和推理框架,兼顾性能和效率3. Pretrain & Post-train - 定义语音生成式预训练:围绕可泛化的语音预训练模型展开前沿探索性研究,坚定 scaling 路线 - 强化学习后训练:为语音预训练模型的强大能力提供语音对话的交互方式,激发预训练潜力4. Evaluation & Product -
MiMo算法研究员-预训练 北京 社招 全职 职位 ID:A180229 职位描述 我们在做什么?核心预训练(Core Pre-training)我们不仅是在训练模型,更是在探索智能的本质边界。我们致力于从零构建下一代通用的智能基座:1. Backbone & Architecture - 下一代基座:Model size scaling & context length scaling - 原生多模态:设计文本、视觉、音频原生融合的统一架构,实现端到端的物理世界感知与推理。 - Co-design:坚持 Algorithm-Infra Co-design,结合底层硬件特性(Kernel/拓扑)设计架构,突破训练与推理的效率瓶颈。2. Data - 真实数据 scaling:建设超大规模多模态数据发掘、采集、清洗与配比流水线,覆盖所有人类已有数据。 - 合成数据 scaling:攻克高质量合成数据的生成与验证难题,解决数据稀缺性,提升数据知识密度、推理密度、推理长度。3. Optimization - 极致收敛:研发适应万卡集群、超大 Batch
MiMo算法研究员-后训练 北京 社招 全职 职位 ID:A06427 职位描述 我们是小米MiMo团队的 Post-train 组,专注模型对齐、可扩展强化学习、AI Agent 等前沿方向,致力于产出世界级研究成果与模型。我们拥有充足算力与真实应用场景,汇聚了一批对 AGI 怀有长期信念、追求技术深度的研究者与工程师。在开放、专注的氛围中,我们鼓励从第一性原理出发,共同探索通往更高级人工智能的路径。主要研究方向1. AI 智能体 (AI Agent) - Agent 基础能力:研发大规模、高质量的 Agent 数据合成管线,提升模型在 Code、Search 及 General Tool Use 使用等场景下的能力。 - 高级 Agent 系统:探索多智能体协作、长时记忆系统及交互环境的构建,提升模型解决复杂任务能力。2. 大语言模型推理 (LLM Reasoning) - 强化学习与推理:探索高效、稳定的强化学习算法。
大模型安全能力研究员-MiMo 北京 社招 全职 职位 ID:A41838 职位描述 我们正在构建下一代具备自主软件安全分析能力的大模型——能够独立发现操作系统、浏览器及关键基础设施中长达数十年未被检出的零日漏洞,并在无人工干预的情况下生成可执行的漏洞利用链。核心职责- 负设计并执行面向软件漏洞发现的大模型训练流程,包括预训练数据构造、指令精调与 RLHF/RLAIF;- 研究提升模型在二进制分析、源码审计、模糊测试指导等安全任务上推理能力的方法;- 构建并维护 Agentic 安全评估框架,设计覆盖 CVE 复现、零日发现、漏洞利用链生成的基准测试集;- 与红队工程师协作,对模型的进攻性能力进行双用途风险评估与控制;- 研究长上下文代码推理、跨文件调用链分析、符号执行辅助等关键技术; 职位要求 岗位要求- 计算机、网络安全等相关方向硕博学历以上,具备 CTF 参赛经历或漏洞挖掘实战经验;- 熟悉大模型训练全链路(预训练、SFT、RLHF)- 具备扎实的系统编程能力(C/C++/Rust 其一)- 了解软件漏洞原理,如缓冲区溢出、UAF、逻辑漏洞等加分项- 熟悉逆向工程、fuzzing(AFL/LibFuzzer)、符号执行- 有 LLM for code / program synthesis 研究发表- 了解
AI基础设施研发工程师(Sandbox / 容器化)-MiMo 北京 社招 全职 职位 ID:A229573 职位描述 MiMo 大模型团队正在寻找熟悉 sandbox、容器化和云原生基础设施的研发工程师,一起建设面向大规模强化学习训练的基础设施能力。随着大模型 Agent 和代码能力训练进入大规模 RL 阶段,我们需要构建稳定、安全、可扩展的任务执行环境。你将参与设计和实现 sandbox 执行系统、容器调度平台、训练任务环境、隔离与资源管理机制,为大规模 Agent 任务、代码执行任务和 RL 训练提供底层 infra 支撑。工作职责1. 设计和建设面向 RL 训练的 sandbox 执行环境,支持代码运行、工具调用、浏览器自动化、文件系统操作、网络访问控制等能力。2. 基于 Docker、Kubernetes 等技术,构建可大规模调度的容器化任务运行平台,支持高并发、多租户、可观测、可恢复的训练任务执行。3. 参与大规模 RL 训练 infra 的 scaling,包括任务分发、资源调度、环境复用、状态隔离、失败恢复、日志采集和性能优化。4.
大模型爬虫逆向工程师-MiMo 北京 社招 全职 职位 ID:A133586 职位描述 1. 结合大模型应用需求,设计和优化高效、智能化的爬虫系统,进行多源数据采集。2. 具备分布式、高并发系统经验,能突破各类技术限制实现稳定高效的数据获取。拥有扎实的Web/APP逆向工程能力,可完成复杂的定向采集任务3. 针对大模型数据预处理要求,优化爬虫数据格式和质量,提升爬取的数据对训练和推理的适用性。4. 结合大模型场景,自动化处理反爬机制变化,并提供灵活的技术解决方案。5. 与大模型研发团队紧密合作,确保爬虫采集的数据能够有效支持模型训练与应用。6. 跟进最新的反爬技术与反制策略,持续优化爬虫架构和性能。 职位要求 1. 本科及以上学历,计算机科学、人工智能、网络安全等相关专业。2. 3年以上爬虫开发及逆向工程经验,有大模型或AI相关领域的爬虫应用经验者优先。3. 精通Python或其他编程语言,熟悉爬虫框架(如Scrapy、Selenium、Playwright等)。4. 熟悉大模型训练和数据处理流程,能够根据模型需求调整数据抓取策略。5. 熟悉常见网络协议(HTTP/HTTPS)和接口抓取,能够对复杂数据进行高效提取和清洗。6. 具备良好的分析能力和解决问题的能力,能够应对复杂的反爬挑战。加分项:1. 有大规模数据抓取与处理经验,尤其是针对大模型训练数据的采集和优化。2. 熟悉数据加密与解密技术,能够破解复杂的加密算法。3. 具备AI或大模型领域的技术背景,能够理解和支持模型数据需求。我们提供:1. 具有竞争力的薪资待遇与丰富的福利。2. 与顶尖AI团队合作的机会,参与大模型应用开发与优化。3. 灵活的工作环境与技术创新的空间。4. 完善的职业发展和培训机会,助力技能提升和成长。 投递...
MiMo-大模型运营负责人 北京 社招 全职 职位 ID:A67669 职位描述 - 岗位核心定位作为 MiMo 大模型商业化运营的核心操盘手,全面负责外部业务运营体系搭建,聚焦 ToB/To 小 b 开发者生态、模型厂商合作与渠道拓展,直接对大模型业务商业化收入目标负责,支撑 MiMo 大模型生态的规模化商业落地。- 岗位JD岗位职责1. 立足 MiMo 大模型业务基础,搭建全链路商业化运营体系,涵盖 API 定价体系、计费模式、权益分级、用户转化链路等核心模块,构建可规模化、可复制的商业化方法论。2. 聚焦 API 订阅模式,优化 ToB/To 小 b 开发者服务全流程体验,提升付费转化效率、用户留存及 ARPU 值,构建可持续的商业化增长路径。3. 负责外部开发者生态的全周期运营,搭建开发者准入、赋能、激励、留存体系,通过 Agent 框架工具、场景化解决方案等生态玩法,驱动开发者活跃度与付费意愿。4. 主导头部模型厂商、行业 ISV、渠道合作伙伴的拓展与深度运营,搭建标准化合作框架、分成机制与协同流程,推动联合解决方案落地,丰富商业化收入来源。5. 深度联动产品、技术、销售团队,推动 API 产品迭代、技术能力升级及行业解决方案落地,保障商业化业务与技术、产品能力的高效匹配。
Agent 全栈研发工程师(前/后端)-MiMo 北京 社招 全职 职位 ID:A220502 职位描述 MiMo 大模型团队正在寻找熟悉前后端工程和脚本语言的研发工程师,一起提升大模型在代码生成、复杂企业级软件开发,以及 Agent 框架构建中的能力。这个岗位会横跨前端工程、后端服务、AI Coding、Agent Framework 和强化学习训练基础设施。你将参与构建真实软件工程任务、开发训练与评测环境、设计复杂企业级应用场景,并与模型训练、数据、评测团队协作,帮助模型更好地理解和生成高质量、可维护、可运行的工程代码。工作职责1. 设计和构建高质量前后端代码任务,用于提升模型的代码生成、代码修改、调试、重构和系统实现能力。2. 针对复杂企业级软件场景,沉淀真实工程任务,包括后台系统、数据看板、工作流平台、权限管理、表单系统、API 服务、业务中台、低代码 / 配置化平台等。3. 参与代码评测体系建设,设计可自动验证的 benchmark、单元测试、接口测试、端到端测试、视觉回归测试和交互行为验证。4. 基于 JavaScript / TypeScript / Python 等脚本语言,参与 Agent 框架、工具调用框架、任务执行环境和强化学习训练环境的开发。5. 构建用于 RL 训练的 Agent 任务环境,包括任务定义、状态反馈、奖励设计、执行沙箱、工具链集成、前后端联调与自动化验证等。6. 分析模型在前后端代码生成、复杂工程实现和 Agent
MiMo大模型数据采集工程师 北京 社招 全职 职位 ID:A127870 职位描述 我们在做什么:为大模型训练和评估提供高质量的数据供给。我们需要从各类公开数据源中大规模采集文本、对话、代码等多种类型的数据,部分场景涉及复杂的接口协议和安全策略分析,对工程能力和问题拆解能力有较高要求。你会参与:1. 分析目标数据源的接口协议与安全策略2. 主流 Web 安全防护机制的研究与适配3. JS 代码分析与调试,提取关键业务逻辑4. Web 协议分析与接口还原5. 移动端数据通路建设(协议分析、安全机制适配)6. 设计并开发高可用数据采集系统,完成大规模数据的清洗与结构化存储 职位要求 我们希望你具备:1. 熟悉 Python / JavaScript,有数据采集或安全研究相关项目经验2. 能独立完成主流 Web 安全防护的分析与适配3. 熟练使用 Chrome DevTools、Fiddler、Charles、mitmproxy 等调试工具4. 具备 JS 代码分析能力:能阅读混淆代码,定位核心逻辑5. 做事靠谱,能独立推进任务加分项:1. 有移动端安全研究经验(Frida、Xposed、IDA 等)2.
大模型平台运营-Xiaomi MiMo 开放平台 北京 社招 全职 职位 ID:A187545 职位描述 职位定位:负责提升平台大模型 API 的调用量与市场份额,通过运营策略、定价机制与生态建设,驱动规模化增长。岗位职责:1. 增长与用户运营:负责开发者全生命周期管理,通过数据分析优化调用体验与留存策略,推动调用量持续增长。2. 商品与定价策略:设计 API 计费模式、资源包与促销方案,平衡用户体验与商业化目标,提升转化与消耗。3. 生态伙伴拓展:发展生态伙伴,推动模型能力嵌入行业解决方案、vibe coding 类工具生态,实现场景化调用增长。4. AI 前沿趋势研究:持续追踪大模型行业技术演进、应用热点及全球竞品动态,结合趋势预判潜在的增长场景,为产品迭代和运营策略提供前瞻性输入。5. 数据体系建设:搭建调用量、活跃用户、留存等核心指标监控体系,输出分析报告,支撑产品与业务决策。 职位要求 1. 本科及以上学历,计算机、AI或相关专业优先。2. 5 年以上 to B/SaaS/AI 平台运营经验,有云厂商或 AI 公司 API 调用量增长经验者优先。3. 数据敏感,熟练使用数据分析工具,能独立从数据中发现增长机会。4. 熟悉 API
Electron 技术专家-MiMo 北京 社招 全职 职位 ID:A194946 职位描述 职位描述我们正在寻找一位熟悉 Electron 桌面端开发、AI Coding 的工程师,负责 Windows 与 macOS 端 Agent 应用的功能开发、架构设计与性能优化。你将参与桌面端 Agent 产品从架构设计、核心功能开发、跨平台适配、性能优化、稳定性建设到 CI/CD 发布体系的完整研发流程,帮助团队打造高性能、高稳定性、可持续迭代的桌面端 Agent 应用。岗位职责- 负责基于 Electron 的桌面端 Agent 应用开发,覆盖 Windows 与 macOS 平台。- 负责客户端核心功能设计与实现,包括窗口管理、本地文件访问、系统能力调用、后台任务执行、快捷键、系统托盘、自动更新等。- 参与 Electron
高级客户端研发工程师-MiMo 北京 社招 全职 职位 ID:A254354A 职位描述 岗位职责-负责 MiMo iOS / Android 客户端功能开发、体验优化与持续迭代;-参与产品需求分析和技术方案设计,与团队协作推动功能高质量落地;-围绕性能、稳定性、交互体验和工程质量,持续优化客户端整体表现;-参与客户端架构演进、基础能力建设和研发效率提升,沉淀高质量工程实践 职位要求 岗位要求-具备 iOS / Android 原生开发经验,熟悉 Swift / Objective-C 或 Kotlin / Java;-编程基础扎实,具备良好的设计能力、代码品味和工程质量意识;-对性能优化敏感,能够持续改善启动速度、流畅度、资源占用和稳定性;-对交互体验有较高追求,能够开发自然、流畅、用户友好的客户端体验; 投递...