【26届校招】Research Engineer深圳、上海、北京、中国香港正式互联网 / 电子 / 网游智能机器人板块职位描述1、面向机器人真实场景,负责具身多模态大模型的工程化与规模化落地,包括大规模训练性能与效果优化,模型工程化与效果优化,端侧与异构部署加速,机器人系统集成。职位要求职位要求1、计算机、电子工程、人工智能等相关领域硕士及以上学历;2、具有丰富的模型工程/训练平台/部署经验,熟悉大规模训练栈:大规模训练加速,训练观测与剖析,推理加速与压缩,端侧与异构部署加速,推理与服务框架等;3、精通 Python/C++ 与 Linux/网络/性能分析;熟悉 PyTorch/TensorFlow 至少一种;4、具备推理与端侧部署经验(TensorRT/ONNX 等)、容器与编排(Docker/K8s)、服务化与可观测性体系;5、良好的跨团队沟通协作与项目推进能力,能在研究‑工程‑平台多方之间对齐目标与节奏。加分项1、计算机、电子工程、人工智能、机器人等相关领域博士学历;2、有基座模型Infra经验,或者知名开源训练框架项目的核心贡献者; 有机器人开发经验(ROS/ROS2、传感器/外设接入);3、具有优秀的代码能力,如ACM/ICPC、NOI/IOl、Top Coder、Kaggle等比赛获奖者;4、具备解决复杂问题的经验,并能比较各种解决方案,并根据不同的视角确定前进方向。投递...
【26届校招】大语言模型后训练算法工程师(Foundation Model)上海、深圳正式智能制造 / 工业互联网 / 工业自动化 - 研发智能机器人板块职位描述我们正在寻找对大语言模型后训练(Post-training)整体效果调优和推理(inference)效能提升充满热情的算法工程师。您将加入我们的核心研发团队,主要负责将团队自行开发/训练的Dense & MoE 模型在后训练阶段提升通用表现(i.e. MMLU, GSM8K, Ifeval, MTBench, etc)。另外,推进监督微调(SFT)、强化学习 (LLM-RL)等架构设计与部署,以及相关基础设施(Infra)的优化。我们的目标是推出对标开源SOTA表现的自研模型,加速模型在人形机器人、自动驾驶、多模态等前沿领域的落地。工作职责:1. LLM 微调与应用落地:负责设计并进行 LLM 的监督微调(SFT)和强化学习(如 RLHF)等实验,以提升模型在特定应用场景(如代码生成、复杂推理、对话)的表现。主导模型效果的评估体系搭建和优化,确保模型输出的准确性、安全性和一致性。2. 云端训练框架与效率优化:主导 LLM 微调(SFT/RFT)流程在云端环境下的效率优化,包括数据加载、多机通信、资源调度、框架稳定性等方面,确保 SFT 流程的高效、稳定和低成本运行。3. 跨团队协作:与数据和产品团队紧密合作,一同擬定交付標準,并收集应用层的反馈来指导下一轮模型迭代。职位要求岗位需求1. 教育背景: 计算机、人工智能、软件工程等相关专业本科及以上学位。2. 模型实战经验: 具备 LLM(如 LLaMA, GPT, Qwen
资深平台运维SRE工程师上海互联网 / 电子 / 网游技术岗位职位描述1. 系统架构与业务稳定性保障:负责参与Kubernetes云原生部署、优化及日常运维,参与架构评审;从可运维性、可靠性、可观测性、基建成本等角度提出专业建议,保障系统与业务的稳定运行。2.Oncall与流程建设:具备Oncall意识,参与线上Oncall流程;深入理解和执行运维规范、变更流程、故障处理流程;对日常Case具备Owner意识,主动提出优化建议并能够推进落地,提升团队协作效率。职位要求 - Linux平台3-8年运维或SRE工作经验,有强烈的责任心和Owner意识,能够独立思考和解决问题 - 云原生: 深入理解Kubernetes架构原理,有大规模Kubernetes集群(生产环境200+节点)的运维经验;熟悉Docker容器技术,理解网络、存储、安全等相关原理;有云原生项目架构规划及落地经验。具备AWS、阿里云、火山引擎等多云厂商的生产运维经验,对常见云产品(SaaS、PaaS、FaaS等)有较深入理解。 - 编程能力: 熟练使用Shell/Python/Golang中的至少两种语言,能够独立完成自动化工具、Operator或运维平台的开发. - Devops理念: 以自动化运维为导向,具备CI/CD流水线(GitLab CI/Jenkins/ArgoCD)实践能力,通过工具驱动运维效率持续提升 - 可观测建设: 有Prometheus、Grafana、Loki、ELK、Jaeger等开源监控、日志、链路追踪组件的在生产环境的使用经验. - 安全意识: 熟悉TCP/IP、HTTP/HTTPS协议,对负载均衡、DNS、安全组、WAF等有实际配置经验;对运维安全有一定理解,能够在运维层面落实安全基线。 - 综合能力: 对新技术有热情、具备良好的自主学习能力,关注云原生生态发展,能够独立思考和技术选型、逻辑思维严谨,技术理解力强,能够从原理层面分析问题做出合理判断、良好的文档编写能力和团队协作精神加分项: - 独立负责过中大型项目运维SRE经验优先 - 有一线互联网大厂的运维SRE经验优先 - 有AIOps、FinOps、ChatOps中一个或多个落地实践经验优先投递...
【日常实习】AI Agent 系统平台工程师上海、深圳、杭州实习研发日常实习职位描述岗位使命作为系统平台工程师,你将深度参与支撑AI Agent全生命周期的核心运行时系统与开发框架平台的研发工作。你将在资深系统工程师的指导下,接触并实践高性能Agent Runtime引擎、工具调用框架、可观测性体系等工程化前沿课题,在真实的大规模分布式系统环境中磨砺系统设计与工程实现能力,获得高速成长。核心职责1. Agent运行时模块开发与调试协助开发Agent Runtime的核心功能模块,包括生命周期管理、上下文窗口管理、任务状态持久化等基础能力,参与模块单元测试、集成测试与线上Bug排查修复。2. 工具链与插件框架建设参与在导师指导下,参与Tool/Plugin注册与调用框架的功能迭代,协助完善动态工具发现机制、权限控制逻辑及沙箱隔离执行方案,负责相关模块的文档撰写与测试用例补充。3. Agent编排与工作流支撑协助基于LangGraph/AutoGen等框架完善Agent编排引擎的局部功能,参与多智能体协作调度流程的调试与优化,支撑工作流DAG定义与动态任务路由逻辑的工程实现。4. 可观测性体系建设协助参与Agent全链路可观测性基础设施的建设,协助接入Tracing/Logging/Metrics采集管线,协助开发Agent执行轨迹的可视化分析工具,支撑系统稳定性监控需求。5. 技术调研与工程支撑持续跟踪Agent基础设施、MCP/A2A协议、云原生编排等领域的最新进展,输出有实质内容的技术调研报告,为团队架构演进提供参考输入。职位要求基础技术能力1. 熟练掌握至少一门编程语言(Python/Go/Java均可),代码风格规范,具备独立完成功能模块开发的能力2. 了解分布式系统基本概念(如消息队列、服务调用、状态管理等),有相关课程学习或项目实践经验3. 了解Docker/Kubernetes基本使用,能够在容器化环境中部署和调试服务4. 了解大语言模型基本原理及主流API调用方式,有Agent框架(LangChain/LangGraph/AutoGen等)的基础使用经验者优先学业与时间要求1. 在读本科(大三及以上)或硕士研究生,计算机、软件工程、信息工程等相关专业2. 每周可保证 至少4天 稳定工作,实习周期 3个月以上3. 具备良好的自驱力与文档习惯,能独立拆解任务并按时交付加分项1. 有Kafka/Flink/Spark/Ray等大数据或流计算系统的学习或使用经验2. 有AI Coding工具(Cursor/Claude Code/Copilot等)的实际工程使用习惯3. 有开源项目贡献记录或活跃的GitHub主页4. 对系统性能优化、高并发架构设计有浓厚兴趣投递...
【暑期实习】AI Agent 系统平台工程师上海、深圳、杭州实习研发27届暑期实习职位描述岗位使命作为系统平台工程师,你将深度参与支撑AI Agent全生命周期的核心运行时系统与开发框架平台的研发工作。你将在资深系统工程师的指导下,接触并实践高性能Agent Runtime引擎、工具调用框架、可观测性体系等工程化前沿课题,在真实的大规模分布式系统环境中磨砺系统设计与工程实现能力,获得高速成长。核心职责1. 专题课题独立攻关认领一个与Agent运行时或平台框架强相关的工程专题课题(如:Agent长程任务断点恢复机制设计与实现、基于LangGraph的多智能体编排引擎性能优化、Tool调用安全沙箱隔离方案原型验证、Agent全链路Tracing可观测性体系建设等),在导师指导下完成端到端的方案设计与工程实现。2. 核心平台能力建设参与深度参与Agent Runtime或开发框架的关键模块研发,包括但不限于:状态持久化存储、Token预算管理策略、上下文压缩算法、工具调用链路优化、Agent执行轨迹分析等,产出可集成上线或可复用的代码成果。3. 系统性能评估与基准测试设计合理的基准测试方案,建立延迟、吞吐量、资源利用率、可靠性等量化评估指标,对所负责模块进行系统性性能验证与瓶颈分析,输出完整的性能报告与优化建议。4. 开发者体验与SDK建设参与Agent SDK/CLI/API的模块化封装工作,协助完善开发者文档与最佳实践规范,从开发者视角提出并落地提升框架易用性的具体改进方案。5. 前沿技术探索与创新输出结合课题方向,主动调研MCP/A2A协议标准化、云原生Agent调度、Agent评估体系(SWE-Bench/TAU-Bench等)等最新进展,提出具有创新性的工程方案,鼓励在实习期间产出技术分享、开源贡献或论文/专利思路。职位要求基础技术能力:1. 熟练掌握至少一种系统级语言(Go/Java/Rust之一)或Python,具备扎实的编程功底与独立完成完整项目的工程能力2. 理解分布式系统核心概念(分布式一致性、消息队列、状态管理、高可用架构等),有相关系统(Kafka/Flink/Spark/Ray/Redis等)的实际使用或开发经验3. 熟悉Docker/Kubernetes基本原理与操作,有微服务或云原生环境下的系统部署与调试经验4. 了解至少一种主流AI Agent框架(LangGraph/AutoGen/LangChain/Strands等)的设计理念,理解工具调用、工作流编排、记忆管理等核心机制5. 了解大语言模型推理服务基本原理,有RAG系统或向量数据库使用经验者优先学业与时间要求:1. 在读本科(大三及以上)、硕士或博士研究生,计算机、软件工程、信息工程等相关专业2. 可连续全职实习 3个月以上,保证每周出勤4天以上综合素质1. 对构建高可靠、可扩展的Agent基础设施平台充满热情,有强烈的工程质量意识与结果导向2. 具备出色的跨团队沟通能力,能与AI算法工程师、平台工程师和业务团队高效协作3. 有良好的技术文档写作能力,能清晰表达系统设计思路、接口规范与实验结论4. 能快速适应AI Agent领域的高速技术迭代,对将分布式系统经验迁移至Agent基础设施这一全新领域充满探索欲加分项1. 有从0到1设计并实现某一分布式系统组件、Agent框架模块或平台基础设施的完整经历2. 熟悉Agent评估体系(SWE-Bench/TAU-Bench等),有自动化评测集构建或基准测试经验3. 有AI Coding工具(Claude Code/Cursor/Codex CLI等)的深度工程使用经验,具备AI辅助开发的工程化思维4. 在开源社区有高质量项目贡献(尤其是Agent框架、分布式系统或大数据领域)5. 了解GPU集群管理或模型推理优化(vLLM/TensorRT等)的基本原理6. 熟悉多语言技术栈(Go + Python为佳),有跨语言异构系统的设计或集成经验7.
AI Agent系统平台工程师 - Agent运行时与框架体系方向深圳、上海、杭州全职研发职位描述岗位使命负责构建支撑AI Agent全生命周期的核心运行时系统与开发框架平台。你将站在大模型工程化落地的最前沿,设计并实现高性能、高可用、可扩展的Agent运行时引擎、编排调度核心、工具调用框架及可观测性体系,为上层业务Agent提供稳定、高效、安全的底层基础设施与开发范式。如果你拥有大数据/分布式系统基础设施的深厚背景,并对将大模型能力转化为可规模化运行的Agent系统充满热情,这正是属于你的机会。核心职责1. Agent运行时系统(Runtime)设计与研发:负责Agent Runtime内核的设计、研发与性能优化,涵盖Agent生命周期管理、状态持久化、上下文窗口管理、长程任务执行与断点恢复等核心能力,保障智能体核心引擎稳定高效运行。2. Agent编排框架与工作流引擎:基于LangGraph/AutoGen/Strands等主流框架理念,设计并实现Agent编排引擎,支持多智能体协作调度、复杂状态机与工作流DAG定义、动态任务路由与负载分发,构建统一的Agent执行通道抽象。3. 工具链与基础设施底座:构建Tool/Plugin注册与调用框架,支持动态工具发现、权限控制、安全沙箱隔离执行;设计大规模Sandbox系统与公司级Agent Tool网关,保障多租户场景下的安全与资源隔离。4. 大规模Agent系统集成与性能优化:深度结合分布式计算、流处理与高并发系统设计经验,优化端到端LLM推理调用链路,实现Token预算管理、上下文压缩、提示词缓存与模型路由策略,持续降低系统延迟与成本。5. Agent可观测性与治理体系:建设全链路可观测性体系,覆盖Tracing、Logging、Metrics及Agent执行轨迹追踪与分析;构建Agent行为合规检测、Prompt漂移监控及自动化质量评估与回归验证管线。6.开发者平台与SDK建设:模块化输出Agent开发套件,封装API/SDK/CLI,降低业务团队Agent构建与调优门槛;定义并维护Agent开发规范与最佳实践,支撑业务场景快速集成与规模化交付。7. 前沿技术探索与架构演进:持续跟踪业界Agent基础设施、MCP/A2A协议、云原生编排等方向的技术进展,推动新技术在平台中的规模化落地,持续迭代架构以适应不断增长的智能体规模与复杂度需求。职位要求必备技术能力1. 精通至少一种系统级编程语言(Go/Java/Rust)与至少一种AI/脚本语言(Python),具备扎实的编程功底与优秀的系统设计能力;2. 具备3年以上分布式系统或大数据基础设施(如Kafka、Flink、Spark、Ray、HDFS、消息队列等)的设计开发经验,深刻理解分布式一致性、状态管理、高可用架构与弹性伸缩等核心概念;3. 熟悉Docker/Kubernetes等云原生技术栈,具备微服务架构、服务网格(Service Mesh)、容器编排、CI/CD流水线的工程实践经验;4. 熟悉至少一种主流AI Agent开发框架(LangGraph/AutoGen/LangChain/Strands等)的设计理念与底层实现,理解Agent工作流编排、工具调用、记忆管理等核心机制;5. 理解大语言模型(LLM)基本原理与推理部署流程,有RAG系统、向量数据库或模型服务化的工程经验;6. 具备良好的系统抽象能力与组件化设计思维,熟悉事件驱动架构、插件化架构等常见架构模式。经验背景:1. 在大数据平台、分布式调度系统、云原生PaaS平台或高并发消息系统等相关领域有项目实践经验者优先;2. 有Agent运行时系统、Agent平台基础设施或LLM推理服务平台的设计开发经验者优先;3. 熟悉多租户系统设计,具备大规模系统部署、性能优化与容量规划经验;4. 有AI Coding工具(如Claude Code、Cursor、Codex等)的深度使用经验,具备AI辅助开发的工程化思维综合素质:1. 具备优秀的系统抽象、问题拆解与工程架构能力,对构建高可靠、可扩展的Agent基础设施充满热情2. 拥有出色的自驱力、学习能力和跨团队沟通协作能力——你将同时与算法团队、平台工程团队和业务团队深度合作3. 能够快速适应AI Agent领域的高速技术迭代,在快节奏环境中持续学习并输出高质量工程成果4. 对将大数据/分布式系统经验迁移至AI Agent基础设施这一全新领域充满探索欲与使命感加分项1. 有从0到1构建Agent开发框架、Agent运行时或智能体平台的核心架构经历2. 熟悉Agent评估体系(如SWE-Bench、TAU-Bench等),有自动化评测集构建经验3. 了解强化学习(RL)训练基础设施(采样、Reward、回放、训练闭环),有与算法团队协作优化Agent能力的工程经验4. 在开源社区有高质量项目贡献(尤其是Agent框架、分布式系统或大数据领域)5.
工程开发实习生上海、北京实习技术 - 软件工程职位描述1、为智驾大模型进行软件/产线/基建的架构设计和工程开发,建设一体化和规模化的Data Infra解决方案,提升模型数据的数量、质量和多样性,推动算法的高效演进2、协同感知/规控算法团队,构建面向智驾大模型的海量数据闭环体系,覆盖数据采集、处理、挖掘、应用的端到端全链路职位要求核心要求:1、本科及以上学历,计算机、电子、软件工程、通信、自动化等相关专业2、熟练掌握Python或C++程序设计语言3、有系统设计/大数据处理/数据库/分布式计算等工程方向研发经验4、熟悉Spark/K8S/Redis/Flink/Docker/Git优先条件:1、有机器学习的数据/基建等相关经验者优先2、有机器学习模型算法等相关经验者优先3、有自动驾驶行业相关经验者优先投递...
全栈工程师上海工程类硕士及以上3-5 年职位描述1.前后端开发:使用 HTML、JS 结合 React 或 Vue 等框架完成前端开发;运用 Python 搭配 Django、Flask 等后端框架构建后端服务,负责数据库设计、API 开发及基础功能模块实现;2.爬虫与数据处理:利用 Scrapy 等框架进行数据抓取,处理各类反爬虫机制;完成抓取数据的清洗、预处理,并根据需要进行数据标注工作,为后续业务提供优质数据支持;3.测试运维:执行单元测试、集成测试等全流程测试工作,包括CICD pipeline构建等;负责 AI agent 及相关平台的日常运维,能使用 Linux 进行服务器管理,通过 Docker 实现容器化部署与自动化运维。职位要求1. 熟练掌握至少1门前端或后端编程语言,有软件开发项目经验;2. 具备良好的问题分析和解决能力;3. 责任心强,学习能力强,具备良好的沟通及团队协作精神;4. AI 技术应用(加分):具备主流大模型、常见AI工具使用经验,能将 AI 工具融入业务流程,探索创新应用场景。职位信息部门: 数字基础设施部投递...
When joining PerkinElmer, you select an experienced and trusted leader in scientific solutions, with the support of a global service network and distribution centers, providing the right solution, at the right time, to meet critical customer
定位算法实习生苏州、上海实习研发 - 算法日常实习生职位描述负责标定算法在交付量产过程中的研发适配、实验探索及评测分析,包括:-量产静态标定方案适配性分析、方案优化及研发适配- 量产动态标定算法研发适配、新方案探索及算法问题分析调查- 算法评测及分析工具的开发与优化等职位要求1、具备计算机视觉、SLAM、多视图几何、三维重建等相关基础知识;2、熟练使用C++/python进行软件开发与验证; 具有良好的编程习惯,了解基本的编程算法和计算机原理;3、对Linux环境下日常开发操作熟练,会使用docker,shell等工具;4,实习4个月及以上,每周不少于4天,长期实习优先。投递...
工程开发实习生急招上海、北京实习互联网 / 电子 / 网游 - 研发日常实习生职位描述1、为智驾大模型进行软件/产线/基建的架构设计和工程开发,建设一体化和规模化的Data Infra解决方案,提升模型数据的数量、质量和多样性,推动算法的高效演进2、协同感知/规控算法团队,构建面向智驾大模型的海量数据闭环体系,覆盖数据采集、处理、挖掘、应用的端到端全链路职位要求核心要求:1、本科及以上学历,计算机、电子、软件工程、通信、自动化等相关专业2、熟练掌握Python或C++程序设计语言3、有系统设计/大数据处理/数据库/分布式计算等工程方向研发经验4、熟悉Spark/K8S/Redis/Flink/Docker/Git优先条件:1、有机器学习的数据/基建等相关经验者优先2、有机器学习模型算法等相关经验者优先3、有自动驾驶行业相关经验者优先投递...
DevOps集成工程师/专家(CI/CD)杭州、上海全职研发 - 电子 / 半导体职位描述1.参与DevOps平台建设和维护,设计和研发相关自动化工具,包括持续集成(CI)和持续部署(CD)流程;2.管理和维护DevOps工具链,包括但不限于Jenkins、GitLab、Docker、Kubernetes等。3.实现测试和部署流程的自动化,提高代码质量和交付速度,保证代码集成和镜像编译。4.参与自动化框架的设计和实现前端需求。 职位要求1.计算机科学、软件工程或相关领域的本科及以上学历。2.至少3年以上软件开发或DevOps相关工作经验。有丰富的CI/CD、自动化测试和代码质量管理经验。熟悉软件开发流程及管理体系优先。3.具备前端开发经验UVE 或者react,Graphana的优先。4.具备良好的 python, shell 编程能力,熟悉Linux指令,可通过自主开发串联工具链中的缺失部分,完成开发自动部署脚本等。5.精通Robot、Jenkins或LAVA等测试自动化框架、持续集成框架;6.熟悉运维及DevOps相关工具链的使用,熟悉Gitlab CICD优先。投递...
Scopely’s Security Team seeks a Security Engineer to improve the security stance of our infrastructure and production environments. Scopely Engineering leads the development and operation of multiple successful mobile games. We seek creative engineers with excellent
自动驾驶应用软件开发实习生北京、上海社招实习互联网 / 电子 / 网游 - 研发职位描述1. 负责智能驾驶软件研发工作;2. 熟悉智能驾驶的基础软件,包括中间件、数据回流,故障诊断、状态机等3. 熟悉现代软件开发流程,改善开发工具,提高开发者效率;4. 挖掘和诊断自动系统里面的关键问题,提出改进意见;5. 系统架构设计和改进,提高系统性能,可拓展性和可监测性。职位要求1. 计算机、自动化、数学等相关专业, 本科以上学历;2. 熟悉C++/C或Python,了解Linux, 扎实的算法和数据结构知识;3. 熟悉docker,熟悉现代的开发流程;4. 熟悉Linux/Uinx操作系统基础原理,熟悉常见的软件性能评价及优化手段;5. 熟悉智能驾驶软件架构,有ADAS相关算法经验者优先,熟悉ADAS功能(ACC, LCC, NOA)者优先;6. 良好自主学习能力,具备复杂软件架构和设计的能力(加分) 量产辅助驾驶相关经验(加分) 有大型项目经验投递...
Company Description Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance
后端开发工程师上海、北京、杭州全职互联网 / 电子 / 网游 - 研发职位描述- 负责后端服务开发、维护和文档编写- 负责公司后端平台的日常维护和升级- 完成公司边缘计算服务的开发职位要求- 具备3年以上的后端开发经验,有良好的计算机基础,熟悉常用算法- 至少熟练掌握一种后端语言及开发框架,熟悉Java,Golang优先- 熟悉常用的linux命令,对TCP\HTTP相关网络协议有深入了解- 良好的编程习惯,有代码洁癖者优先!- 熟练掌握sql,nosql数据库,mysql\pgsql\redis\mongodb- 有分布式服务开发及维护经验,有高并发经验- 有docker及k8s的使用经验- 熟练掌握git或其他项目管理工具- 工作认真负责,具备良好的团队协作精神,具有Geek精神投递...
软件研发工程师-数据闭环方向(星程长计划)上海、北京正式职位描述参与设计与开发自动驾驶数据闭环平台,助力提升自动驾驶算法的性能与效果;构建与优化数据流的自动化处理和管理流程,为算法的迭代验证与评估提供高效支持;负责平台开发,覆盖数据采集、存储、仿真、评估等关键环节,确保系统的高效性和稳定性;优化数据闭环流程,提升数据使用效率,推动自平台效能的持续提升;开发与维护仿真测试工具,支持自动驾驶场景的高效模拟与算法评估;监控与优化平台性能,定位并解决后端技术问题,分析系统瓶颈并持续优化后端架构与性能。职位要求计算机科学相关专业,本科及以上学历;熟练掌握至少一种后端开发语言(如 Go、Python、C++等),具备实际开发经验;熟悉后端框架及微服务架构设计,能够设计高效、可扩展的后端系统;了解 MySQL、PostgreSQL、MongoDB 等数据库技术,熟悉数据处理工具;了解 Docker、Kubernetes 等容器化技术,有相关经验者优先;具备优秀的逻辑思维能力,能够快速理解业务需求并转化为技术实现;具有良好的团队协作能力,能够与多团队密切配合完成复杂项目;对自动驾驶技术充满热情,具备较强的学习能力与自驱力。加分项:拥有自动驾驶相关实习经验或科研项目经验;在开源社区有相关贡献,或有技术博客分享经验投递...
SRE运维研发工程师-云原生上海、北京社招全职研发 - 运维职位描述1.负责 Minimax 线上 K8S及云原生周边系统的运维保障和工具开发;2.负责公司内部大规模 K8S 集群的建设和稳定性保障;3.负责监控/日志/网络/存储等原生基础设施的保障和工具开发;4.负责业务容器化部署、互联互通以及疑难问题的排查解决;5.参与 OnCall 值班,第一时间响应并与研发团队共同解决各类突发事件,保障核心系统的稳定性。职位要求1.大规模 k8s 系统的建设和运维经验,熟悉linux、网络等系统运维的技能;2.对大规模分布式集群的部署架构设计,分析,故障排查有强烈兴趣;3.熟悉 Docker/Kubernetes 容器生态核心开源项目和周边服务生态项目,如监控、日志、网络等方案,精通或者有实施经验。加分项:1.具有 k8s 二次开发经验,有自定义 operator 的开发经验,或者csi/cni插件的经验;2.对 k8s 调度系统深入研究,熟悉 volcano,kueue 等组件;3.具有大规模GPU集群运维经验投递...
运维工程师上海全职互联网 / 电子 / 网游职位描述1. 负责公司业务系统、服务器、网络及相关基础设施的日常运维,保障系统稳定、安全运行。2. 负责 Linux 服务器、基础环境、数据库及中间件的部署、配置、维护和故障排查。3. 负责应用系统上线发布、版本升级、回滚及生产环境运行保障。4. 负责监控告警、系统日志分析、备份恢复、安全加固及漏洞修复等运维工作。5. 参与高可用、容灾、主从复制、双/多机房切换等方案的实施、验证和优化。6. 负责交换机配置、网络连通性、端口访问、反向代理、四层/七层转发等相关问题排查。7. 编写运维脚本、部署文档、巡检文档和故障分析报告,推动运维自动化和标准化建设。8. 配合开发、测试、项目交付及客户现场支持,解决项目实施和运行中的各类技术问题。职位要求1. 熟悉 Linux 操作系统,能够独立完成系统部署、服务管理、性能分析和故障排查。2. 熟悉 Docker、Docker-compose、Nginx、PostgreSQL、Redis 等常见技术组件。3. 熟悉 Shell 或 Python 脚本编写,能够编写自动化运维脚本。4. 能够排查服务器、应用、数据库及网络链路相关问题,具备较强的问题定位和应急处理能力。5. 具备网络基础知识,熟悉 TCP/IP、路由交换、防火墙、NAT、负载均衡、VPN、DNS 等常见网络原理。6. 有高可用、容灾、系统安全加固、漏洞修复、客户项目交付经验者优先。7. 具备良好的沟通协调能力、文档输出能力和团队合作意识。投递...
机器学习系统研发工程师-2026 届上海、北京校招正式互联网 / 电子 / 网游 - 研发2026届校园招聘职位描述1. 参与 MiniMax 机器学习平台的研发,设计和实现机器学习相关的基础设施/算法框架/工具链等,关注机器学习研发过程的稳定性、资源利用率等问题;2. 基于机器学习系统、云原生、云计算架构等多个角度做技术问题解决和探索;3. 覆盖机器学习系统多个子方向领域的工作,包括:资源调度、任务编排、模型训练、模型管理、数据集管理、工作流编排、ML for System等;职位要求1. 熟悉Linux平台下的分布式系统的开发及运维;2. 具有Golang/Python/C/C++等一种高级语言开发经验;3. 熟悉计算机组成、操作系统原理;4. 熟悉分布式系统原理,参与过大规模分布式系统的设计、开发和维护优先;5. 熟悉容器技术,具有Docker、Kubernetes开发或使用经验6. 有机器学习平台研发经验, 有大规模训练任务和推理服务的编排、在离线混部及资源调度经验者优先7. 了解 Pytorch/Tensorflow/JAX/PaddlePaddle/Mindspore等机器学习框架、GPU/NPU/ARM等最新异构计算系统与架构、RDMA高性能网络, 有相关系统研发经验者优先投递...