AI-System 研发实习生上海、北京校招实习研发 - 后端开发职位描述我们在做什么 MiniMax 正在构建支撑下一代 AGI 的超大规模 AI基础设施。我们管理着业界领先规模的 GPU 集群,直接面向大模型训练与推理,从 Linux 内核、高性能网络、分布式存储到云原生平台,为模型的高速迭代提供最坚实的基础设施支撑。 在这里,你写的每一行代码都可能让万卡训练任务快几个百分点,让推理延迟再降一个量级——你的工作直接影响模型迭代速度与产品体验。 开放方向(Base 上海 / 北京)1. LinuxOS & Kernel 方向 — 深入内核调度 / 内存 / IO / 网络协议栈,优化超大规模AI 集群 OS 层性能2. 高性能网络方向 — 研发
高性能网络专家北京、上海社招全职研发 - 基础架构职位描述1. 负责公司在 AI 训练、推理、数据传输等核心场景下的高性能网络系统设计与研发;2. 参与 RDMA、RoCEv2、DPDK 等高性能网络技术的落地与优化,构建极致低延迟、高带宽的通信能力;3. 设计并实现用户态网络协议栈、零拷贝通信、网络 IO 加速组件,提升多节点分布式系统通信效率;4. 跟踪主流硬件(如 SmartNIC、Mellanox/NVIDIA 网卡、PCIe 互联、NVLink)的能力,对接底层驱动进行优化调优;5. 推进高性能网络与平台系统(如训练框架、Kubernetes、RPC 框架)之间的深度融合;6. 支持网络协议分析、性能调优、故障排查等系统级问题解决,提升系统整体稳定性与可观测性;7. 编写技术设计文档和标准化规范,参与团队技术沉淀和知识分享。职位要求1. 本科及以上学历,计算机、电子工程、通信等相关专业,3 年及以上系统或网络研发经验;2. 扎实的网络协议基础,精通 TCP/IP、UDP、Socket 编程,了解 RDMA、RoCE、DPDK、XDP、eBPF、VPP 等中至少一种;3. 熟悉 Linux 网络子系统,能够进行网络协议栈相关调优、profiling 和调试分析;4. 熟练掌握 C/C++/Rust/Go 中的一种或多种,具备良好的系统设计与性能优化能力;5. 对高性能分布式计算或大规模 AI 系统有理解,熟悉分布式训练、AllReduce 等通信模式优先;6.
NVIDIA is seeking for an experienced Software Engineer with a strong background in networking and virtualization technologies. This full-time position requires close collaboration with other NVIDIA SW and SW architecture teams, pre-sale teams and different industry