Python 后端开发实习生北京实习互联网 / 电子 / 网游 - 研发日常实习生职位描述1、负责模型推理部署平台后端服务的开发与维护(API 开发、数据处理、服务集成等)2、参与平台前端对接,配合完成接口联调3、编写单元测试,完善技术文档职位要求1、硕士及以上学历,计算机及相关专业,2027 届及以后毕业2、每周实习至少 4 天,实习期 6 个月以上,Base 北京3、熟练掌握Python,熟悉至少一种 Web 框架(FastAPI/Flask/Django)4、熟悉MySQL/PostgreSQL 至少一种数据库,了解 Redis5、熟悉Linux 环境,熟练使用 Git、Docker6、具备良好的代码规范和团队协作意识加分项:1、有模型推理部署、MLOps 平台或云平台相关项目经验2、熟悉Kubernetes,有容器化部署经验3、有开源项目贡献或技术博客投递...
Company Description About Grab and Our Workplace Grab is Southeast Asias leading superapp. From getting your favourite meals delivered to helping you manage your finances and getting around town hassle-free, weve got your back with everything.
运维开发/SRE实习生北京、苏州实习互联网 / 电子 / 网游日常实习生职位描述岗位职责:1、负责各产品线服务的稳定、高效运行,跟踪用户体验,优化运维架构;2、及时响应各类故障报警,快速解决问题恢复业务;职位要求岗位要求:1、计算机相关专业,就读于211/985院校,可稳定工作6个月及以上,每周出勤不少于4天;2、熟练掌握 Linux 基本操作和相关命令,了解 Linux 操作系统基本原理;3、熟悉 Elk、Prometheus、Grafana 等监控日志工具使用;4、熟悉虚拟化和容器技术,如 Esxi、Docker、Kubernetes,了解其原理并能够熟练配置;5、熟悉 Python 开发及常用 web 框架的使用,如 Flask、SQLAlchemy 等,能够熟练进项项目编码;6、对 Kubernetes 有深入了解者优先投递...
自动驾驶仿真算法实习生北京实习职位描述1.利用实车路测数据构建仿真场景,建设不合理场景干预、均景泛化、长尾场景生成与评估等能力2.参与搭建高精度车辆动力学模型,支撑自动驾驶算法在仿真集群的大规模闭环验证3.参与新一代自动驾驶仿真模拟器预研,设计并开发高效的端到端VLM/VLA闭环训练框架职位要求1.硕士及以上学历,计算机/软件工程/自动化/人工智能/计算机视觉等相关专业,具备扎实的数据结构和算法基础2.具备扎实的C++/Python编程能力,至少掌握一种主流机器学习框架(如PyTorch、TensorFlow)3.每周至少实习3-5天,实习期不少于3个月4.同时满足以下至少一项技术要求a.熟悉智能交通流仿真/SmartAgent,了解自回归、Diffusion等技术术在高保真、可控交通流仿真场景生成上的应用,能结合真实场景数据进行模型训练与验证b.熟悉强化学习算法及其在自动驾驶领域的应用,具备使用强化学习问进行仿真训练和优化的实际经验c.不错的工程能力,了解Kubernetes、容器编排、分布式部署或云原生工具链以及常见的消息中间件,如Kafka、RabbitMQ、gRPC或ROS等d.熟悉车辆运动学和动力学原理,了解Carmaker、Carsim、Simulink等主流商业化动力学仿真软件e.具备不错的图形渲染知识,熟悉渲染管线、光线追踪等基本原理,了解Diffusion、Cosmos、StyleGAN等图像域迁移方法,并具备实际落地应用经验者优先5.加分项a.熟悉自动驾驶场景领域相关的算法技术,如感知、预测、规空、端到端、数据合成等b.在相关领域的顶会/顶刊上发表过论文(e.g.,SIGGRAPH,CVPR, ICCV, ECCV, TPAMI, ICLR, ICML, NeuriPS, etc.)c.对World Model、视觉语言模型(VLM)、强化学习(RL有深入理解或实际项目经验者投递...
We are looking for an experienced system engineer, who will play a dual role on the NVIDIA Enterprise Experience (NVEX) team. An awesome candidate is highly technical who can triage customer software issues and resolve customer
SRE高级工程师北京全职研发 - 后端开发职位描述1、致力于打造高扩展、高可用的分布式系统2、保障云原生下各个服务之间的稳定运行,保障设计到上线的整个生命周期内保障系统可靠性3、提供大型系统的自动化运维方案4、建立良好的观测性、性能指标帮助团队快速定位故障5、提升服务的可靠性、可扩展性以及成本、性能优化,保障系统 SLA6、基于业务使用场景,深入优化提供最佳服务治理实践,包含不局限于关键链路性能瓶颈分析、业务问题定位排障、推进系统高可用架构改造升级等职位要求1、本科以上学历, 计算机相关专业, 并有三年以上相关领域工作经验2、扎实的计算机软件基础知识; 了解 Linux 操作系统、存储、网络 IO 等相关原理3、熟悉一种或多种编程语言,例如 Go/Python/Java/Shell等4、具有相关计算/分布式/大数据等系统经验优先(Nginx/Kubernetes/Docker/OpenStack/Hadoop/Spark/Flink/虚拟化/分布式存储等)投递...
全栈开发工程师北京互联网 / 电子 / 网游 - 研发职位描述1、负责公司内部系统的后端与前端开发(从需求 → 设计 → 开发 → 测试 → 部署 → 迭代)2、根据业务部⻔反馈持续优化⽤⼾体验与系统稳定性3、与产品、运营、⽣产部⻔协作,理解业务流程并推动数字化改造4、参与基础设施优化、CI/CD 流程、监控报警建设(如有经验更佳)职位要求必须1、具备 3 年以上 Web 全栈开发经验2、熟悉⾄少⼀种后端开发语⾔:(Ruby on Rails / Golang / Python / Node.js⾄少会⼀种,熟悉多种更佳)3、熟悉前端开发: Vue / React / TypeScript 中⾄少⼀种4、熟悉数据库: PostgreSQL
运维开发工程师 北京 全职 互联网 / 电子 / 网游 职位描述 句子互动 DevOps 团队的使命是确保句子秒回和句客宝 24/7 的在不同的环境中高效和可持续性运转。以 ToB 业务为主的句子互动希望为客户提供流畅稳定的部署,使用和更新体验,这就要求 DevOps 团队能够从系统的可用性,扩张性和稳定性出发,组建和维护大规模、高可用、高效能的分布式系统,结合当下最流行的云原生技术,打造全流程自动化的体系。你需要深入句子互动各业务线,在确保基础设施在快速演进的同时,具备高可用以及扩展性,并从稳定性和效能的角度切入到业务研发,为业务研发团队提供高效的开发架构,同时通过建设完善的监控体系,保证业务系统的快速稳定迭代。岗位职责1. 参与句子 DevOps 平台的开发,以服务化、产品化的方式解决海量系统的自动化运维,故障智能定位和自修复2. 参与句子的监控系统的开发,提高监控有效性,覆盖率,提升监控系统的智能化3. 参与搭建句子 DevOps 自动化部署平台,减少因发布导致的业务可用性下降,缩短从代码提交到生产环境部署的时间周期,提高私有部署环境的搭建和维护效率 职位要求 1. 全日制本科,1 年以上工作经验,大型互联网公司或者大型IT企业应用运维经验者优先2. 熟悉 Docker 技术和对应的 PaaS 体系架构。有容器、调度相关经验或了解 Docker、Swarm、Kubernetes等相关技术3. 掌握一门服务端编程语言(Go /
边缘云架构师 北京 全职 互联网 / 电子 / 网游 职位描述 - 1、 负责云平台的架构设计,技术选型和核心代码开发。 - 2、分析行业客户需求,依托产品特性设计出具有竞争力的解决方案。 - 3、负责市场重大项目技术支撑,编写技术方案,解决关键问题和开发指导。 - 4、 把握云平台的最新技术应用及发展方向,开展相应技术预研。 职位要求 - 1、大学本科及以上学历,3年及以上云平台设计及开发经验。 - 2、熟悉主流云平台(如AWS、Azure、阿里云等)架构及技术特性,熟悉主流虚拟化技术(KVM、XEN、VMware等),对IaaS/PaaS/SaaS平台和Docker/ Kubernetes的技术架构有深入的了解。 - 3、精通Linux操作系统,至少熟练应用java、python、golang、C++中至少两种。 - 4、具有较好的逻辑思维能力,思路清晰,能独立分析和解决问题,具备将用户需求转化成产品设计的能力; - 5、良好的学习心态及团队沟通和协作能力,勇于承担工作任务和责任,抗压性强。 - 6、英语能力良好者优先。 投递...
大模型训练与推理Infra工程师-MiMo 北京 社招 全职 职位 ID:A14015 职位描述 1. 模型训练基础设施开发 - 设计和实现支持大规模分布式训练的计算平台,优化模型训练效率和资源利用率。 - 维护和扩展现有的分布式训练框架,确保平台的高性能和稳定性(如基于 PyTorch、TensorFlow 或 JAX)。 - 集成和优化高性能计算技术(如 CUDA、MPI、NCCL 等)。2. 模型推理基础设施开发 - 构建高效的推理框架,支持大模型的在线和离线推理需求。 - 优化推理速度、内存占用和能耗,支持多种硬件架构(GPU、NPU等 )。 - 实现PD分离、Context Caching、模型量化、推敲编码等推理优化技术。3. 性能监控与优化 - 开发工具链和监控系统,跟踪训练与推理过程的性能瓶颈。 - 分析并优化数据加载、通信效率和硬件利用率等关键环节。4. 跨团队协作 -
容器研发工程师(GPU 方向) 北京 社招 全职 职位 ID:A149079 职位描述 - 负责基于 Kubernetes 的云原生 AI 算力管理能力的建设,包括 GPU 的调度、虚拟化、池化、混部等技术;- 负责提升 Kubernetes GPU 集群的故障容错能力,提升大规模集群的可靠性;- 负责推动云原生 GPU 相关技术在业务的落地,提升业务的训练、推理等稳定性和效率; 职位要求 - 熟悉 GPU 相关技术,对 Nvidia GPU 技术有深入了解;- 有 GPU 池化、虚拟化、调度优化等技术经验者优先;- 有大规模 GPU 集群建设和调优经验者优先;- 熟练掌握
AI基础设施研发工程师(Sandbox / 容器化)-MiMo 北京 社招 全职 职位 ID:A229573 职位描述 MiMo 大模型团队正在寻找熟悉 sandbox、容器化和云原生基础设施的研发工程师,一起建设面向大规模强化学习训练的基础设施能力。随着大模型 Agent 和代码能力训练进入大规模 RL 阶段,我们需要构建稳定、安全、可扩展的任务执行环境。你将参与设计和实现 sandbox 执行系统、容器调度平台、训练任务环境、隔离与资源管理机制,为大规模 Agent 任务、代码执行任务和 RL 训练提供底层 infra 支撑。工作职责1. 设计和建设面向 RL 训练的 sandbox 执行环境,支持代码运行、工具调用、浏览器自动化、文件系统操作、网络访问控制等能力。2. 基于 Docker、Kubernetes 等技术,构建可大规模调度的容器化任务运行平台,支持高并发、多租户、可观测、可恢复的训练任务执行。3. 参与大规模 RL 训练 infra 的
Agent后端开发工程师 北京 全职 互联网 / 电子 / 网游 职位描述 后端开发工程师核心职责负责 AutoGLM 平台后端架构设计与核心模块开发构建高可用、可扩展的智能体调度与执行引擎设计与实现多智能体协作的分布式通信机制打造面向开发者的 API 服务与工具链 职位要求 岗位要求精通 Go/Python 语言,3 年以上后端开发经验熟悉分布式系统设计,有微服务架构实战经验掌握 Kubernetes/Docker 容器化技术栈精通 MySQL,具备数据库优化经验熟悉消息队列(Kafka/RabbitMQ/Pulsar)应用场景有云原生应用(AWS/Azure/GCP)部署经验具备扎实的编程基础,良好的系统设计能力和代码规范意识AI 编程能力要求熟练使用 AI 编程工具(如 Cursor、Claude Code 等)完成日常开发、重构与测试工作能够通过 AI 工具提升开发效率,并将 AI 深度整合进开发工作流具备使用 Vibe Coding 方法论交付真实产品的实践经验加分项:拥有 GLM 系列模型(ChatGLM/CodeGeeX)实战经验,熟悉国产大语言模型编程特性 投递...
AI院-GLM团队-AI-Native 全栈工程师(偏后端) 北京 全职 研发 - 后端开发 职位描述 1、探索并创造基于大模型的工程级代码生成服务和产品,助力开发者迎接更高效的提效体验;2、关注AI领域的最新动态和趋势,结合开发者的实际需求,为我们提供高性能、适应性强的技术解决方案;3、对产品的稳定性和性能极致的追求,深入理解并致力于优化和重构,确保系统高效、稳定运作; 职位要求 1、本科及以上学历,计算机相关专业,有三年及以上相关工作经验;2、对前端或者后端至少精通一个方向:2.1)前端开发:熟悉 HTML、CSS、JavaScript、TypeScript 等 Web 前端技术;掌握 React/Vue 等 MDV 前端框架;熟悉基于 Next.js/Nuxt.js 等脚手架的项目开发;掌握 HTTP 协议、浏览器原理、性能优化等Web 前端核心知识;有扎实的 Node.js 基础,能解决前端工程化问题。2.2)后端开发:对 Python、Java、Go 等后端开发语言有深度的理解和实践经验,包括但不限于数据处理、服务器搭建和维护、数据库操作、API的设计和实现;对微服务架构、分布式计算,以及云服务等领域有了解或实际操作经验者优先;3、对探索大模型有极大热性,有大模型相关领域研发经验者优先。4、熟练使用 Linux,熟悉 Docker、Kubernetes 等容器技术的使用,了解其原理;熟悉云原生下的服务开发部署流程,熟悉 Prometheus + Grafana 的使用; 投递...
MaaS-SRE/DBA 北京 全职 互联网 / 电子 / 网游 职位描述 【岗位职责】1. 稳定性保障(核心):负责MySQL、Redis等核心存储组件的稳定性,建设全方位的监控告警体系(Prometheus/Grafana),实现故障的早发现、快止损,保障MaaS平台在高并发场景下的99.99%可用性。2. 架构治理与演进: 主导数据库架构升级,包括读写分离、冷热分离、分库分表及异地多活(双活)容灾体系的建设。3. 深度调优与质量管控: 建立标准化的SQL审核与发布流程,负责慢 SQL 治理、大表治理及数据库参数深度调优,解决数据库性能瓶颈。4. 自动化平台建设: 基于SRE理念,开发数据库自动化运维平台(Python/Go),实现备份恢复、高可用切换、自动扩缩容及账号权限管理的自动化。5. 应急响应与预案: 负责突发故障(如宕机、带宽拥塞)的应急响应,制定并定期演练标准化恢复预案(SOP),降低故障平均恢复时间(MTTR)。6. 容量规划与成本管理: 结合业务增长模型进行容量预测与压测,优化资源利用率,制定降本增效策略。【岗位要求】1. 学历与经验: 本科及以上学历,计算机相关专业;3 年以上大规模互联网数据库管理(DBA)或 SRE 经验,有高并发、大流量系统保障经验者极佳。2. 数据库精通: 精通 MySQL 原理(InnoDB 引擎、事务锁机制、索引优化、主从复制),精通 Redis(集群模式、缓存一致性、热 Key/大 Key 处理);熟悉其高可用架构(MHA/Orchestrator/Sentinel/Cluster)。3.
高级应用交付解决方案架构师 北京 全职 互联网 / 电子 / 网游 职位描述 技术交付与实施管理 - 全面负责大模型、智能体平台、智能体应用的私有化交付与实施工作。 - 统筹交付团队,制定实施方案、部署计划与交付标准,保障项目按时、按质落地。 - 解决交付过程中的复杂技术问题,协调研发团队快速闭环。 - 建立交付过程的规范与工具体系(文档模板、自动化脚本、监控体系),提升交付效率与复用性。- 研发与团队管理 - 管理和带领核心研发团队,负责大模型应用、智能体编排平台等复杂产品的研发与持续优化。 - 参与产品架构设计与技术选型,主导关键技术难题攻关,确保产品在性能、稳定性、安全性上的领先性。 - 制定团队的研发规范与技术路线,推动交付与研发联动,形成闭环。 - 培养和发展团队成员,建设高效的研发和交付双能团队。- 客户与方案支持 - 深入理解客户业务需求,结合大模型与智能体能力,设计并交付可落地的技术解决方案。 - 作为客户的核心技术接口,提供咨询、答疑与培训,提升客户满意度。 - 在项目实施中沉淀通用解决方案和最佳实践,形成可推广的产品化能力。 职位要求 5年以上软件/平台交付或研发经验,2
AI院-GLM团队-SRE运维工程师 北京 全职 研发 - 运维 职位描述 岗位职责:1.负责TOC相关业务的稳定性建设,包括但不限于Web服务、APP后端、API网关2.负责Kubernetes集群的建设与稳定性保障,包括版本升级、故障排查、资源利用率优化3.设计高可用架构,解决APIServer性能瓶颈、etcd存储压力等大规模集群特有问题。4.主导容器化架构调优(如Pod调度策略、网络插件选型、存储方案设计),优化资源请求/限制配置以减少资源争用。5.建立容器安全防护体系,包括漏洞扫描、运行时安全监控(如Falco)、合规审计。5.深度参与自动化运维工具链建设,CI/CD流水线混沌工程测试、智能扩缩容(HPA/VPA)推动Al0ns落地,其于时字数据合析预洲售群负裁并实现自愈。7. 解决生产环境疑难问题(如 OOM、网络延迟、存储性能瓶颈),输出标准化SOP文档车8.协同研发团队优化微服务架构,推动ServiceMesh等新技术落地, 职位要求 1.教育背景-统招本科及以上学历,计算机、软件工程、云计算相关专业优先。2.工作经验-3年以上容器运维经验,主导或深度参与过千级 Pod规模的集群维护。-熟悉生产环境容器化全生命周期管理,包括部署、监控、扩缩容、故障恢复等场景。-有多云环境/混合云管理经验-头部互联网/云计算大厂优先3.技术能力精通Kubernetes架构及生态工具(如Etcd、Calico、Istio),具备集群性能调优经验(如APIServer负载均衡、节点调度优化);熟练使用Docker、Prometheus、Grafana、ELK、CI/CD等工具链,熟悉云原生安全体系(如镜像扫描、RBAC策略、网络策略);具备运维开发能力,能使用Python/Go开发自动化工具(如自定义Operator、监控告警脚本)。 投递...
高级应用交付架构师 北京 全职 互联网 / 电子 / 网游 职位描述 技术交付与实施管理 - 全面负责大模型、智能体平台、智能体应用的私有化交付与实施工作。 - 统筹交付团队,制定实施方案、部署计划与交付标准,保障项目按时、按质落地。 - 解决交付过程中的复杂技术问题,协调研发团队快速闭环。 - 建立交付过程的规范与工具体系(文档模板、自动化脚本、监控体系),提升交付效率与复用性。- 研发与团队管理 - 管理和带领核心研发团队,负责大模型应用、智能体编排平台等复杂产品的研发与持续优化。 - 参与产品架构设计与技术选型,主导关键技术难题攻关,确保产品在性能、稳定性、安全性上的领先性。 - 制定团队的研发规范与技术路线,推动交付与研发联动,形成闭环。 - 培养和发展团队成员,建设高效的研发和交付双能团队。- 客户与方案支持 - 深入理解客户业务需求,结合大模型与智能体能力,设计并交付可落地的技术解决方案。 - 作为客户的核心技术接口,提供咨询、答疑与培训,提升客户满意度。 - 在项目实施中沉淀通用解决方案和最佳实践,形成可推广的产品化能力。 职位要求 5年以上软件/平台交付或研发经验,2
大模型工程师(北京) Beijing Full-time Internet / Electronics / Games - R&D Responsibilities 1、负责大语言模型(LLM)相关技术的落地研发,包括模型优化、部署及应用场景定制;2、参与大模型的微调(Finetuning)工作,根据具体业务需求对预训练模型进行定制化开发,提升模型性能;3、深入理解业务场景,设计并实现基于大模型的解决方案,包括但不限于文本生成、语义理解、对话系统等方向;4、跟踪人工智能领域前沿技术,研究和应用最新的大模型技术,推动技术创新与项目应用;5、负责模型性能评估与优化,解决模型在实际应用中的问题,确保模型效果和稳定性;6、与团队协作,参与技术分享和技术文档撰写,提升团队整体技术水平。 Qualifications 1、具备优秀的编码能力,扎实的算法和数据结构功底,熟练掌握至少一种编程语言(如 Python、Go 等);2、熟悉至少一种主流深度学习框架(如 PyTorch、TensorFlow 或 Caffe),并对其底层架构及实现机制有深入理解;3、对大模型方向的研究和应用有一定了解,有参与 agent 或 prompt 相关设计与实践者优先;4、有使用 langchain、AutoGPT、Kubernetes(k8s)等工具的经验,熟悉常规大模型工程开发流程;5、有 GPT 类大模型优化及工程应用实践经验者优先。 Apply...
云原生开发工程师 Beijing Full-time R&D - Back-end development Responsibilities 作为云原生CI/CD方向高级工程师/专家,您将深度参与公司级CI/CD平台的设计、构建、优化和推广。您需要运用您在CI/CD领域的多年经验和对云原生技术的深刻理解,结合平台工程的理念,打造自动化、智能化、自助化的研发交付流水线和开发者平台,赋能业务快速迭代和创新。主要职责:1. CI/CD平台建设与优化: - 负责设计、开发、部署和维护公司级CI/CD平台及相关工具链(如Jenkins, GitLab CI, Argo CD, Tekton, Spinnaker等)。 - 持续优化CI/CD流程,提升构建、测试、部署的自动化水平、速度和稳定性。 - 集成代码质量扫描、安全扫描、自动化测试等工具,确保交付质量。2. 云原生技术实践与推广: - 将云原生理念(如微服务、容器化、不可变基础设施、声明式API)融入CI/CD流程和平台设计。 - 深入研究和应用Kubernetes、Docker、Service Mesh、Serverless等云原生技术,提升资源利用率和系统弹性。 - 推动云原生最佳实践在研发团队中的落地。3. 平台工程理念落地: - 基于平台工程理念,设计和构建内部开发者平台(IDP),提供标准化的开发、测试、部署环境和工具。 - 为开发者提供自助服务能力,降低认知负荷,提升开发者体验(Developer Experience)。 -