Job Description CANDIDATE PROFILE Required Qualifications • 5+ years of experience in platform engineering, DevOps, or infrastructure automation roles • Expert-level proficiency in Terraform, including advanced features such as workspaces, remote state management, and module composition •
DevOps 工程师 深圳、北京、上海 全职 智能机器人板块 职位描述 负责机器人软件研发的 CI/CD 流水线、自动化测试和仿真基础设施,提升团队交付效率和软件质量。1、设计和维护机器人软件 CI/CD 流水线(GitLab CI/Jenkins),实现从代码提交→编译构建→自动化测试→出包发布的全自动化;2、搭建和管理 SIL(软件在环)和 HIL(硬件在环)测试台架,支持机器人软件的持续集成验证;3、构建基于 MuJoCo/Isaac Sim 的仿真测试环境,支持运动控制、导航、操作等模块的自动化回归测试;4、开发和维护机器人软件的容器化部署方案,管理 Docker 镜像和 Kubernetes 集群;5、建立软件质量监控体系,包括构建成功率、测试覆盖率、缺陷趋势等度量指标。 职位要求 1、本科及以上学历,计算机、软件工程等相关专业;2、具备 2 年以上 DevOps/CI-CD 工程经验;3、熟悉 GitLab CI、Jenkins、Argo Workflows 等至少一种 CI/CD 工具;4、精通 Docker 和 Kubernetes,有容器化应用的构建和部署经验;5、熟练使用 Python/Bash 编写自动化脚本,熟悉
Job TitleIT AI DevOps Intern Job Description Job Summary We are seeking a motivated AI Transformation Intern to support the design and execution of enterprise AI initiatives within the IT organization. This role will work closely with
Requisition Number: 75577 The company built on breakthroughs. Join us. Corning is one of the world’s leading innovators in glass, ceramic, and materials science. From the depths of the ocean to the farthest reaches of space,
Introduction The Pepperstone story started in 2010. We know what it’s like to trade the world’s markets. Our team describes us as a place for the curious and the driven, and we like to do things
资深运维开发工程师 热招 上海 全职 研发 职位描述 我们正在寻找一位兼具 稳定性治理能力 与 运维开发能力 的资深工程师,加入云端 SRE 团队,负责支撑业务增长阶段下的多云、多集群云原生基础设施稳定运行与持续优化。你将面向业务增长带来的稳定性、性能、容量和成本挑战,参与 Kubernetes 集群治理、Elasticsearch 等关键基础组件优化、线上故障治理、容量规划和变更风险控制。同时,你也将推动自动化运维平台和工具链建设,将线上问题沉淀为平台能力、工程规范和长期机制,提升研发、数据、安全、合规等团队的协作效率。1. 稳定性治理:负责云端基础设施及关键基础组件的稳定性建设,定位并解决线上性能瓶颈、容量风险和可用性问题,保障业务系统稳定运行;2. 性能优化:针对 Elasticsearch 等核心组件开展性能调优、容量评估、资源治理和架构优化,提升系统吞吐、查询效率和服务可靠性;3. 云原生基础设施:负责 Kubernetes 集群及 CNCF 云原生生态组件的日常运维、架构优化和稳定性提升,支撑并保障多个 Kubernetes 集群的可靠运行;4. 多云平台治理:参与阿里云 ACK、AWS EKS、GCP GKE 等多云托管 Kubernetes 环境的运维、治理和优化,提升多云环境下的可观测性、弹性、成本效率和运维一致性;5. 故障与变更管理:负责线上告警处理、故障应急、根因分析、复盘改进和生产变更管理,建立可持续的稳定性改进机制;6. 自动化与平台建设:开发和维护自动化运维平台、工具链和流程系统,提升发布、变更、巡检、告警、权限、资源交付等环节的自动化水平;7.
软件测试开发工程师(CI/CD/自动化) 上海 全职 研发 - 测试 职位描述 1. 负责3D打印机PC端打印/切片软件的自动化测试,参与测试框架的开发与维护;2. 负责组内CI/CD平台的设计、开发和维护工作,实现高效稳定的持续交付;3. 负责自动化测试用例的编写,提高覆盖度,执行测试、反馈及跟进问题、输出报告;4. 参与测试平台的搭建,自动化测试体系的建设,静态分析工具的部署使用。 职位要求 1. 大学本科及以上学历,计算机、软件工程、自动化等相关专业;2. 至少2年以上自动化测试/测试开发经验;3. 具备扎实的计算机基础,熟练掌握python、java、c++等至少一门编程语言,具备良好的代码能力;4. 熟练掌握自动化测试方法,比如单元测试,接口测试,UI自动化测试,性能测试等。5. 熟悉CI/CD流程,熟练使用Jenkins/Gitlab CI等工具,了解Devops;6. 有较强的动手能力,善于观察、分析问题,求知欲强;加分项:熟悉桌面端软件(跨Windows/Mac/Linux)的自动化测试,搭建过桌面端测试框架;熟悉桌面端三维设计软件的使用。 投递...
CICD开发实习生 上海 实习 职位描述 1.主导机器人研发全流程CI/CD体系的整体规划与落地,设计并搭建标准化、可扩展的CI/CD流水线,覆盖机器人算法代码、控制程序、硬件固件、ROS/ROS2相关代码的提交、编译构建、自动化测试、镜像构建、机器人端部署发布全流程,适配机器人研发多场景(算法迭代、固件升级、硬件调试)的交付需求。2.负责CI/CD相关工具与脚本的开发、优化,包括机器人研发专属流水线自动化脚本(Shell、Python、Groovy等)、固件部署工具、机器人测试环境管理工具等,提升流水线的自动化程度与稳定性,适配机器人端侧部署特性。3.整合CI/CD生态工具(GitLab、Jenkins、GitHub Actions、ArgoCD、Harbor、SonarQube等),结合机器人研发工具(ROS/ROS2、Isaac Sim、Gazebo等)完成工具间的联动与集成,优化工具配置,解决工具集成过程中的兼容性问题,支撑机器人仿真测试、实机部署全流程。4.负责CI/CD流水线的日常运维、故障排查与版本迭代,快速响应机器人研发团队(算法、控制、硬件)的流水线使用需求,处理代码编译失败、固件部署异常、机器人端部署故障等问题,保障机器人研发交付流程顺畅。5.推动CI/CD最佳实践在机器人研发场景落地,制定机器人研发流水线使用规范、代码提交规范、固件部署流程规范,开展相关培训,引导研发团队规范使用CI/CD工具,提升机器人研发交付效率。6.结合机器人研发需求,优化CI/CD流程,推动机器人自动化测试(仿真测试、实机测试)、环境隔离、灰度部署、固件回滚机制等落地,提升交付质量与安全性,降低人工干预成本,适配机器人产品迭代特性。7.跟踪CI/CD领域前沿技术与行业最佳实践(如云原生CI/CD、GitOps、DevSecOps),结合机器人研发场景(端云协同、多机器人协同部署)引入合适的技术与工具,持续迭代优化CI/CD体系。8.协同机器人算法、控制、硬件、测试团队,收集机器人研发交付过程中的痛点需求,输出优化方案并推动落地,实现机器人研发交付全流程的高效协同。 职位要求 1.本科及以上学历,计算机科学、软件工程、电子信息、机器人工程等相关专业,CI/CD开发、DevOps、研发效能相关工作经验,有机器人研发相关CI/CD经验者优先。2.熟练掌握至少1门脚本/编程语言(Shell、Python、Groovy、Go等),具备扎实的代码开发与脚本编写能力,能独立完成CI/CD自动化脚本与机器人专属部署工具开发。3.精通CI/CD核心流程与工具,有GitLab、Jenkins、GitHub Actions、ArgoCD等主流CI/CD工具的搭建、配置与二次开发经验,能独立构建适配机器人研发的完整CI/CD流水线。4.熟悉容器化与云原生技术(Docker、K8s),了解容器化部署、镜像管理、环境编排,能结合云原生架构优化机器人CI/CD流水线,适配机器人端侧部署需求。5.熟悉机器人研发全流程,了解ROS/ROS2、机器人算法开发、固件开发、硬件调试等相关知识,能识别机器人研发交付瓶颈并提出优化方案,具备较强的问题分析与故障排查能力。6.了解DevSecOps相关理念,有代码质量检查(SonarQube)、安全扫描工具集成经验,有机器人固件安全部署相关经验者优先。7.具备良好的跨部门沟通、团队协作与培训赋能能力,工作严谨细致,有较强的责任心与学习能力,能适应机器人产品快速迭代的工作节奏。 投递...
We are Reckitt Home to the worlds best loved and trusted hygiene, health, and nutrition brands. Our purpose defines why we exist: to protect, heal and nurture in the relentless pursuit of a cleaner, healthier world.
We are now looking for an Infrastructure Software Engineer for Deep Learning Libraries! NVIDIAs Deep Learning Libraries Group is seeking excellent software engineers to enable the next wave of NVIDIA’s highest performing deep learning libraries. The
Seeking a Developer with extensive experience and understanding of the asset management investment business to join our Client Tech team. Job Responsibilities Be responsible for the architecture design, development and optimization of client facing application. Focus
高级运维开发工程师 上海 社招 全职 互联网 / 电子 / 网游 职位描述 1.负责运维自动化工具、监控平台及巡检系统的设计与开发、测试及迭代,替代人工重复操作,提升运维效率、降低成本。2.参与搭建全链路监控体系,开发自定义监控指标、告警规则及联动脚本,实现系统异常早发现、早处置,保障业务高可用。3.使用Shell、Python、Go等语言开发脚本,解决批量操作、故障恢复等重复性运维工作,提升操作准确性。4.对接研发、测试等团队,提供运维开发技术支持;沉淀最佳实践,编写技术及操作文档。5.参与线上故障应急响应,开发工具辅助排查恢复;定期巡检、优化运维工具及平台,保障其稳定运行。6.了解AI相关技术,探索其在运维场景的应用,参与AI运维工具的调研与落地,提升运维智能化水平。7.关注云原生、DevOps等前沿技术,开展调研与试点,将合适方案落地,提升团队技术水平。 职位要求 1.熟练掌握Python/Go等至少一门主流开发语言,能独立开发运维工具及脚本;遵循代码规范,熟练使用Git版本控制。2.熟悉Ansible、Prometheus、ELK Stack等运维工具,能进行二次开发及插件定制,适配自动化需求。3.精通Linux/Unix系统及常用命令,能排查系统故障;掌握TCP/IP等网络基础,了解Nginx、MySQL等服务运维。4.熟练掌握MySQL、Redis等至少一种数据库的运维与优化;了解RabbitMQ、Kafka等中间件的使用与运维。加分项1.具备Docker、Kubernetes等云原生技术实战经验,能开发适配云原生场景的运维工具。2.熟练使用主流AI Coding工具,辅助脚本开发,提升编码效率与质量,有AI运维(AIOps)技术落地实践经验。3.能独立负责复杂运维开发项目的推进与落地。 投递...
高级网络工程师 上海 社招 全职 互联网 / 电子 / 网游 职位描述 1、IDC与混合云网络架构设计与运维:负责公司核心网络基础设施的顶层设计。这包括规划与实施数据中心(IDC)及混合云(集成主流公有云)的整体网络架构,具体涵盖网络拓扑、IP地址规划、路由策略(如BGP、OSPF)及网络安全体系的设计与优化。您的目标是构建一个具备高可用性、弹性扩展能力和前瞻性的网络基础,保障所有业务系统的可靠通信。2、云网络解决方案与落地:深入理解业务需求,为客户或内部部门提供专业的云网络解决方案。您需要对云计算IaaS/PaaS层的网络架构有深刻理解,能够设计并推动VPC、容器网络、云互联等场景化方案落地,协调各方资源确保项目成功。3、SDN及前沿网络技术推进:作为技术带头人,负责研究和引入软件定义网络(SDN)等前沿技术。您必须熟练掌握VXLAN、EVPN、SD-WAN等关键技术的原理与实践,能够主导其方案设计、部署实施,并解决相关的复杂故障。同时,持续跟踪行业动态,评估新技术价值并推动现有架构演进。4、自动化运维与效率提升:主导或深度参与构建网络自动化运维体系。通过编写脚本(Python/Go)或运用自动化工具(如Ansible),实现网络设备的配置管理、监控告警、变更交付等流程的自动化。目标是显著提升运维效率与准确性,降低人为操作风险,将团队从重复性工作中解放出来,践行DevOps理念。5、复杂故障处理与技术攻坚:负责最高等级的网络故障应急响应与攻坚。这要求您具备强大的网络封包分析(如使用Wireshark)、流量监测及系统性问题排查能力,能够快速定位并解决影响业务稳定的核心网络及数据中心网络故障。您需要负责日常监控、定期健康检查并出具运行报告。6、技术规划与文档沉淀:参与制定团队技术发展路线图,优化工作流程。您需具备出色的技术文档编写能力,能够产出高质量的设计方案、拓扑图、分析报告及配置文档,并负责核心网络知识的沉淀、分享与传承,提升团队整体技术水平。 职位要求 1、计算机科学、网络工程、通信工程或相关专业本科及以上学历。2、5-8年及以上中大型企业网络规划、设计与运维经验,其中至少3年专注于数据中心、云网络或SDN相关领域3、精通TCP/IP协议栈,深入理解VLAN、STP、OSPF、BGP、MPLS、VPN、QoS等协议与技术原理。4、深刻理解数据中心网络架构与云网络模型。必须熟练掌握VXLAN、EVPN、SDN等相关技术,并有实际部署或运维经验。5、精通华为、华三(H3C)、思科(Cisco)等至少一家主流厂商的路由器、交换机、防火墙等产品的配置、调试与排障。熟悉高可用技术。6、具备扎实的自动化运维能力,熟练掌握Python、Go或Shell等至少一种脚本语言。有Ansible、Zabbix、Git等工具使用经验者优先。7、具备出色的分析、解决复杂问题的能力,以及强烈的技术敏感度和风险识别能力。8、优秀的沟通协调能力和团队协作精神,能够与研发、运维、业务等多部门高效合作。9、主动积极,自我驱动力强,对新技术充满热情,具备良好的学习能力和抗压能力 投递...
Eaton is an intelligent power management company dedicated to protecting the environment and improving the quality of life for people everywhere. We make products for the data center, utility, industrial, commercial, machine building, residential, aerospace and
Req ID 88029 | AutoR&D Shanghai, China, ZF Automotive Technologies (Shanghai) Co., Ltd. About the Team This position is part of ZF’s ADAS & HPC business, which is entering an exciting new phase of growth and
Job Description Location: Shanghai China Employment Type: Full-Time About the Role seeking a Product Owner to own and evolve core hotel business systems (including PMS, POS, CRM, loyalty, and back-office operations) across global properties. You will
Why project44? At project44, we believe in better. We challenge the status quo because we know a better supply chain isn’t just possible—it’s essential. Better for our customers. Better for their business. Better for the world.
Company Description Sia is a next-generation, global management consulting group. Founded in 1999, we were born digital. Today our strategy and management capabilities are augmented by data science, enhanced by creativity and driven by responsibility. We’re
高级 SRE 工程师 (AI-INF-基础设施) Beijing、Shanghai Experienced Full-time Responsibilities 岗位职责1、多云架构管理与业务落地:负责公司在 AWS、阿里云等主流公有云上的基础设施规划、建设与日常运维;能够独立对接业务团队,完成复杂业务系统的架构设计、资源规划、部署上线及全生命周期管理。2、K8s 集群稳定性保障:负责公司海量/大规模Kubernetes集群的构建、稳定性优化、容量规划与调度策略调优;负责服务容器化改造及网络、存储等云原生组件的疑难问题排查。3、AI 算力基础设施运维:保障大模型训练和推理任务的稳定运行,熟悉异构算力(如 NVIDIA GPU)服务器的驱动、网络(InfiniBand/RoCE)及监控排障,优化GPU资源调度与利用率。4、CI/CD 与自动化流水线:设计并优化持续集成与持续交付(CI/CD)流水线(如 GitHub Actions, GitLab CI, ArgoCD),推动基础设施即代码(IaC,如Terraform)的落地,提升研发交付效率。5、可观测性系统建设:负责构建和优化全链路监控与告警体系,深入应用 Prometheus、Grafana、Alertmanager等开源工具,制定核心业务的SLI/SLO/SLA,建立高效的故障应急响应流程。6、运维平台自研开发:深入研发团队痛点,能够使用Python或Go语言独立设计并开发运维自动化平台、底座工具或 AI-Agent 智能巡检系统,用工程化手段消除组织内的“脏活累活”(Toil)。7、应急响应与 On-Call:参与生产环境的On-Call值班,对线上突发事件进行快速响应、定位、止血与复盘,沉淀故障知识库。 Qualifications 任职要求1、教育背景与经验:计算机或相关专业本科及以上学历,5年以上SRE、DevOps或运维开发经验(有AI算力集群或大规模 K8s 运维经验者优先)。2、公有云专长:熟练掌握AWS、阿里云等至少两家主流公有云厂商的架构体系,熟悉其 IAM、VPC、EKS/ACK、RDS等核心服务及跨云互联方案。3、云原生深度掌握:深入理解 Kubernetes 架构与底层原理,熟练掌握常用组件(Ingress, CoreDNS, Flannel/Calico等),具备强大的Pod/Node级别排错、性能调优和网络抓包能力。4、AI / 算力经验(硬性加分项):熟悉大模型分布式训练(如 Megatron-LM, DeepSpeed)或模型推理(如
We are a global technology consultancy firm with offices in Middle East, Asia, Europe and USA. We deliver business benefits through innovation. We leverage cutting-edge technology led solutions delivered by a team of skilled professionals, from