Prometheus Jobs In China

Python Engineer - Numeric

Man Group ( China )

About Man Group Man Group is a global alternative investment management firm focused on pursuing outperformance for sophisticated clients via our Systematic, Discretionary and Solutions offerings. Powered by talent and advanced technology, our single and multi-manager

Premium Full-time Control-M Grafana Elk Mentoring Apache Kafka

Man Group 27 days ago

NCX Engineer, AI Accelerator

Nvidia ( Shanghai )

NVIDIA is seeking an NCX Engineer, AI Accelerator to join our AI Accelerator team, collaborating closely with strategic customers to implement and enhance groundbreaking AI workloads! You will deliver hands-on technical assistance for advanced AI deployments,

Premium Full-time Architecture NEO InfiniBand Linux Customer Success

Nvidia 26 days ago

运维工程师

BOKE Technology Co., Ltd ( Shanghai )

运维工程师上海全职互联网 / 电子 / 网游职位描述我们是一个成熟稳重的团队，大部分时间跟机器设备打交道，机器只认规则，我们主旨是规则为先，凡事先想好再做。团队大部分是大老爷们，干脆利落，氛围不会差，日常活动主要是吃吃玩玩。岗位职责：1. 负责线上游戏、WEB等应用系统的监控、优化、更新维护以及故障处理；2. 负责日常运维工具的开发及优化；3. 负责管理并完善运维监控平台及发布平台；4. 参与全球项目及各大云服务商平台的日常运维工作；5. 参与公司自动化运维体系的建设，应用新技术，优化运维架构，提升运维效率；6. 根据领导安排，完成其他相关工作内容。任职资格:1. 全日制大学本科及以上学历，计算机相关专业；2. 熟练使用Shell/Python/Go中的一种或者多种，拥有良好的linux性能tuning能力，具备独立排错的能力和意识；3. 熟悉k8s基础架构，了解云原生工具链如Rancher、Argocd、istio、Higress或者各类ingress controller等，有生产业务应用经验优先；3. 熟练操作Linux操作系统，熟悉Linux下常见运维工具和服务的安装配置及使用，包括但不限于Tomcat、Nginx、Rsync、Ansible、Zabbix、Prometheus、ELK等；4. 熟悉CI/CD流程以及常用工具链，如Gitlab、Jenkins等，至少一年以上游戏及WEB应用的运维工作经验；5. 英语读写熟练，熟悉自动化运维开发，Devops者优先；6. 工作认真负责，有较强的沟通协调能力，具备团队协作精神，能承受一定的工作压力，偶尔需要夜间维护。我们秉承“BE WILD. BE FREE.”的品牌主张，坚持始终创业、简单务实、开放包容、勇于担当的文化理念。在这里——【态度】我们讲求自驱，不设边界，没有人能定义你的舞台和天花板；【氛围】内部真·扁平，新人的意见、不同的观点都有可能成为波克前行的关键；【成长】入职即有指导人和成长伙伴双cover，内部分享+外聘大神助你突破自我；【生活】一日三餐下午茶，房补公寓任你选，节日社团境外游.让游戏不只是工作，更是你的生活！投递...

Premium Full-time

BOKE Technology Co., Ltd 23 days ago

运维开发工程师（偏日志与数据）

BOKE Technology Co., Ltd ( Shanghai )

运维开发工程师（偏日志与数据）上海全职互联网 / 电子 / 网游职位描述岗位职责：1. 负责日志与可观测性平台的设计与开发，建设统一的数据采集、处理与可视化体系；2. 维护与扩展日志数据管道（包括 Kafka、ClickHouse、ELK等），保障数据链路高效稳定；3. 开发日志与指标数据的聚合、查询和可视化功能，支撑业务监控、性能分析和故障定位；4. 推动日志、指标、链路等可观测性数据的融合，建设统一的可观测性数据平台；5. 与监控、平台、安全团队协作，提供定制化数据服务与平台能力支持。任职要求:1. 具备扎实的开发能力，熟悉至少一门语言（Python / Golang / Java），能独立完成平台功能开发；2. 熟悉日志与可观测性体系架构，掌握 ELK、Kafka、ClickHouse、FluentBit 等组件的原理与运维；3. 有日志数据处理、管道构建与性能优化经验，能设计高可用、高并发的数据处理链路；4. 了解云原生监控体系（Prometheus、Grafana、OpenTelemetry 等），能结合日志与指标数据实现多维观测；5. 具备日志分析、性能调优与问题排查能力，能独立定位复杂系统问题；6. 有日志/监控类平台（如内部统一可观测性平台、日志查询平台）自研经验者优先（加分项）；7. 有数据分析、可视化开发（如 Grafana 插件、前端交互面板）经验者优先（加分项）；我们秉承“BE WILD. BE FREE.”的品牌主张，坚持始终创业、简单务实、开放包容、勇于担当的文化理念。在这里——【态度】我们讲求自驱，不设边界，没有人能定义你的舞台和天花板；【氛围】内部真·扁平，新人的意见、不同的观点都有可能成为波克前行的关键；【成长】入职即有指导人和成长伙伴双cover，内部分享+外聘大神助你突破自我；【生活】一日三餐下午茶，房补公寓任你选，节日社团境外游…让游戏不只是工作，更是你的生活！投递...

Premium Full-time Golang Grafana

BOKE Technology Co., Ltd 23 days ago

Graduate Program-Operations & Infrastructure Engineer

Ceva Santé Animale ( Shanghai )

Graduate Program-Operations & Infrastructure Engineer The success of a company depends on the passionate people we partner with. Together, lets share our talents. As a global leader in animal health, Ceva Animal Health believes our success

Premium Full-time Planet Animal Health GitHub Equities Virtualization

Ceva Santé Animale 22 days ago

【集团】资深运维工程师（GOC）

极兔速递 (J&T Express) ( Shanghai )

【集团】资深运维工程师（GOC）上海全职职位描述一、岗位概述作为企业IT系统应急保障核心技术专家，负责7×24小时、Oncall团队技术赋能与应急体系优化，持续推动运维工作，支撑业务连续性与系统稳定性目标达成；二、核心职责。1、设计并迭代Oncall应急响应流程、故障分级标准与复盘机制，主导监控体系（Prometheus/Grafana等）深度优化，构建覆盖业务全链路的智能告警与预警模型；2、负责故障案例复盘分享、实战演练组织，提升团队整体故障处置能力与技术水平；3、推动运维自动化工具（Shell/Python/Ansible）与自愈能力落地，编写核心系统应急处置预案（DRP）并定期演练，沉淀《重大故障处置手册》与技术知识库；4、与开发、架构、业务、安全团队建立常态化沟通机制，提前识别系统潜在风险（如架构瓶颈、容量不足等），推动风险整改与性能优化，参与核心系统架构评审；职位要求三、任职要求1、本科及以上学历，计算机、软件工程等相关专业，，有互联网、电商、物流等行业背景者优先；2、精通Linux/Unix系统内核级运维，深入掌握网络协议（TCP/IP/HTTP/HTTPS）、数据库（MySQL/Redis/MongoDB）、中间件（Nginx/Kafka/RabbitMQ）原理与调优，具备分布式系统问题排查能力；3、熟练掌握容器化（Docker/Kubernetes）、云平台（AWS/Azure/阿里云/腾讯云）运维技术，能独立设计云原生环境下的应急保障方案；4、具备（如大规模服务雪崩、数据丢失、网络攻击等），能在高压环境下快速决策，主导跨团队协作攻坚；5、精通监控告警工具（Prometheus/Grafana/Zabbix/ELK），具备日志分析、指标建模能力，能编写自动化脚本（Shell/Python）实现故障自愈或效率提升；6、具备优秀的技术视野与问题拆解能力，良好的沟通协调与团队管理意识，能接受轮班/夜班及节假日值班，对系统稳定性有极致追求。投递...

Premium Full-time

极兔速递 (J&T Express) 22 days ago

Get Hired 2x Faster
Connect with Top Employers Directly

【集团】资深运维工程师（Linux / 监控方向）

极兔速递 (J&T Express) ( Shanghai )

【集团】资深运维工程师（Linux / 监控方向）上海全职职位描述岗位定位负责公司 Linux 基础设施、服务器运维及监控体系建设，保障业务系统稳定、安全、高效运行；主导监控平台、告警机制、自动化运维及故障治理能力的持续优化。该岗位需要能够从“日常运维”提升到“稳定性治理”和“平台化建设”层面，既能处理复杂故障，也能推动规范、工具、流程与自动化能力落地。岗位职责负责 Linux 服务器、虚拟机及云主机的日常运维、配置管理、容量管理与性能优化。负责业务系统运行环境的部署、变更、巡检、升级及故障处理，保障系统高可用。负责监控平台建设与持续优化，包括主机、应用、中间件、数据库、网络及业务指标监控。负责告警体系设计，包括告警分级、告警收敛、告警降噪、通知策略及升级机制。主导 Prometheus、Zabbix、Grafana、ELK、OpenSearch、日志平台等监控与日志体系建设。负责服务器性能分析与问题定位，包括 CPU、内存、磁盘、网络、IO、负载等指标排查。负责线上复杂故障应急响应、问题复盘及根因分析，推动问题闭环和长期治理。负责建立并持续完善巡检、备份、变更、发布、应急、故障处理等运维标准。推动自动化运维能力建设，包括 Shell、Python、Ansible 等工具开发与批量运维。参与系统架构评审，从运维和稳定性角度提出优化建议，包括高可用、容灾、容量与监控设计。建立 SLA、SLO、告警 MTTA、故障 MTTR 等稳定性指标，并持续跟踪优化。与开发、网络、安全、供应商等团队协作，推动跨团队问题解决。职位要求基础能力本科及以上学历，计算机、网络、软件等相关专业。5 年及以上 Linux 运维经验，具备中大型生产环境运维经验。熟悉 CentOS、Red Hat、Ubuntu 等 Linux 系统，能够独立完成安装、配置、排障及优化。熟悉 TCP/IP、DNS、HTTP、HTTPS、Nginx、Keepalived、LVS 等基础网络与高可用技术。熟悉 VMware、KVM 或云平台运维经验，了解阿里云、腾讯云、AWS、Azure 中至少一种。Linux 能力要求精通 Linux 常用命令、系统服务、systemd、用户权限、文件系统、计划任务、日志管理。能够熟练分析

Premium Full-time MTTR Linux IO Prometheus Grafana

极兔速递 (J&T Express) 22 days ago

【集团】中级网络工程师

极兔速递 (J&T Express) ( Shanghai )

【集团】中级网络工程师上海全职职位描述职位概述寻找一位经验丰富的网络工程师加入我们的团队。您将负责设计、部署和维护高效、安全的企业级网络基础设施。具备扎实的本地网络运维能力（包括无线网络和网络监控），还拥有公有云网络架构的实战经验，并具备支持跨国公司网络环境的视野与能力。岗位职责- 企业网络架构与运维：负责公司总部及分支机构的局域网（LAN）、广域网（WAN）的规划、实施与日常维护，确保网络的高可用性和稳定性。- 无线网络管理：主导企业级无线局域网（WLAN）的规划与优化，处理无线覆盖、漫游及干扰问题，确保高密场景下的无线体验。- 网络监控与故障排查：部署并管理网络监控平台（如Zabbix, Prometheus, SolarWinds等），实时监控网络流量与设备状态，快速响应并解决网络故障。- 公有云网络建设：负责公有云（如GCP,腾讯云阿里云等）的网络架构搭建，包括VPC规划、专线连接、云防火墙策略及混合云互联。- 跨国网络支持：支持跨国业务网络需求，优化SD-WAN或MPLS链路，解决跨境访问延迟与合规性问题，配合全球IT团队进行标准化落地。- 安全与文档：实施网络安全策略（ACL, VPN, NAC），并负责网络拓扑图、配置文档及运维手册的编写与更新。职位要求任职要求- 教育背景：计算机网络、通信工程或相关专业本科及以上学历。- 工作经验：5年以上中大型企业网络运维经验，有跨国公司或全球IT支持经验者优先。- 网络基础：精通TCP/IP协议，熟练掌握路由交换技术（OSPF, BGP, VLAN, STP等），熟悉主流厂商（Cisco, Huawei, H3C,等）设备配置。- 无线与监控：熟悉企业级无线控制器（AC/AP）配置，有Aruba, Cisco或类似产品经验者优先；熟练使用网络抓包工具（Wireshark）及网络监控软件。- 云网络经验：具备公有云网络实践经验，理解云原生网络概念（VPC, Direct Connect, Transit Gateway, Load Balancer），持有相关云厂商认证者优先。- 软技能：具备良好的逻辑思维能力、抗压能力和团队协作精神，拥有强烈的责任心和服务意识。加分项- 持有CCNP/CCIE、HCIP/HCIE或同等水平认证。-

Premium Remote Friendly Full-time

极兔速递 (J&T Express) 22 days ago

Golang后端开发实习生

智元创新（上海）科技有限公司 ( Shanghai ) +1 other locations

Golang后端开发实习生上海、北京实习职位描述 1. 参与AI平台核心后端服务开发，包括：模型管理、任务调度、推理服务编排、API网关、用户权限系统等；2. 设计并实现高并发、低延迟的 RESTful/gRPC 接口，支持训练任务提交、模型部署、实时推理等场景；3. 与前端、算法、运维团队协作，打通从模型开发 → 训练 → 部署 → 监控的完整链路；4. 优化系统性能与稳定性，如提升任务调度效率、降低推理服务冷启动时间、增强容错能力；5. 编写自动化测试、部署脚本及技术文档，保障平台可维护性。职位要求 1. 计算机、软件工程或相关专业在读本科/硕士；2. 扎实的编程基础，熟练掌握 Golang开发；3. 熟悉常用后端技术栈：GRPC、HTTP、REST、数据库（MySQL/PostgreSQL）、缓存（Redis）；4. 了解基本的 Linux、Git、Docker 使用；5. 有以下任一经验者优先：·使用过 Kubernetes、Celery、FastAPI、gRPC、Prometheus；·接触过 MLOps 工具（如 MLflow、Kubeflow、Seldon）；·了解大模型推理流程（如 vLLM、TGI）或分布式训练概念；·责任心强，具备良好的沟通能力和工程思维；投递...

Premium Full-time

智元创新（上海）科技有限公司 22 days ago

DevOps / SRE 实习生

智元创新（上海）科技有限公司 ( Shanghai )

DevOps / SRE 实习生上海实习职位描述参与 CI/CD 流水线的搭建、优化与日常维护（Jenkins / GitHub Actions / ArgoCD）协助维护 Kubernetes 集群，处理 Pod 调度、资源配额、健康检查等日常问题参与监控告警体系建设，配置 Prometheus / Grafana 告警规则和 Dashboard 协助故障排查与复盘，输出 Postmortem 文档编写和维护基础设施自动化脚本（Shell / Python）参与值班轮班，学习线上问题响应和处置流程整理内部运维文档与 Runbook 职位要求在校本科或研究生，计算机、软件工程、网络工程等相关专业熟悉 Linux

Premium Full-time GitHub POD Grafana DevOps Linux

智元创新（上海）科技有限公司 22 days ago

分布式计算与存储软件工程师

XPENG ( Guangzhou )

分布式计算与存储软件工程师广州全职通用智能板块职位描述职位描述1. 负责小鹏汽车“扶摇”AI平台数据处理相关的软件开发工作，包括数据加载工具（XDataLoader）和数据集管理平台（XDataset），提供统一的数据加载、转换、缓存与预取能力；目标解决大规模数据加载过程中出现的性能瓶颈、数据一致性、系统稳定性等问题，服务AI大模型的训练和推理；2. 开发并维护高性能 DataLoader SDK，支持自定义采样、并行读取、缓存预取与数据增强等功能，优化多线程/进程流水线，降低I/O与预处理延迟，简化算法团队接入并提升加载效率；3. 搭建通用Dataset管理系统，实现多源异构数据（图片、视频、点云、传感器等）的统一接入、解析与格式化；4. 协同算法团队及其他技术团队，深入理解业务需求，快速响应并落地实现。职位要求 1. 计算机 / 软件工程硕士或同等经验，3年及以上大规模数据处理经验；有大规模模型训练与推理场景支持经验者优先；2. 精通 Python，具备扎实软件工程基础，良好编程规范和代码质量意识；3. 有以下至少一项实际项目经验；两项及以上者优先： a. 大规模数据加载机制（如 PyTorch DataLoader、NVIDIA DALI、TensorFlow Dataset、Hugging Face Datasets） b. Parquet/ORC 等列式存储格式及相关生态（如Petastorm)，能设计高效的分区、压缩与向量化读取流程，优化批量数据访问性能。 c. Linux文件系统与网络I/O，能针对NFS、对象存储等场景进行性能调优；有云存储系统（如阿里云OSS、CPFS、火山引擎vePFS）相关经验。4. 具备关系型数据库（MySQL/PostgreSQL）与NoSQL（Redis/MongoDB等）相关经验，了解元数据与缓存管理；5. 具备大规模分布式数据处理、性能优化与问题排查经验，能定位并高效解决复杂的性能问题；熟悉Apache Ray、Kubeflow/Airflow、Prometheus等开源项目者优先；6. 具有良好的跨团队沟通能力和协作精神，责任心强，善于主动推进问题解决。加分项1.

Premium Full-time PyTorch AI

XPENG 22 days ago

【集团】IT服务支持经理

极兔速递 (J&T Express) ( Shanghai )

【集团】IT服务支持经理上海全职职位描述 1、负责搭建并运营集团统一的IT服务管理体系（ITSM），涵盖事件管理、问题管理、变更管理、服务级别管理（SLA）等流程，确保全球IT服务交付的标准化与可度量；2、管理全球服务台（Service Desk）日常运作，统筹L1/L2/L3技术支持梯队，确保用户报修、故障申告、服务请求在约定SLA内得到闭环处理;3、制定并监控全球IT服务KPI（如MTTR、FCR、SLA达成率、用户满意度），定期输出服务报告，向集团管理层汇报服务运营状况;4、深度对接集团OMS（订单管理系统）、WMS（仓储管理系统）、TMS（运输管理系统）、末端派送系统等核心业务系统，协同产研与运维团队，建立系统监控、告警、应急响应及容灾演练机制;5、组织重大故障的应急指挥与根因分析（RCA），推动问题根本解决与预防措施落地，降低业务中断风险;6、主导海外新国家/新站点开业的IT系统部署与验收工作，包括网络搭建、终端设备配置、业务系统初始化、本地团队培训与交接;7、与各国本地IT团队协同，解决跨境技术难题（如跨境数据传输合规、海外网络延迟优化、本地化系统适配等），保障集团产品在海外的高质量落地;8、负责全球IT服务团队（含海外本地工程师）的招聘、培训、绩效考核与梯队建设，建立“总部-区域-国家”三级服务支持体系;9、统筹全球IT资产（服务器、网络设备、终端设备等）的生命周期管理，确保资产台账清晰、利用率最大化。职位要求 1、本科及以上学历，计算机科学、信息技术、网络工程或相关专业优先；2、8年以上IT服务管理或技术支持相关工作经验，其中至少3年以上团队管理经验（管理过跨国或异地团队者优先）；3、精通ITIL/ITSM体系，持有ITIL Foundation及以上认证者优先；4、熟悉主流监控工具（如Zabbix、Prometheus、Grafana）、服务台系统（如Jira Service Management、ServiceNow）、自动化运维工具；5、具备多项目并行管理能力，有海外IT系统部署或大型IT服务转型项目成功经验；6、以业务价值为导向，平衡服务响应速度与资源成本，能从集团战略层面思考IT服务体系建设。投递...

Premium Full-time

极兔速递 (J&T Express) 21 days ago

Assistant Assistant Vice President - LME Engineering - Devop...

HKEX ( Shenzhen )

Location:CN-Shenzhen-HyQ Shift:Standard - 40 Hours (China) Scheduled Weekly Hours:40 Worker Type:Permanent Job Summary:The purpose of this role is to help build and run the LME’s new application hosting platform driving the adoption of Kubernetes based technologies

Premium Full-time Ips Azure GitLab Infrastructure as code Multi-site

HKEX 19 days ago

Senior AI Agent Test Developer, SDET

Nvidia ( Shanghai ) +1 other locations

NVIDIA has been transforming computer graphics, PC gaming, and accelerated computing for more than 25 years. It’s a unique legacy of innovation that’s fueled by great technology—and amazing people. Today, we’re tapping into the unlimited potential

Premium Full-time Elk Software Testing Python Test Cases Regression Testing

Nvidia 19 days ago

系统运维工程师（高效安全办公）

Bambu Lab ( Shenzhen )

系统运维工程师（高效安全办公）深圳全职研发职位描述 1、AI 工具栈运维：负责内部 AI Coding 工具（Cursor / Claude Code CLI / MCP 等）的企业内部部署、版本治理与日常运维，保障研发工具可用性；2、内网底盘运维：参与内网平台（代理池、API 网关、SSO、反向代理）的运维与迭代，承担模块级开发、配置变更与上线；3、SaaS 安全接入：参与主流 SaaS（设计 / 协作 / 网盘 / 通讯）的内网安全合规接入，承担反向代理配置、SSO 集成、流量管控规则编写；4、安全工具运维：承接信息安全工具（EDR / HIDS / DLP / IDS / 终端沙箱 /

Premium Full-time Python Git MTBF GPO Terraform

Bambu Lab 18 days ago

AI系统可观测性与质量保障实习生

Bambu Lab ( Shanghai )

AI系统可观测性与质量保障实习生上海、深圳实习研发职位描述职位描述： AI系统上线后，如何确保其稳定、可靠、持续优化？你需要为我们即将发布的AI Agent打造“仪表盘”和“自动化测试机器人”。在这里，你将开发监控系统，洞察AI的运行健康状况；构建测试框架，自动化评估AI的智能水平。用你的代码，守护AI的服务质量！职位要求我们希望你： - 本科及以上在校生，计算机、软件工程、通信工程等相关专业。 - 熟悉Python或Go，对数据可视化、自动化测试有热情。 - 了解基本的软件监控、日志收集概念。 - 细心严谨，具备优秀的问题发现和解决能力。 - 有使用过Prometheus, Grafana, 或任何测试框架经验者优先。实习收获： - 学习构建高可用、可观测分布式系统的核心方法论。 - 掌握AI时代特有的质量保障与评估技术。 - 培养从运维和全局视角看待复杂系统的能力。投递...

Premium Full-time

Bambu Lab 18 days ago

DevOps Engineer

QIMA ( Shenzhen ) +1 other locations

Company Description At QIMA, we are on a mission to offer our clients smart solutions to make products you can trust. Operating in over 100 countries, we serve the consumer products, food, and life sciences industries

Premium Full-time Incident Response DevOps Docker Shell Transparency

QIMA 17 days ago

AI数据研发工程师

RayNeo ( Shenzhen )

AI数据研发工程师深圳全职互联网 / 电子 / 网游职位描述 1、负责用户context信息采集体系的搭建、优化与落地，设计多源数据采集方案（涵盖用户行为、设备信息、交互轨迹等），对接前后端业务模块，制定采集标准，保障采集数据的完整性、准确性和实时性。2、主导数据平台全流程搭建与运维，负责音频、视频等全天候数据的接收、解析、转码、存储及流转管理，搭建高可用、高可靠的数据链路，处理海量音视频及3、结构化数据，保障平台7×24小时稳定运行，支撑业务正常运转及数据供给。优化数据处理管道，针对音视频数据体积大、处理效率低等特性，制定优化方案，提升数据处理时效与存储利用率，输出标准化、高质量的数据，为大模型训练提供合规、可用的训练语料（音视频、用户行为相关数据等）。4、负责数据平台监控体系搭建与维护，配置关键指标（数据采集量、处理延迟、存储占用、链路稳定性）监控告警，快速响应并排查数据丢失、传输异常、系统卡顿等故障，保障数据供给不中断。5、协同业务团队、算法团队，梳理业务数据需求及大模型训练数据需求，优化数据筛选、脱敏、标注流程，输出贴合需求的数据解决方案，支撑业务决策与大模型迭代训练。6、负责数据平台架构迭代优化，引入合适的技术框架，提升平台扩展性、可维护性，适配业务增长及大模型训练的数据量级提升需求，保障数据安全合规。职位要求 1、学历要求：本科及以上学历，计算机、大数据、软件工程等相关专业，1-3年及以上数据平台相关工作经验。2、技术能力：精通Flume、Logstash、Kafka等数据采集工具，熟练掌握Hadoop、Spark、Flink等大数据框架，具备音视频数据处理、用户context信息采集相关经验。3、运维能力：熟悉Docker、K8s容器化部署，具备全天候数据平台运维、性能优化及故障排查能力，能快速响应线上问题，保障平台高可用。4、存储与安全：熟悉HDFS、HBase、MySQL、MongoDB等存储方案，掌握数据脱敏、备份与恢复方法，了解数据安全合规相关要求，能保障数据安全。语言与工具：熟练使用Java、Python、Scala其中一种及以上编程语言，掌握Shell脚本编写，熟悉Prometheus、Grafana等监控工具者优先。5、业务理解：具备良好的业务敏感度，能快速理解数据平台对业务支撑、大模型训练的核心价值，具备较强的跨团队沟通协作能力和问题解决能力。6、加分项：有大模型训练数据供给、音视频全天候数据平台搭建相关经验者优先；熟悉数据分层设计、数据治理相关工作者优先。投递...

Premium Full-time

RayNeo 15 days ago

Backend Engineer

Meshy LLC ( Shanghai )

About Meshy Headquartered in Silicon Valley, Meshy is the leading 3D generative AI company on a mission to Unleash 3D Creativity by transforming the content creation pipeline. Meshy makes it effortless for both professional artists and

Premium Full-time Sequoia PostgreSQL Content Creation Fostering Kubernetes

Meshy LLC 13 days ago

Senior Software Engineer

Man Group ( China )

About Man Group Man Group is a global alternative investment management firm focused on pursuing outperformance for sophisticated clients via our Systematic, Discretionary and Solutions offerings. Powered by talent and advanced technology, our single and multi-manager

Premium Full-time Team Development Redis Stock Exchange Jenkins Log Shipping

Man Group 13 days ago

Prometheus Jobs In China - 57 Job Positions Available

Python Engineer - Numeric

NCX Engineer, AI Accelerator

运维工程师

运维开发工程师（偏日志与数据）

Graduate Program-Operations & Infrastructure Engineer

【集团】资深运维工程师（GOC）

【集团】资深运维工程师（Linux / 监控方向）

【集团】中级网络工程师

Golang后端开发实习生

DevOps / SRE 实习生

分布式计算与存储软件工程师

【集团】IT服务支持经理

Assistant Assistant Vice President - LME Engineering - Devop...

Senior AI Agent Test Developer, SDET

系统运维工程师（高效安全办公）

AI系统可观测性与质量保障实习生

DevOps Engineer

AI数据研发工程师

Backend Engineer

Senior Software Engineer

Subscribe for job alerts and resources to make your job search easier!

Also try:

Prometheus Jobs In China - 57 Job Positions Available

Subscribe for job alerts and resources to make your job search easier!

Also try:

More jobs about prometheus jobs in China :