Python Spark Jobs In Beijing (Peking) (Hiring near me)

后端开发实习生-python

Momenta ( Beijing )

后端开发实习生-python 北京实习互联网 / 电子 / 网游日常实习生职位描述协助自动驾驶数据产线平台的搭建与开发协助数据产线平台的故障与问题排查协助前后端联调职位要求硕士及以上学历，实习6个月及以上每周5天计算机、软件相关专业能快速理解业务需求，有产品原型设计能力熟悉Java、Python、Rust，以及相关开发框架有spark\trino\flink\hbase\es等数据引擎使用经验，源码阅读经验尤佳熟悉一种或多种数据存储与查询引擎（含数据库）投递...

Premium Full-time

Momenta 5 days ago

AIoT研发实习生-2027届

小米科技 Xiaomi Technology ( Beijing )

AIoT研发实习生-2027届北京校招实习软件研发类职位描述 1. 协助开发面向 IoT 场景的 Agent 能力，包括任务拆解、工具调用、结果汇总与异常处理。2. 协助构建 Agent 工作流（如 ReAct / Plan-Execute），配合完成设备控制、状态查询、知识问答等场景的端到端联调。3. 参与 Prompt 设计与迭代，协助完成 Agent 的效果评测与问题复盘，持续优化响应质量与稳定性。4. 借助 AI 工具辅助编码，实现 IoT 场景相关功能开发，参与 AI 在 IoT 业务中的落地实践。5. 协助维护 Java/Python 相关后台接口，基于 Spring Boot

Premium Full-time AI Spring Boot React SQL

小米科技 Xiaomi Technology 28 days ago

具身智能数据工程师

极佳科技 GigaAI ( Beijing )

具身智能数据工程师北京全职互联网 / 电子 / 网游职位描述负责具身智能方向的数据平台建设，支撑机器人、多模态感知、语言理解、动作决策、任务规划等场景的数据生产、管理、流转与分析。设计并建设大规模多模态数据处理平台，覆盖视频、图像、语音、文本指令、传感器数据、机器人操作轨迹、环境状态、任务执行日志等数据类型。负责数据采集、清洗、标注、质检、版本管理、样本检索、数据回流等核心链路的平台化能力建设。建设面向模型训练的数据集管理能力，包括数据集构建、切分、去重、质量评估、元数据管理、血缘追踪与可复现训练数据交付。参与搭建具身智能数据闭环系统，支持模型训练、评测、仿真、真实机器人执行后的数据回收与持续迭代。与算法、机器人、仿真、标注、产品等团队协作，抽象共性数据需求，沉淀稳定、高效、可扩展的平台工具。负责数据平台的性能优化、稳定性建设、权限治理、成本优化和工程规范落地。职位要求本科及以上学历，计算机、软件工程、人工智能、自动化、机器人、电子信息等相关专业优先。具备扎实的数据工程或后端平台开发经验，熟悉 Python / Java / Go / Scala 中至少一种语言。熟悉大规模数据处理链路，了解 Spark、Flink、Kafka、Airflow、Ray、Hadoop、Hive、ClickHouse、ElasticSearch 等技术中的一种或多种。熟悉数据库、对象存储、消息队列、任务调度、数据湖或数据仓库等平台基础组件。有良好的平台化思维，能够将复杂业务流程抽象为稳定的数据模型、任务系统、服务接口和工具链。具备较强的数据质量意识，理解数据清洗、标注质检、样本治理、版本管理、数据血缘、权限控制等工程问题。有多模态数据、机器人数据、视频理解数据、仿真数据或大规模模型训练数据平台经验者优先。熟悉 Kubernetes、Docker、云原生架构、分布式任务调度或高性能计算平台者优先。具备良好的沟通协作能力，能够与算法、工程、产品和运营团队高效配合，推动复杂系统落地。有具身智能、机器人学习、VLA / VLM / 多模态大模型相关数据平台经验优先。有数据标注平台、数据闭环平台、模型训练数据平台、仿真数据平台建设经验优先。熟悉 ROS、机器人日志格式、传感器数据、轨迹数据、仿真环境或模型评测链路优先。有从 0 到 1 搭建数据平台或核心数据链路的经验优先。投递...

Premium Full-time Java Scala Python

极佳科技 GigaAI 21 days ago

反作弊算法工程师

爱奇艺 IQIYI ( Beijing )

反作弊算法工程师北京社招全职技术 - 算法职位 ID：A117785 职位描述支持爱奇艺全域流量及推广渠道的反作弊体系。通过技术手段实现对虚假流量的检测和过滤，保障爱奇艺站内数据的真实性和渠道营销的可靠性。核心职责：-风险识别：利用机器学习、深度学习、大模型等技术，构建针对流量异常和渠道作弊的识别模型-反作弊策略制定：通过分析作弊目标（渠道、分账、广告分成）和作弊手段（如代理 IP、模拟器、云手机），制定并落地覆盖全链路的反作弊规则策略-反作弊效果评估：搭建完善的反作弊效果评估体系，评估其在流量和渠道方向的 ROI，并根据效果推进其在业务层面进行整改-反作弊能力建设：构建完善的反作弊特征库，利用离线和实时处理技术支持实时反作弊和离线反作弊，提升识别的实时性和准确率职位要求 -教育背景：计算机、信息类等相关专业硕士及以上-开发技能：熟练掌握 Java、Python、SQL/Hive 等计算机语言，熟悉 Hive、Spark、Flink 等 Hadoop 生态，具备大规模海量数据处理能力，有实时计算经验者优先-算法能力：熟练掌握基础的机器学习算法，如：LR、RF、GBDT、XGBoost等，有使用异常检测算法、图分析、深度学习等优先；-综合素质：具备高度的数据洞察和逻辑推理能力，能够从海量数据中捕捉到细微的数据异常并分析数据异常的原因，具备高效的沟通能力，能与各业务方沟通解决业务对反作弊的核心述求并推进实施；-反作弊经验：了解广告生态和归因逻辑，了解常见的作弊手段，了解黑产供应链者优先。投递...

Premium Full-time Hadoop

爱奇艺 IQIYI 21 days ago

Data Engineer China Hub

Mercedes-Benz Group AG ( Beijing )

Tätigkeitsbereich:Produktion Fachabteilung:Strategic & NTP Planning China & MO/EC Hub Gesellschaft:Mercedes-Benz Group China Ltd. Standort:Mercedes-Benz Group China Ltd., Beijing Startdatum:01.09.2026 Veröffentlichungsdatum:03.07.2026 Stellennummer:MER00044IH Arbeitszeit:Vollzeit Bewerben Aufgaben Objective of Job: Design, build, and maintain robust, scalable data architectures that

Premium Full-time Decision-Making Governance Hub Steering Access Control

Mercedes-Benz Group AG 18 days ago

Data Engineer, Health Research Data

Apple ( Beijing )

SummaryApple is where individual imaginations gather together, committing to the values that lead to great work. Every new product we build, service we create, or Apple Store experience we deliver is the result of us making

Premium Full-time Data Quality Spark Data Processing Apache Spark Apple Watch

Apple 8 days ago

Get Hired 2x Faster
Connect with Top Employers Directly

AIML - ML Platform Engineer (Apple Ecosystem), Data Intellig...

Apple ( Beijing )

SummaryWe are looking for engineers with a passion for using machine learning to create intelligent applications. Be part of a highly accomplished, deeply technical and close-knit team of machine learning engineers, you will create tools that

Premium Full-time Artificial Intelligence Latency Software Development Apache Spark AI

Apple 8 days ago

高级算法工程师

Xiaomi ( Beijing )

高级算法工程师北京社招全职职位 ID：A229937 职位描述 1. 负责排线、道口均衡、配载均衡等模型的开发与优化工作，通过先进的算法设计，解决多供应商、多工厂入厂运输过程中的复杂问题，提高运输效率，降低运输成本。2. 针对场内排产、排程、VDC路径规划等场景，开发高效的算法模型，确保工厂内部物流运作的顺畅和高效，满足生产计划和调度的要求。3. 负责库存优化算法的开发与实施，通过数据分析和建模，优化库存水平，降低库存成本，同时确保供应链的稳定性和响应能力。4. 与供应链管理、物流运营、生产计划等部门紧密合作，深入了解业务需求，确保算法模型能够有效支持业务目标的实现。5. 跟踪国内外供应链物流领域的最新算法研究成果和技术动态，结合公司业务需求，探索新的算法应用方向和技术创新点。职位要求 1. 计算机、数学、统计学或人工智能等相关专业硕士学历以上；博士优先。有工厂域排产排程经验者优先。2. 熟练掌握运筹学、数学建模、优化算法等基础知识，具备扎实的数学功底和逻辑思维能力。3. 精通Python、Java等编程语言，熟悉常用数据结构和算法。4. 熟悉机器学习、深度学习、运筹优化、统计学等算法，了解大模型相关理论，有大模型部署、微调经验，熟悉Qwen、ChatGPT、InternVL等大模型。5. 熟悉大模型（如 LLM）的微调技术（如 LoRA）和部署流程，具备 Prompt 调优的经验，能够根据业务需求设计和优化 Prompt，提升模型的性能和输出质量。6. 熟悉数据挖掘和大数据处理工具（如Hadoop、Hive、Spark），熟练使用算法框架（如TensorFlow、PyTorch）和优化工具（如Gurobi、Ortools）。7. 具备在复杂业务场景下独立开展算法项目的能力，能够从问题定义、数据收集与分析、模型构建与优化到实际部署的全流程进行有效推进。投递...

Premium Full-time

Xiaomi 6 days ago

高级大数据研发工程师

Xiaomi ( Beijing )

高级大数据研发工程师北京社招全职职位 ID：A94598 职位描述 1、负责小爱内容资源数据流及数据服务建设；2、负责小爱内容数据、搜索推荐服务架构优化；3、负责小爱用户画像、LLM通用知识库建设。职位要求 1、熟悉大数据相关技术：Spark/Flink/Hadoop/HBase/Hive/Iceberg等；2、熟练使用Java、Scala、Python语言中的一种或者多种，熟悉java常见数据结构、多线程并发、JVM等；3、熟悉常用基础组件：Mq/Redis/Es等；具备数据库系统理论知识，熟悉Mysql/Tidb等，精通SQL；4、有过分布式、高并发业务系统搭建经验优先；5、熟悉大模型(LLM)技术，对向量数据库、RAG等有过深入调研优先；6、责任心强，具有较强的学习、沟通和问题解决能力。投递...

Premium Full-time

Xiaomi 6 days ago

高级大数据开发工程师

百观科技 BigOne Lab ( Beijing )

高级大数据开发工程师北京全职互联网 / 电子 / 网游职位描述 - 参与公司数据湖架构搭建和开发；- 参与ETL设计，数据工程建设和数据可视化开发；职位要求基本要求：- 全日制本科学历，计算机相关专业，5年-10年大数据开发工作经验；- 熟悉公有云架构，对阿里云/AWS数据湖生态有丰富的项目经验；- 熟练使用MR/Spark/Flink等大数据计算框架，掌握Java/Scala/Python等开发语言- 掌握数据湖体系架构、数据建模方法、数据治理等知识，较强的业务理解和抽象能力；- 熟系Airflow调度工具，使用Zeppelin、Jupyter Notebook进行数据开发； - 熟系AWS LakeFormation、Glue、EMR大数据组件，使用Java，Spark，Python进行数据分析；加分项：- 数据湖方向做过前瞻性技术规划的建设经验者，优先；- 通过技术驱动产品变革，并带来好的结果经验者，优先；投递...

Premium Full-time

百观科技 BigOne Lab 6 days ago

数据分析师（数据科学方向）

百观科技 BigOne Lab ( Beijing )

数据分析师（数据科学方向）北京全职互联网 / 电子 / 网游职位描述职位描述：数据分析师是百观数据产品开发的中坚力量。我们会一起挑战数据分析相关的各种有趣问题。在自由开放的氛围下，将前沿的数据科学、数据分析技术转化成业界独一无二，极具价值的产品。职责：与产品经理一起分析需求，设计数据产品的计算方案、可视化方案以及更深入的挖掘数据价值将数据科学应用到实际产品开发中职位要求基本要求：- 本科及以上学历；统计、数据科学、计算机等相关专业；- 精通至少一种脚本语言，例如Python；熟悉至少一个数据科学模块，例如Sklearn, TensorFlow, Pytorch；深刻理解所使用的算法细节- 擅长将复杂的算法及量化分析过程，以清晰、准确和高效的方式，与跨部门或不同背景的同事交流- 熟悉处理和分析复杂、大量和多维度的多源数据- 熟悉关系型数据库和数据库查询语言，例如SQL- 有使用大数据处理相关组件的经验，例如Spark, Hadoop, Presto- 良好的英文阅读和沟通能力投递...

Premium Full-time

百观科技 BigOne Lab 6 days ago

提前批-数据分析工程师

NIO ( Beijing )

提前批-数据分析工程师北京校招正式数字技术 - 算法本科及以上 2027届校园招聘-技术提前批职位 ID：A222213 职位描述 1. 负责智能语音业务场景下的用户行为数据分析与挖掘，聚焦用户个性化行为模式的识别；2. 通过分析用户历史交互与偏好，构建用户长期记忆模块，为AI Agent的个性化响应与功能决策提供数据支持； 3. 负责构建NLP、智能对话、问答等AI功能模块的数据指标体系，设计并研发关键评估指标，实现对AI产品表现的系统化监测与问题定位； 4. 基于用户与AI系统的交互数据，开展深入的数据挖掘与行为分析，探索用户使用路径、意图分布及体验瓶颈，推动语音产品体验持续优化； 5. 沉淀分析思路与数据方法，协同产品、研发等多团队，推动数据结论转化为AI功能迭代与产品决策。职位要求 1. 本科及以上学历，数学、统计学、计算机、人工智能等相关专业背景；2. 精通SQL，熟悉Hive/Spark/ClickHouse等平台的数据开发与性能优化；3. 熟练使用Python进行数据处理与分析，具备UDF、MapReduce等基础开发能力；4. 具备扎实的数据分析与挖掘能力，逻辑清晰，能够独立完成从数据提取到业务洞察的全流程工作；5. 具备指标体系建设、AB实验、用户画像等相关项目经验者优先；6. 有AI产品相关数据分析经验者优先，熟悉智能语音、对话系统、NLP等相关领域者优先；7. 对AI产品逻辑有理解，具备将数据洞察转化为产品改进的能力。投递...

Premium Full-time

NIO 5 days ago

Staff Software Engineer — Tech Lead, Backend

Conviva ( Beijing )

Conviva is the first and best place to understand and optimize digital customer experiences. Our Operational Data Platform harnesses full-census, comprehensive client-side telemetry—capturing every aspect of customer experience and engagement across all devices and linking them

Premium Full-time Code Review Analytics GitHub Mentoring Real-Time Data

Conviva 5 days ago

Python Spark Jobs In Beijing (Peking) - 13 Job Positions Available

后端开发实习生-python

AIoT研发实习生-2027届

具身智能数据工程师

反作弊算法工程师

Data Engineer China Hub

Data Engineer, Health Research Data

AIML - ML Platform Engineer (Apple Ecosystem), Data Intellig...

高级算法工程师

高级大数据研发工程师

高级大数据开发工程师

数据分析师（数据科学方向）

提前批-数据分析工程师

Staff Software Engineer — Tech Lead, Backend

Subscribe for job alerts and resources to make your job search easier!