About the Role: In this role you will have the following key business responsibilities: Team Leadership Lead and directly manage a team of 2–3 Data Analysts, providing day-to-day guidance, technical oversight, and structured feedback to ensure
高级大数据开发工程师北京全职互联网 / 电子 / 网游职位描述- 参与公司数据湖架构搭建和开发;- 参与ETL设计,数据工程建设和数据可视化开发;职位要求基本要求:- 全日制本科学历,计算机相关专业,5年-10年大数据开发工作经验;- 熟悉公有云架构,对阿里云/AWS数据湖生态有丰富的项目经验;- 熟练使用MR/Spark/Flink等大数据计算框架,掌握Java/Scala/Python等开发语言- 掌握数据湖体系架构、数据建模方法、数据治理等知识,较强的业务理解和抽象能力;- 熟系Airflow调度工具,使用Zeppelin、Jupyter Notebook进行数据开发; - 熟系AWS LakeFormation、Glue、EMR大数据组件,使用Java,Spark,Python进行数据分析;加分项:- 数据湖方向做过前瞻性技术规划的建设经验者,优先;- 通过技术驱动产品变革,并带来好的结果经验者,优先;投递...
湖仓开发工程师北京社招全职互联网 / 电子 / 网游职位描述-负责企业级数据湖仓平台的设计、开发与维护;-负责湖仓内数据建模、数据加工、数据采集、分层设计等工作,保证数据质量与一致性;-负责编写高性能ETL任务,维护Flink、Spark等计算任务的稳定运行;-负责元数据管理、数据质量监控、数据血缘分析、权限系统的设计与开发;-和业务方进行需求对接,完成业务数据到湖仓到使用的全链路工作;职位要求-计算机、大数据等相关专业,本科及以上学历;-精通Java、Python、Go等语言中一种或多种,具备良好的编码习惯;-熟练掌握Spark、Flink、Kafka、Hive、Doris等大数据组件,深入理解端到端一致性及具体实现,具备实时湖仓开发经验;-熟悉数据湖技术(如Iceberg)、湖仓分层、湖仓一体架构,深入理解ACID、Schema Evolution、Time Travel等核心特性及使用场景;-具备良好的沟通协作能力,主动性强,能独立定位和解决问题;-熟悉Iceberg、Flink、Doris等相关大数据组件源码者优先;-有自动驾驶领域的湖仓数据平台开发经验者优先。投递...
Amazon ATE (Analytics Technology and Engineering) team is seeking for a contractor Data Engineer of deep expertise in creation and management of datasets. The role is responsible to build data analytical solutions that will address increasingly
数仓开发实习生北京实习职位 ID:A53711职位描述1、负责BI数据需求开发工作;2、参与数据仓库架构设计与数据开发,建设数据仓库模型。职位要求1、2027年及以后的毕业生,或已保研的同学,一周可实习四天及以上;2、精通Hive SQL,熟悉Hive/MySQL的基本原理和调优策略,熟悉大数据处理相关技术,有Hadoop开发经验,掌握MapReduce;3、熟悉数据仓库模型设计方法论,并有实际模型设计及ETL开发经验 ,灵活运用SQL实现海量数据ETL加工处理与查询性能调优;4、熟悉常用的数据挖掘、分析的工具和方法,有数据挖掘工作经验;熟悉linux平台,精通shell/c(c++)/php/python/等脚本语言的一种或多种,编码基本功扎实。投递...
数据仓库工程师 北京 全职 互联网 / 电子 / 网游 职位描述 我们正在寻找一位基础扎实、对数据敏感的数据仓库开发工程师。您将负责设计、构建、优化和维护公司核心业务决策所依赖的数据仓库、数据集市及相关数据资产,确保数据的高质量、一致性和可访问性,为业务决策提供坚实的数据基础。1 负责业务数据仓库的设计和优化,包括数据模型设计、ETL/ELT流程开发,性能优化,数据质量保障,支持业务快速迭代。2 管理数据仓库中的元数据信息,包括数据来源、数据定义和数据关系,提升数据可发现性和可理解性。3 与数据分析师、产品经理及业务部门紧密协作,理解业务需求并转化为高效的数据解决方案。 职位要求 1 3年以上大数据/数仓开发经验,能够编写复杂SQL,精通数仓建模方法论,以及在社交,游戏,电商等领域有实际的项目交付经验2 熟练掌握常用的大数据组件,了解其使用场景和优势。包括但不限于:Hive/Presto/StarRocks/Spark/Flink 等3 至少掌握一种编程语言,包括但不限于:Python/Java/Scala等,具备良好的工程化思维。4 具备良好的数据质量管理意识,能够设计并实施数据质量监控体系5 优秀的沟通能力和团队协作精神,能够与非技术团队有效沟通数据需求。具备以下项目经验优先考虑1 有大规模数据仓库设计与优化经验,处理过PB级数据,了解数据湖,有iceberg 项目经验2 具备数据治理、元数据管理相关项目经验 投递...
具身智能算法工程师-数据 北京 社招 全职 职位 ID:A208209 职位描述 1. 负责具身智能数据平台的搭建与开发,构建覆盖采集、处理、标注、质检全链路的自动化数据管线,支撑大规模机器人学习数据的高效生产;2. 研发基于三维重建的场景与物体数字化技术(如 NeRF、3D Gaussian Splatting、MVS 等),构建高保真三维资产库,为仿真环境与合成数据生成提供基础数据支撑;3. 开发人体与手部运动建模系统,涵盖全身动作捕捉、灵巧手姿态估计、人手-物体交互重建等,将人类示范数据高效转化为机器人可用的训练数据;4. 设计并实现自动化/半自动化标注系统,结合视觉基础模型(SAM、GroundingDINO 等)与主动学习策略,实现操作任务中关键语义信息(动作分割、接触检测、物体状态等)的高效标注;5. 搭建多模态数据采集系统,集成多视角相机、深度传感器、力/触觉传感器、动捕设备等,设计标准化采集流程,保障数据质量与一致性;6. 建立数据质量评估与治理体系,开发数据清洗、去重、平衡、增强等工具,构建面向机器人操作任务的高质量 benchmark 数据集;7. 与算法团队紧密协作,根据模型训练需求(VLA、World Model、RL 等)定义数据规格,推动数据驱动的算法迭代闭环。 职位要求 1. 计算机科学、计算机视觉、机器人学、自动化、人工智能等相关专业硕士及以上学历;2. 扎实的编程能力,精通 Python,熟悉 C/C++,有大规模数据处理系统开发经验;3. 在以下方向中的至少一个具备深入的研究或工程经验:-三维重建与场景理解:熟悉 NeRF、3DGS、SfM/MVS、TSDF 等三维重建方法,了解 Open3D、COLMAP 等工具链;-人体与手部建模:熟悉 SMPL/MANO 等参数化人体模型,有动作捕捉数据处理、手部姿态估计、人手-物体交互建模经验;-自动化标注与数据管线:熟悉视觉基础模型(SAM、CLIP、GroundingDINO