AI院-GLM团队-预训练算法工程师 北京 全职 研发 - 算法 职位描述 职位描述1. 参与数学或代码大模型预训练的研发工作,包括模型的预训练、对齐和评测等2. 负责构建和优化数学或代码的预训练和对齐数据,提升模型在数学或代码任务上的效果3. 探索针对数学或代码任务的数据合成方法,提升模型在数学或代码任务上的泛化能力 职位要求 职位要求1. 自然语言处理、机器学习等相关专业,硕士及以上学历;2. 较强的算法开发能力,熟悉常用的机器学习、深度学习算法;3. 熟练使用Pytorch、Huggingface、DeepSpeed等框架;4. 对Transformer的架构有较为深入的理解,了解Transformer的各种变体,有相关的研究经验者优先;加分项:1. 在ACL,NeurIPS,ICLR,EMNLP等顶级会议或期刊上发表过论文者优先;2. 熟悉并行训练框架,有多机多卡训练经验者优先;3. 熟悉CUDA编程/Triton编程,有相关算子加速经验者优先; 投递...
AI院-GLM团队-模型代码预训练算法工程师 北京 全职 研发 - 算法 职位描述 1. 负责代码预训练数据的合成、清洗、权重分配、来源扩充等一系列工作,持续提高代码预训练、中训练数据质量;2. 负责探究预训练小领域数据的配比和最终效果之间的关系;3. 开发数据筛选和合成链路,提升基座模型在下游代码任务中的能力; 职位要求 1. 本科及以上学历,计算机、软件工程、人工智能等相关专业;2. 具备优秀的代码能力和基础算法功底,有较为丰富的工程经验,有大规模训练经验或大规模数据处理经验;3. 关注代码生成领域前沿进展,对提升模型代码生成能力充满热情;4. 具有良好的团队合作精神,善于分析和解决问题,有较强的沟通能力和学习能力;5. 在大模型 / 代码生成领域有研究论文者优先;熟悉大模型预训练 / SFT / RL 者优先; 投递...
AI院-GLM团队-后训练算法工程师 北京 全职 研发 - 算法 职位描述 我们正在寻找充满激情和创造力的你,加入我们与大模型领域领军企业合作的前沿项目!你将有机会参与到行业领先的模型研发中,共同推动大模型技术在真实的、知名的、有影响力的应用的边界。【希望你可以承担以下工作】1、数据艺术的缔造者: 针对模型特定能力进行数据构造、筛选和优化,特别是在数学、代码、复杂推理等领域的特定数据筛选和合成;并负责对齐数据的质量和多样性控制,让数据成为模型进化的沃土。2、思维链的延伸者: 探索模型如何通过更长的思维链推理,在复杂任务上取得更优的效果,并提升post-training阶段训练和推理的扩展能力,让模型拥有更强大的逻辑推理能力。3、强化学习的优化师: 提升算法的可扩展性和稳定性,优化后训练 scaling 性能;优化多目标奖励模型,并探索结合CoT和过程监督来优化奖励模型,让强化学习算法更高效、更稳定。4、对齐范式的创新者: 结合模型监督、self-improve 等进行训练优化探索;攻克交互任务复杂推理难题;让模型的理解和生成能力更上一层楼。 职位要求 【我们需要这样的你】1、0-5 年经验,高潜人才: 拥有自然语言处理、机器学习、计算机视觉等相关专业背景,硕士及以上学历,我们相信经验不是唯一的衡量标准,潜力同样重要。2、算法高手: 具备较强的算法开发能力,熟悉常用的机器学习、深度学习算法,能够将理论转化为实践。3、框架专家: 熟练使用Pytorch、Huggingface等框架,让技术成为你挥洒创意的工具。4、Transformer 深度理解者: 对Transformer的架构有较为深入的理解,了解Transformer的各种变体,有相关研究经验者优先,让我们一起探索Transformer的更多可能。5、翻译、多语言项目参与者:参加过大模型翻译、多语言项目加分。【我们提供】1、前沿的技术视野: 置身于大模型技术发展的最前沿,与行业顶尖团队并肩作战。2、有影响力的项目: 参与到具有挑战性并且有知名度、影响力的项目中,发挥你的最大潜力。3、完善的成长体系: 提供完善的培训体系和职业发展路径,助力你的个人成长。4、有竞争力的薪酬: 提供具有市场竞争力的薪酬和福利待遇。【我们期待你的加入!】 投递...
AI院-GLM后训练团队-算法工程师(社招) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 高阶推理能力提升:针对DeepResearch、CodeAgent等复杂推理任务开发专门的能力提升方案;探索长思维链推理机制,提升模型在Agent相关任务上的表现和泛化能力;2. 复杂推理训练扩展性研究:探索模型通过长思维链推理在Agent相关任务上的效果提升;实现不同- Agent任务间的能力迁移和扩展3. 对齐训练范式探索:探索新型对齐训练范式,整合多类型监督信号进行训练优化;研究不同监督条件下的训练可扩展性,推动后训练效果向预训练scaling效果靠拢4. 对齐数据构造与优化:针对特定能力领域(数学、代码、复杂推理等)进行数据构造、筛选和优化;设计数据合成策略,控制对齐数据的质量和多样性 职位要求 【职位要求】1. 985高校计算机、电子、自动化等相关专业硕士或博士学位(优秀本科生亦可考虑);1-3 年工作经验,或以上。2. 深入理解常用的大模型算法;具备后训练及数据处理相关项目经验者优先3. 在CCF-A类会议发表过相关论文者优先考虑4. 熟练运用Pytorch、transformers、megatron等主流框架5. 工作态度认真负责,具备良好的团队协作能力【加分项】6. 在ACL,NeurIPS,ICLR,EMNLP,ICML等顶级会议或期刊上发表过论文者优先;7. 熟悉并行训练框架,有多机多卡训练经验者优先。 投递...
AI院-GLM团队-AI-Native 全栈工程师(偏后端) 北京 全职 研发 - 后端开发 职位描述 1、探索并创造基于大模型的工程级代码生成服务和产品,助力开发者迎接更高效的提效体验;2、关注AI领域的最新动态和趋势,结合开发者的实际需求,为我们提供高性能、适应性强的技术解决方案;3、对产品的稳定性和性能极致的追求,深入理解并致力于优化和重构,确保系统高效、稳定运作; 职位要求 1、本科及以上学历,计算机相关专业,有三年及以上相关工作经验;2、对前端或者后端至少精通一个方向:2.1)前端开发:熟悉 HTML、CSS、JavaScript、TypeScript 等 Web 前端技术;掌握 React/Vue 等 MDV 前端框架;熟悉基于 Next.js/Nuxt.js 等脚手架的项目开发;掌握 HTTP 协议、浏览器原理、性能优化等Web 前端核心知识;有扎实的 Node.js 基础,能解决前端工程化问题。2.2)后端开发:对 Python、Java、Go 等后端开发语言有深度的理解和实践经验,包括但不限于数据处理、服务器搭建和维护、数据库操作、API的设计和实现;对微服务架构、分布式计算,以及云服务等领域有了解或实际操作经验者优先;3、对探索大模型有极大热性,有大模型相关领域研发经验者优先。4、熟练使用 Linux,熟悉 Docker、Kubernetes 等容器技术的使用,了解其原理;熟悉云原生下的服务开发部署流程,熟悉 Prometheus + Grafana 的使用; 投递...
AI院-GLM团队-模型代码后训练算法工程师 北京 全职 研发 - 算法 职位描述 1. 负责基座模型在各类代码生成 / Coding Agent 场景的效果优化;2. 分析业务需求,针对不同应用场景的设计训练方案,提高模型在不同下游应用上的的性能;3. 跟进 LLM 代码生成前沿技术,持续优化基座模型完成各类复杂代码生成任务的能力; 职位要求 1. 本科及以上学历,计算机、软件工程、人工智能等相关专业;2. 具有数据构建和指令微调经验(重要),具备优秀的代码能力和基础算法功底,有较为丰富的工程经验(重要);3. 具有优秀的逻辑思维能力,关注代码生成前沿进展,对提升模型代码生成能力充满热情;4. 具有良好的团队合作精神,善于分析和解决问题,有较强的沟通能力和学习能力;加分项:1. 有代码生成 / Coding Agent 项目经验者优先;2. 在大模型 / 代码生成领域有研究论文者优先;3.熟悉大模型预训练 / SFT / RL 者优先; 投递...
AI院-GLM后训练团队-推理优化/推理Infra工程师(RL) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 基于SGLang进行大模型推理引擎与服务侧开发,提升吞吐、降低时延与成本,保障线上稳定性。2. 支持RL训练相关的推理链路,包括rollout生成、打分/奖励模型推理等,优化训练闭环效率与资源利用。3. 建设推理侧的监控与性能分析能力,参与线上问题定位与故障处理。4. 与算法/训练团队协作,将模型与训练需求落地到可运行、可维护的推理系统,并输出必要的技术文档。 职位要求 1. 熟练使用Python/C++(至少一种),具备良好的工程能力与性能意识。2. 熟悉GPU推理与常见深度学习框架(如 PyTorch),了解分布式通信与并行基本概念(NCCL 等)。3. 了解并使用过SGLang(或能快速上手并承担核心模块开发与调优)。4. 理解RL训练中推理侧的作用,能够与训练流程协同推进落地。5. 具备线上系统排障能力,能通过日志/指标定位性能与稳定性问题。加分项6. 有大模型推理系统、RLHF/RL 推理链路或训练-推理协同经验。7. 有推理性能profiling、算子/运行时优化经验。8. 有MoE模型优化经验。 投递...
AI院-GLM后训练团队-强化学习训练框架工程师 北京 全职 互联网 / 电子 / 网游 职位描述 1. 负责强化学习训练框架的研发、优化和维护,根据业务需求持续改进训练框架和策略,提升模型训练效率2. 分析和定位训练中的性能瓶颈,实施针对性优化措施,提升训练效率和稳定性3. 跟进业界技术进展,不断同步与集成最新训练优化策略 职位要求 1. 本科及以上学历,计算机相关专业,2-5 年工作经验2. 对自然语言处理、计算机视觉和多模态算法有深入理解,熟悉主流的 LLM 模型架构,有分布式训练经验3. 对常见 RL 训练算法有基本了解4. 熟悉 vllm 或 sglang 等常用开源推理框架的优先考虑 投递...
AI院-大模型算法- GLM预训练数据研究 北京 全职 互联网 / 电子 / 网游 职位描述 一、大规模预训练数据处理与优化1. 设计和优化PB级训练数据的筛选、去重、清洗体系2. 基于LLM模型的语义级去重算法、质量筛选算法优化3. 领域特定数据筛选策略,支持代码、数学、科学等专业领域二、数据质量评估与优化体系1. 构建基于大模型的数据质量自动评估系统2. 设计数据多样性、复杂度、有用性等多维度评估指标3. 优化数据配比策略,包括领域权重、语言分布、质量分层4. 构建数据污染检测算法,识别测试数据泄露 职位要求 一、基础要求1. 统招硕士或以上学历,计算机、AI相关专业2. 大模型预训练项目经验,深度参与过大模型预训练数据处理3. 有处理TB级以上训练数据的实际项目经验二、技术能力1. 精通分布式计算框架(Spark、Ray、Maxcompute等)2. 掌握高性能文本处理算法(LSH、SimHash等)3. 熟悉云原生数据处理架构4. 熟悉数据质量评估指标和方法【加分项】1. 有开源大模型项目数据相关的贡献经验2. 发表过大模型数据相关的顶会论文3. 熟悉 AI 伦理与安全合规的数据处理流程 投递...
AI院-GLM团队-AI Native 全栈工程师(偏前端) 北京 全职 研发 - 前端开发 职位描述 1、探索并创造基于大模型的工程级代码生成服务和产品,助力开发者迎接更高效的提效体验;2、关注AI领域的最新动态和趋势,结合开发者的实际需求,为我们提供高性能、适应性强的技术解决方案;3、对产品的稳定性和性能极致的追求,深入理解并致力于优化和重构,确保系统高效、稳定运作。 职位要求 1、本科及以上学历,计算机相关专业,有三年及以上相关工作经验;2、熟悉 HTML、CSS、JavaScript、TypeScript 等 Web 前端技术;3、掌握或了解 React/Vue/Svelte 等前端框架;4、熟悉基于 Next.js/Nuxt.js 等脚手架的项目开发;5、掌握 HTTP 协议、浏览器原理、性能优化等Web 前端核心知识;6、有扎实的 Node.js 基础,能解决前端工程化问题。7、对探索大模型有极大热性,有大模型相关领域研发经验者优先。 投递...
AI院-GLM团队-SRE运维工程师 北京 全职 研发 - 运维 职位描述 岗位职责:1.负责TOC相关业务的稳定性建设,包括但不限于Web服务、APP后端、API网关2.负责Kubernetes集群的建设与稳定性保障,包括版本升级、故障排查、资源利用率优化3.设计高可用架构,解决APIServer性能瓶颈、etcd存储压力等大规模集群特有问题。4.主导容器化架构调优(如Pod调度策略、网络插件选型、存储方案设计),优化资源请求/限制配置以减少资源争用。5.建立容器安全防护体系,包括漏洞扫描、运行时安全监控(如Falco)、合规审计。5.深度参与自动化运维工具链建设,CI/CD流水线混沌工程测试、智能扩缩容(HPA/VPA)推动Al0ns落地,其于时字数据合析预洲售群负裁并实现自愈。7. 解决生产环境疑难问题(如 OOM、网络延迟、存储性能瓶颈),输出标准化SOP文档车8.协同研发团队优化微服务架构,推动ServiceMesh等新技术落地, 职位要求 1.教育背景-统招本科及以上学历,计算机、软件工程、云计算相关专业优先。2.工作经验-3年以上容器运维经验,主导或深度参与过千级 Pod规模的集群维护。-熟悉生产环境容器化全生命周期管理,包括部署、监控、扩缩容、故障恢复等场景。-有多云环境/混合云管理经验-头部互联网/云计算大厂优先3.技术能力精通Kubernetes架构及生态工具(如Etcd、Calico、Istio),具备集群性能调优经验(如APIServer负载均衡、节点调度优化);熟练使用Docker、Prometheus、Grafana、ELK、CI/CD等工具链,熟悉云原生安全体系(如镜像扫描、RBAC策略、网络策略);具备运维开发能力,能使用Python/Go开发自动化工具(如自定义Operator、监控告警脚本)。 投递...
AI院-GLM团队-大模型后训练算法工程师(Coding Agent 方向) 北京 全职 研发 - 算法 职位描述 1、负责模型在 Coding Agent 场景的优化;2、研究大规模数据合成和强化学习方案,提升模型在各类 Coding 框架下的性能;3、设计和实现评测方案,全方位衡量模型在真实场景中的 Coding Agent 相关能力; 职位要求 1、本科及以上学历,计算机、软件工程、人工智能等相关专业;2、熟悉 LLM 相关技术,具有数据构建 / 指令微调 / 强化学习经验,具备优秀的代码能力和基础算法功底,有丰富的工程经验和良好的编程习惯(重要);3、具有优秀的逻辑思维能力,善于分析和解决问题,关注代码生成前沿进展,对提升模型代码生成能力充满热情;4、具有良好的团队合作精神,有较强的沟通能力和学习能力;加分项1、有 Coding Agent 相关经验者优先;2、在大模型 / 代码生成领域有研究论文者优先;熟悉大模型预训练 / SFT / RL 者优先; 投递...
AI院-GLM团队-AI Native UI设计师 北京 全职 互联网 / 电子 / 网游 - 设计 职位描述 1、负责大模型相关产品和平台的UI设计与迭代(Web端/移动端),输出设计方案,洞察可优化细节,把控开发效果;2、负责与业务沟通确定产品体验目标,准确理解业务需求,分析用户痛点,通过信息架构流程梳理,挖掘核心诉求,从而解决产品体验问题;3、全面跟进产研流程,和产品、研发团队紧密协作,跟进设计方案落地,确保方案高度还原。 职位要求 1、有高频使用的Chatbot类产品, 了解 claude,gemeni,manus, genspark 等相关产品及交互, 有大模型产品设计经验;2、有3年或以上C端社区类、社交类、工具类产品设计经验,熟悉海外市场为佳;Ul设计、工业设计、人机交互、心理学等相关专业优先;3、具有扎实视觉设计功底,拥有逻辑思维和解决问题的能力,具备良好的审美,有设计落地能力;4、对国际化设计趋势有较强自驱和学习意愿,具备创业精神,有优秀的理解沟通能,能有效传达和推动自己的想法落地;5、工作积极主动,拥有较强的好奇心、创造力和责任感,对设计品质有极高追求;6、熟练精通Figma等设计工具,可以独立完成动效输出。 投递...
AI院-GLM团队-AI Native 测试工程师 北京 全职 研发 - 测试 职位描述 1、保障AI应用服务端接口质量和稳定性,系统性地攻克质量风险,持续优化产品质量;2、逐步构建全面的自动化测试体系;3、优化产研流程、标准,持续推动过程质量改进,持续提高项目迭代效率;4、 负责质量专项建设,设计并实现质量专项能力,在多业务线推广落地; 职位要求 1、接触过大模型产品, 接触过大模型服务端接口, 了解SSE,Websocket、WebRTC协议;2、本科及以上学历,计算机相关专业,3-5年左右互联网公司测试开发经验;3、有一定服务端测试经验;4、有丰富的专项测试和优化经验,有0-1测试工具平台搭建经验者优先;5、具备较好的发现和解决问题的能力,及时发现问题并找出问题的原因,采取有效的措施推动问题的解决;6、自驱能力强,有优秀的沟通技巧和组织协调能力,抗压能力强,责任心强; 投递...
AI院-GLM团队-训练/推理infra算法工程师 北京 全职 互联网 / 电子 / 网游 职位描述 岗位职责 1. 与算法团队深度协作,参与 下一代 GLM 大模型架构设计与系统实现 ,推动模型结构与系统效率的协同优化2. 构建 大模型推理成本分析与模拟系统 ,从算力、通信、KV cache、并行策略等维度优化推理效率3. 设计与优化 超大规模训练基础设施(万卡级) ,提升训练稳定性、资源利用率与训练效率4. 探索 MoE、Sparse Attention、长上下文等新架构在训练与推理系统中的高效落地 你将参与 * 下一代 GLM 系列基础模型(百亿到万亿参数级) 的系统设计* 万卡规模训练系统 的优化与稳定性工程* 推理系统的 极致效率优化(吞吐 / 延迟 /
大模型算法工程师- 金融行业应用 北京 全职 互联网 / 电子 / 网游 职位描述 我们团队专注于将GLM系列大型模型推向商业市场,服务于中央企业、国有企业、金融机构、能源行业等高端企业客户。我们致力于帮助这些客户迅速搭建起新一代人工智能的平台架构,培育技术力量,并实现场景化的应用部署。依托于我们构建的企业级原生大模型应用开发平台,我们为用户提供了一系列专业化的产品与服务,覆盖音视频智能分析、多源异构知识整合管理、项目全生命周期研发支持、零代码的大模型应用快速开发,以及客户关键业务流程的智能化应用等多个领域。我们的目标是通过提升企业的运营效率,推动客户智能化转型,从而为企业带来更加深远的价值增长。岗位职责:1、负责大模型的研究和应用,包括但不限于LLM、SFT、Agent/MultiAgent、 Tool Learning、RAG、RLHF等技术探索,研究前沿模型训练和优化方法,开发国际顶尖级大模型;2、根据业务场景需求设计微调方案、适配算法和调优工程方案;3、参与智谱AI的行业大模型语料知识库建设和训练语料优化,知识图谱、知识FAQ、知识增强大模型等基础算法方向;4、研究和跟踪前沿技术发展,探索AI在助力数字民生服务普惠和智能化方面的新方法和新范式,推动相关领域技术创新。 职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域;2、具有大模型应用经验,丰富的深度学习经验,熟悉常见的深度学习框架(如TensorFlow、PyTorch等);4、在预训练语言模型(如LLAMMA,GPT等)的设计、训练和优化方面有实际项目经验者优先;5、出色的问题解决能力和创新能力,能够解决复杂的技术挑战;6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;7、良好的英文读写能力,能够阅读和理解相关的研究论文和文档;8、发表过相关领域的学术论文或专利者优先。 投递...
Agent后端开发工程师 北京 全职 互联网 / 电子 / 网游 职位描述 后端开发工程师核心职责负责 AutoGLM 平台后端架构设计与核心模块开发构建高可用、可扩展的智能体调度与执行引擎设计与实现多智能体协作的分布式通信机制打造面向开发者的 API 服务与工具链 职位要求 岗位要求精通 Go/Python 语言,3 年以上后端开发经验熟悉分布式系统设计,有微服务架构实战经验掌握 Kubernetes/Docker 容器化技术栈精通 MySQL,具备数据库优化经验熟悉消息队列(Kafka/RabbitMQ/Pulsar)应用场景有云原生应用(AWS/Azure/GCP)部署经验具备扎实的编程基础,良好的系统设计能力和代码规范意识AI 编程能力要求熟练使用 AI 编程工具(如 Cursor、Claude Code 等)完成日常开发、重构与测试工作能够通过 AI 工具提升开发效率,并将 AI 深度整合进开发工作流具备使用 Vibe Coding 方法论交付真实产品的实践经验加分项:拥有 GLM 系列模型(ChatGLM/CodeGeeX)实战经验,熟悉国产大语言模型编程特性
AI院-开源模型适配 & 技术布道 北京 全职 互联网 / 电子 / 网游 职位描述 【职位亮点】1. 与全球顶级开源项目(如Transformers、vLLM、SGLang)并肩贡献,你的代码将影响千万开发者2. 深度参与GLM系列开源模型的生态建设与技术落地,推动前沿模型走进真实场景3. 在开源社区代表公司发声,参与技术布道、代码共建,加强公司技术影响力4. 与算法、产品、宣发等多团队紧密协作,跨越技术到影响力的全链条【岗位职责】1. 主导并参与 transformers、vLLM、SGLang 等核心开源项目的代码贡献与生态建设,包括但不限于提交关键 Pull Request、参与新版本模型功能开发、复现与修复重要 Issue,推动 GLM 系列模型在这些框架中的高效支持与性能优化。2. 协同算法团队、模型提供方及海内外社区,系统化梳理与完善开源技术文档,解决模型部署与推理中的工程及算法难题,通过技术分享、社区互动持续提升公司在开源领域的影响力与领导力。 职位要求 1. 具备优秀的工程实现能力,熟练掌握 Python,熟悉 GitHub / Hugging Face 等开源协作平台及相关工具链,代码风格清晰,具备良好的系统设计和调试能力。2. 深入理解 SGLang、vLLM、Transformers 等框架的源码设计与实现机制,请在简历中附上您在这些或相关开源项目中具有代表性的 Pull
大模型解决方案架构师-运营商行业 北京 全职 互联网 / 电子 / 网游 职位描述 1、深入理解GLM大模型的原理、能力及最新发展,负责向运营商系统讲述智谱大模型价值,推宣智谱能力;帮助运营商成功,帮助运营商政企客户成功。2、与运营商及运营商的政企终端客户深度沟通,从客户场景需求出发,结合智谱大模型能力,架构设计“智谱&运营商”行业级解决方案,成为国内大模型行业运营商赛道的解决方案专家。3、赋能运营商及运营商政企终端客户,参与大模型技术选型评估、解决方案设计等工作,确保为客户制定的专属解决方案的质量和可落地性,为用户创造价值。4、负责解决方案撰写、宣讲、招投标、技术咨询支持;并与交付团队协作解决问题,为客户提供高效的服务。 职位要求 1、3年以上大模型、AI行业或运营商、云、大数据等行业售前解决方案经验;全日制本科或以上学历。2、具备大模型智能问数、文档生成、RAG构建、知识图谱等项目经验者优先。 3、有较强的业务模型分析能力、沟通能力和文档编写能力; 4、具有良好的团队意识和合作精神,擅于协调与沟通。 投递...
大模型技术架构师- 杭州 全职 互联网 / 电子 / 网游 职位描述 1. 负责为大型央企/国企客户,头部行业客户提供大模型技术体系的顶层架构设计,梳理客户业务需求,输出AI落地解决方案;2. 主导大模型相关产品与平台的架构设计,包括(但不限于)模型训练、推理部署、数据流转、权限安全、算力调度、微服务/分布式系统等;3. 结合行业特点和客户实际场景,定制模型能力、方案集成、数据治理与安全等一体化技术路线图。4. 主导需求评审、架构评审及技术规范落地,撰写相关技术文档与标准;5. 指导和协助客户IT团队/开发团队在大模型系统的搭建、迁移及优化过程中,推动方案的高效实施;6. 跟踪AI技术前沿发展动态,把握大模型及AIGC技术演进趋势,为公司产品和客户解决方案不断引入创新技术。 职位要求 1. 计算机、人工智能、软件工程等相关专业本科及以上学历,硕士或博士优先;2. 5年以上AI工程、数据平台或大型分布式系统架构经验,3年以上大模型相关领域实践经验(如NLP、CV、AIGC方向大模型);3. 熟悉主流大模型框架(如Transformers、GLM、QWEN、DeepSeek等)及其工程化部署,熟悉Agent相关技术及其工程化部署。4. 深刻理解AI工程生命周期,具备自研/开源模型分布式训练、加速推理、微服务拆分、弹性伸缩、数据治理、安全合规等方面实操经验;5. 有为政企客户(特别是央国企)设计和实施AI落地项目经验,具备良好的业务理解与客户沟通能力,能从架构、产品化、行业应用等多维度把控解决方案;6. 具备良好的团队协作、项目推动与跨部门协调能力,有带领或培养团队经验者优先;7. 具备较强的技术文档撰写和PPT表达能力,能辅助客户进行内部方案宣讲和技术培训。加分项 :1. 参与/主导过10B参数级及以上大模型架构实战;2. 发表过大模型相关高水平论文或承担过行业标准制定工作;3. 有云平台、大规模集群或国产化IT体系(如信创)相关经验。 投递...