AI技术实习生-深圳 深圳 实习 互联网 / 电子 / 网游 职位描述 1. 参与大模型全流程技术工作,包括算法适配与调优、推理训练工程优化、国产芯片框架适配等,根据项目需求承担相应模块任务;2. 结合行业场景需求,参与大模型微调工具的设计与开发,协助业务团队完成模型定制化训练,支撑场景化应用落地;3. 跟踪大模型领域算法、工程、硬件适配等方向的前沿技术,参与技术调研与验证,为团队技术选型提供参考;4. 参与团队技术讨论与分享,协助整理项目技术文档,推动团队技术能力共同提升。 职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域;2、 熟悉常见的深度学习框架,如:Pytorch 等3、了解Megtron,Deepspeed等大模型通用框架;4、了解vLLM,TGI,Transforms等大模型通用框架;5、出色的问题解决能力,良好的owner意识,能够持续推动问题解决;6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;7、在预训练语言模型(如Llama,GPT等)的设计、训练和优化方面有实际项目经验者优先。 投递...
大模型算法框架实习生 北京 实习 互联网 / 电子 / 网游 职位描述 大模型算法适配与优化:参与主流大模型(如Llama、GPT等)在国产芯片上的算法适配和性能调优,包括模型结构优化、算子优化等;推理与训练工程优化:对大模型的推理和训练过程进行工程化优化,提升性能、降低资源消耗,包括但不限于模型量化、剪枝、蒸馏等技术的应用;国产芯片适配:大模型推理、训练框架(如Megatron、DeepSpeed等)在国产芯片上的适配与优化,解决兼容性问题,充分发挥硬件性能;微调工具链开发:根据不同行业场景需求,设计并实现高效的大模型微调工具链,包括数据预处理、参数配置、效果评估等功能模块;技术方案设计与评估:参与大模型相关技术方案的制定,进行技术可行性评估和性能测试,撰写技术文档。 职位要求 计算机科学、人工智能、自然语言处理或相关专业本科或硕士在读,每周到岗4-5天,实习3个月以上熟悉至少一种主流深度学习框架(PyTorch优先),熟悉深度学习模型开发全流程;熟悉大模型训练和推理框架,如Megatron、DeepSpeed、vLLM、TGI、Transformers等;具备良好的编程能力,熟练掌握Python/Go/Java/C++,有良好的代码风格和工程实践;出色的问题解决能力和技术攻关能力,具备owner意识,能够独立负责技术模块并推动问题解决;良好的团队合作和沟通能力,能够与跨职能团队高效协作,推动项目进展。【加分项】有国产芯片(如昇腾、寒武纪、海光等)上的模型适配和优化经验者优先;熟悉模型压缩、量化、蒸馏等相关技术并有实践经验者优先 投递...
算法实习生 北京 实习 互联网 / 电子 / 网游 职位描述 1、负责大模型算法的适配和调优;2、负责大模型的推理,训练相关的工程优化;3、负责大模型的推理,训练相关框架的国产芯片适配;4、根据行业场景需求设计微调工具等; 职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域;2、 熟悉常见的深度学习框架,如:Pytorch 等3、了解Megtron,Deepspeed等大模型通用框架;4、了解vLLM,TGI,Transforms等大模型通用框架;5、出色的问题解决能力,良好的owner意识,能够持续推动问题解决;6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;7、在预训练语言模型(如Llama,GPT等)的设计、训练和优化方面有实际项目经验者优先; 投递...
AI运维工程师(大模型推理 / AI Infra) 深圳 全职 互联网 / 电子 / 网游 职位描述 岗位职责负责 AI 功能(语音助手、AI 问答、Agent、多模态等)的大模型推理服务部署、运维与稳定性保障。负责大模型推理框架部署与性能优化,包括 vLLM、TensorRT-LLM、SGLang 等。负责 GPU 集群与 AI Infra 建设,包括 Kubernetes、容器化、监控告警及自动化运维。参与模型量化、推理加速、显存优化、吞吐优化等工作,提升推理效率并降低成本。配合算法团队完成模型上线、压测、问题排查及线上稳定性优化。 职位要求 任职要求本科及以上学历,计算机相关专业。熟悉 Linux、Python/Shell,具备自动化运维能力。熟悉 Docker、Kubernetes 等云原生技术,有 GPU 集群运维经验。熟悉大模型推理部署,了解 vLLM、TensorRT-LLM、LMDeploy、TGI 等推理框架。理解 Transformer、大模型推理流程及 GPU 加速原理,有推理优化经验优先。有高并发 AI
大模型应用开发专家 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 架构设计与开发:负责基于大模型(LLM)的复杂应用系统架构设计与核心代码实现,确保系统的高可用性、高并发性与可扩展性。2. 后端与AI工程化:精通Python/Java后端开发,构建高性能、高可用的AI服务接口;深度集成LangChain、LlamaIndex等AI框架,实现业务逻辑与大模型能力的无缝对接。3. AI技术落地:主导RAG(检索增强生成)系统的优化、Agent(智能体)任务编排及多轮对话逻辑的实现,提升AI在实际业务场景中的响应准确率与用户体验;主导GraphRAG(知识图谱增强检索)与向量检索的深度融合,负责复杂知识关联的建模与查询优化。4. 中间件与基础设施:负责向量数据库(如Milvus/Pinecone/Weaviate)、图数据库(如Neo4j/NebulaGraph)、缓存、消息队列等中间件的选型、集成与维护。5. 协同与工程化:与模型团队紧密配合,推动模型接口协议标准化,负责AI服务的CI/CD、监控告警及生产环境的稳定运行。 职位要求 1. 计算机、软件工程、电子信息等相关专业本科及以上学历,5年以上后端开发经验,其中至少2年专注于AI应用开发。2. 精通Python后端开发,具备扎实的编程能力、数据结构与算法功底,熟悉异步编程及性能优化;深入理解RAG与Agent开发,能熟练运用LangChain、LlamaIndex、LangGraph等框架解决复杂业务问题。3. 深入理解大模型生态,有实际的大模型应用落地项目经验,熟悉Function Calling、Tool Use等Agent核心技术。4. 熟悉常用后端技术栈,包括但不限于MySQL、Redis、Kafka、Docker/K8s等,具备构建高可用服务的工程能力。5. 知识图谱与检索增强:深入理解知识图谱在RAG场景下的落地路径,熟悉NebulaGraph、Neo4j等主流图数据库的使用及查询语言(如Cypher/nGQL)。6. 语义建模能力:掌握实体识别(NER)、关系抽取(RE)等知识构建技术,具备将非结构化数据转化为结构化知识库的实际项目经验。7. 掌握向量数据库的使用与原理,了解语义搜索、重排序(Rerank)等RAG关键技术。8. 具备优秀的工程化思维,能解决复杂系统中的稳定性、并发及安全问题。加分项1. 有高并发、大流量分布式系统开发经验者优先。2. 同时掌握Python和java生态,有大规模后端系统开发经验者优先。3. 熟悉模型部署工具(如vLLM, TGI, TensorRT-LLM)或有模型微调工程经验者优先。4. 在GitHub有知名AI相关开源项目贡献,或在技术社区有深度技术分享。5. 具备Prompt Engineering高级技巧,能够通过调优显著提升应用端效果。
大模型推理部署平台后端研发工程师 武汉 社招 全职 职位 ID:A32259 职位描述 1. 负责大模型平台推理部署的架构设计,包括模型部署、推理优化、模型服务高可用、可观测性等;2. 与业务团队进行沟通和合作,更快落地业务大模型推理部署需求,并持续优化推理性能;3. 跟踪业内最新的大模型推理部署技术,持续完善推理部署功能和使用体验; 职位要求 1. 计算机、人工智能等相关专业本科及以上,5年及以上工作经验;2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能;3. 熟悉Kubernetes架构和生态,熟悉Docker/Operator等云原生技术,有云原生系统开发经验;4. 有服务端开发经验,熟悉常用组件MySQL、Redis、Nacos、Prometheus等;5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验;6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等; 投递...
AI全栈开发工程师(B端平台 & B端产品) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 构建与迭代B端Agent平台与产品能力:工作流编排(DAG / State Machine)、多智能体协作、会话与任务系统(异步/长任务)、记忆与上下文管理。2. 负责 Agent 工具体系工程化:工具注册/版本与兼容策略、参数 Schema(JSON Schema/Pydantic)、鉴权与租户隔离、幂等/重试/限流、失败降级、回放与审计。3. 落地企业级 RAG:多源数据接入(文档 / DB / ES / 内网系统)、切分与索引、混合检索(Milvus / PGVector + ES)、重排、引用溯源、增量更新、权限过滤(ACL /