Tgi Jobs In China - 7 Job Positions Available

Top Cities:

tgi jobs in China

1 – 7 of 7 jobs

AI技术实习生-深圳

Z.ai ( Wenchang )

AI技术实习生-深圳深圳实习互联网 / 电子 / 网游职位描述 1. 参与大模型全流程技术工作，包括算法适配与调优、推理训练工程优化、国产芯片框架适配等，根据项目需求承担相应模块任务；2. 结合行业场景需求，参与大模型微调工具的设计与开发，协助业务团队完成模型定制化训练，支撑场景化应用落地；3. 跟踪大模型领域算法、工程、硬件适配等方向的前沿技术，参与技术调研与验证，为团队技术选型提供参考；4. 参与团队技术讨论与分享，协助整理项目技术文档，推动团队技术能力共同提升。职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域；2、熟悉常见的深度学习框架，如：Pytorch 等3、了解Megtron，Deepspeed等大模型通用框架；4、了解vLLM，TGI，Transforms等大模型通用框架；5、出色的问题解决能力，良好的owner意识，能够持续推动问题解决；6、良好的团队合作和沟通能力，能够与跨职能团队合作，推动项目进展；7、在预训练语言模型（如Llama，GPT等）的设计、训练和优化方面有实际项目经验者优先。投递...

Premium Full-time

Z.ai 24 days ago

大模型算法框架实习生

Z.ai ( Beijing )

大模型算法框架实习生北京实习互联网 / 电子 / 网游职位描述大模型算法适配与优化：参与主流大模型（如Llama、GPT等）在国产芯片上的算法适配和性能调优，包括模型结构优化、算子优化等；推理与训练工程优化：对大模型的推理和训练过程进行工程化优化，提升性能、降低资源消耗，包括但不限于模型量化、剪枝、蒸馏等技术的应用；国产芯片适配：大模型推理、训练框架（如Megatron、DeepSpeed等）在国产芯片上的适配与优化，解决兼容性问题，充分发挥硬件性能；微调工具链开发：根据不同行业场景需求，设计并实现高效的大模型微调工具链，包括数据预处理、参数配置、效果评估等功能模块；技术方案设计与评估：参与大模型相关技术方案的制定，进行技术可行性评估和性能测试，撰写技术文档。职位要求计算机科学、人工智能、自然语言处理或相关专业本科或硕士在读，每周到岗4-5天，实习3个月以上熟悉至少一种主流深度学习框架（PyTorch优先），熟悉深度学习模型开发全流程；熟悉大模型训练和推理框架，如Megatron、DeepSpeed、vLLM、TGI、Transformers等；具备良好的编程能力，熟练掌握Python/Go/Java/C++，有良好的代码风格和工程实践；出色的问题解决能力和技术攻关能力，具备owner意识，能够独立负责技术模块并推动问题解决；良好的团队合作和沟通能力，能够与跨职能团队高效协作，推动项目进展。【加分项】有国产芯片（如昇腾、寒武纪、海光等）上的模型适配和优化经验者优先；熟悉模型压缩、量化、蒸馏等相关技术并有实践经验者优先投递...

Premium Full-time

Z.ai 24 days ago

Upload Your Resume — Let employers contact you directly

算法实习生

Z.ai ( Beijing )

算法实习生北京实习互联网 / 电子 / 网游职位描述 1、负责大模型算法的适配和调优；2、负责大模型的推理，训练相关的工程优化；3、负责大模型的推理，训练相关框架的国产芯片适配；4、根据行业场景需求设计微调工具等；职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域；2、熟悉常见的深度学习框架，如：Pytorch 等3、了解Megtron，Deepspeed等大模型通用框架；4、了解vLLM，TGI，Transforms等大模型通用框架；5、出色的问题解决能力，良好的owner意识，能够持续推动问题解决；6、良好的团队合作和沟通能力，能够与跨职能团队合作，推动项目进展；7、在预训练语言模型（如Llama，GPT等）的设计、训练和优化方面有实际项目经验者优先；投递...

Premium Full-time

Z.ai 24 days ago

AI运维工程师（大模型推理 / AI Infra）

RayNeo ( Shenzhen )

AI运维工程师（大模型推理 / AI Infra）深圳全职互联网 / 电子 / 网游职位描述岗位职责负责 AI 功能（语音助手、AI 问答、Agent、多模态等）的大模型推理服务部署、运维与稳定性保障。负责大模型推理框架部署与性能优化，包括 vLLM、TensorRT-LLM、SGLang 等。负责 GPU 集群与 AI Infra 建设，包括 Kubernetes、容器化、监控告警及自动化运维。参与模型量化、推理加速、显存优化、吞吐优化等工作，提升推理效率并降低成本。配合算法团队完成模型上线、压测、问题排查及线上稳定性优化。职位要求任职要求本科及以上学历，计算机相关专业。熟悉 Linux、Python/Shell，具备自动化运维能力。熟悉 Docker、Kubernetes 等云原生技术，有 GPU 集群运维经验。熟悉大模型推理部署，了解 vLLM、TensorRT-LLM、LMDeploy、TGI 等推理框架。理解 Transformer、大模型推理流程及 GPU 加速原理，有推理优化经验优先。有高并发 AI

Premium Full-time AI

RayNeo 9 days ago

大模型应用开发专家

01.AI ( Beijing )

大模型应用开发专家北京全职互联网 / 电子 / 网游 - 研发职位描述 1. 架构设计与开发：负责基于大模型（LLM）的复杂应用系统架构设计与核心代码实现，确保系统的高可用性、高并发性与可扩展性。2. 后端与AI工程化：精通Python/Java后端开发，构建高性能、高可用的AI服务接口；深度集成LangChain、LlamaIndex等AI框架，实现业务逻辑与大模型能力的无缝对接。3. AI技术落地：主导RAG（检索增强生成）系统的优化、Agent（智能体）任务编排及多轮对话逻辑的实现，提升AI在实际业务场景中的响应准确率与用户体验；主导GraphRAG（知识图谱增强检索）与向量检索的深度融合，负责复杂知识关联的建模与查询优化。4. 中间件与基础设施：负责向量数据库（如Milvus/Pinecone/Weaviate）、图数据库（如Neo4j/NebulaGraph）、缓存、消息队列等中间件的选型、集成与维护。5. 协同与工程化：与模型团队紧密配合，推动模型接口协议标准化，负责AI服务的CI/CD、监控告警及生产环境的稳定运行。职位要求 1. 计算机、软件工程、电子信息等相关专业本科及以上学历，5年以上后端开发经验，其中至少2年专注于AI应用开发。2. 精通Python后端开发，具备扎实的编程能力、数据结构与算法功底，熟悉异步编程及性能优化；深入理解RAG与Agent开发，能熟练运用LangChain、LlamaIndex、LangGraph等框架解决复杂业务问题。3. 深入理解大模型生态，有实际的大模型应用落地项目经验，熟悉Function Calling、Tool Use等Agent核心技术。4. 熟悉常用后端技术栈，包括但不限于MySQL、Redis、Kafka、Docker/K8s等，具备构建高可用服务的工程能力。5. 知识图谱与检索增强：深入理解知识图谱在RAG场景下的落地路径，熟悉NebulaGraph、Neo4j等主流图数据库的使用及查询语言（如Cypher/nGQL）。6. 语义建模能力：掌握实体识别（NER）、关系抽取（RE）等知识构建技术，具备将非结构化数据转化为结构化知识库的实际项目经验。7. 掌握向量数据库的使用与原理，了解语义搜索、重排序（Rerank）等RAG关键技术。8. 具备优秀的工程化思维，能解决复杂系统中的稳定性、并发及安全问题。加分项1. 有高并发、大流量分布式系统开发经验者优先。2. 同时掌握Python和java生态，有大规模后端系统开发经验者优先。3. 熟悉模型部署工具（如vLLM, TGI, TensorRT-LLM）或有模型微调工程经验者优先。4. 在GitHub有知名AI相关开源项目贡献，或在技术社区有深度技术分享。5. 具备Prompt Engineering高级技巧，能够通过调优显著提升应用端效果。

Premium Full-time

01.AI 1 day ago

大模型推理部署平台后端研发工程师

Xiaomi ( Wuhan )

大模型推理部署平台后端研发工程师武汉社招全职职位 ID：A32259 职位描述 1. 负责大模型平台推理部署的架构设计，包括模型部署、推理优化、模型服务高可用、可观测性等;2. 与业务团队进行沟通和合作，更快落地业务大模型推理部署需求，并持续优化推理性能；3. 跟踪业内最新的大模型推理部署技术，持续完善推理部署功能和使用体验；职位要求 1. 计算机、人工智能等相关专业本科及以上，5年及以上工作经验；2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能；3. 熟悉Kubernetes架构和生态，熟悉Docker/Operator等云原生技术，有云原生系统开发经验;4. 有服务端开发经验，熟悉常用组件MySQL、Redis、Nacos、Prometheus等；5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验；6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等；投递...

Premium Full-time

Xiaomi 1 day ago

Get Hired 2x Faster
Connect with Top Employers Directly

AI全栈开发工程师（B端平台 & B端产品）

01.AI ( Beijing )

AI全栈开发工程师（B端平台 & B端产品）北京全职互联网 / 电子 / 网游 - 研发职位描述 1. 构建与迭代B端Agent平台与产品能力：工作流编排（DAG / State Machine）、多智能体协作、会话与任务系统（异步/长任务）、记忆与上下文管理。2. 负责 Agent 工具体系工程化：工具注册/版本与兼容策略、参数 Schema（JSON Schema/Pydantic）、鉴权与租户隔离、幂等/重试/限流、失败降级、回放与审计。3. 落地企业级 RAG：多源数据接入（文档 / DB / ES / 内网系统）、切分与索引、混合检索（Milvus / PGVector + ES）、重排、引用溯源、增量更新、权限过滤（ACL /

Premium Remote Friendly Full-time Connectors LDAP TGI Docker Python

01.AI 1 day ago