Refine Reset All
Sort by
Location
Job Type
Employer/Recruiter
Date Posted
Location
Job Type
Employer/Recruiter
All Filters

Tgi Jobs In China - 7 Job Positions Available

Top Cities:
1 – 7 of 7 jobs
Z.ai jobs

AI技术实习生-深圳 深圳 实习 互联网 / 电子 / 网游 职位描述 1. 参与大模型全流程技术工作,包括算法适配与调优、推理训练工程优化、国产芯片框架适配等,根据项目需求承担相应模块任务;​2. 结合行业场景需求,参与大模型微调工具的设计与开发,协助业务团队完成模型定制化训练,支撑场景化应用落地;​3. 跟踪大模型领域算法、工程、硬件适配等方向的前沿技术,参与技术调研与验证,为团队技术选型提供参考;​4. 参与团队技术讨论与分享,协助整理项目技术文档,推动团队技术能力共同提升。 职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域;2、 熟悉常见的深度学习框架,如:Pytorch 等3、了解Megtron,Deepspeed等大模型通用框架;4、了解vLLM,TGI,Transforms等大模型通用框架;5、出色的问题解决能力,良好的owner意识,能够持续推动问题解决;6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;7、在预训练语言模型(如Llama,GPT等)的设计、训练和优化方面有实际项目经验者优先。 投递...

Premium Full-time
Z.ai  24 days ago
Z.ai jobs

大模型算法框架实习生 北京 实习 互联网 / 电子 / 网游 职位描述 大模型算法适配与优化:参与主流大模型(如Llama、GPT等)在国产芯片上的算法适配和性能调优,包括模型结构优化、算子优化等;推理与训练工程优化:对大模型的推理和训练过程进行工程化优化,提升性能、降低资源消耗,包括但不限于模型量化、剪枝、蒸馏等技术的应用;国产芯片适配:大模型推理、训练框架(如Megatron、DeepSpeed等)在国产芯片上的适配与优化,解决兼容性问题,充分发挥硬件性能;微调工具链开发:根据不同行业场景需求,设计并实现高效的大模型微调工具链,包括数据预处理、参数配置、效果评估等功能模块;技术方案设计与评估:参与大模型相关技术方案的制定,进行技术可行性评估和性能测试,撰写技术文档。 职位要求 计算机科学、人工智能、自然语言处理或相关专业本科或硕士在读,每周到岗4-5天,实习3个月以上熟悉至少一种主流深度学习框架(PyTorch优先),熟悉深度学习模型开发全流程;熟悉大模型训练和推理框架,如Megatron、DeepSpeed、vLLM、TGI、Transformers等;具备良好的编程能力,熟练掌握Python/Go/Java/C++,有良好的代码风格和工程实践;出色的问题解决能力和技术攻关能力,具备owner意识,能够独立负责技术模块并推动问题解决;良好的团队合作和沟通能力,能够与跨职能团队高效协作,推动项目进展。【加分项】有国产芯片(如昇腾、寒武纪、海光等)上的模型适配和优化经验者优先;熟悉模型压缩、量化、蒸馏等相关技术并有实践经验者优先 投递...

Premium Full-time
Z.ai  24 days ago
Z.ai jobs

算法实习生 北京 实习 互联网 / 电子 / 网游 职位描述 1、负责大模型算法的适配和调优;2、负责大模型的推理,训练相关的工程优化;3、负责大模型的推理,训练相关框架的国产芯片适配;4、根据行业场景需求设计微调工具等; 职位要求 1、计算机科学、人工智能、自然语言处理或相关专业领域;2、 熟悉常见的深度学习框架,如:Pytorch 等3、了解Megtron,Deepspeed等大模型通用框架;4、了解vLLM,TGI,Transforms等大模型通用框架;5、出色的问题解决能力,良好的owner意识,能够持续推动问题解决;6、良好的团队合作和沟通能力,能够与跨职能团队合作,推动项目进展;7、在预训练语言模型(如Llama,GPT等)的设计、训练和优化方面有实际项目经验者优先; 投递...

Premium Full-time
Z.ai  24 days ago
RayNeo jobs

AI运维工程师(大模型推理 / AI Infra) 深圳 全职 互联网 / 电子 / 网游 职位描述 岗位职责负责 AI 功能(语音助手、AI 问答、Agent、多模态等)的大模型推理服务部署、运维与稳定性保障。负责大模型推理框架部署与性能优化,包括 vLLM、TensorRT-LLM、SGLang 等。负责 GPU 集群与 AI Infra 建设,包括 Kubernetes、容器化、监控告警及自动化运维。参与模型量化、推理加速、显存优化、吞吐优化等工作,提升推理效率并降低成本。配合算法团队完成模型上线、压测、问题排查及线上稳定性优化。 职位要求 任职要求本科及以上学历,计算机相关专业。熟悉 Linux、Python/Shell,具备自动化运维能力。熟悉 Docker、Kubernetes 等云原生技术,有 GPU 集群运维经验。熟悉大模型推理部署,了解 vLLM、TensorRT-LLM、LMDeploy、TGI 等推理框架。理解 Transformer、大模型推理流程及 GPU 加速原理,有推理优化经验优先。有高并发 AI

Premium Full-time AI
RayNeo  9 days ago
01.AI jobs

大模型应用开发专家 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 架构设计与开发:负责基于大模型(LLM)的复杂应用系统架构设计与核心代码实现,确保系统的高可用性、高并发性与可扩展性。2. 后端与AI工程化:精通Python/Java后端开发,构建高性能、高可用的AI服务接口;深度集成LangChain、LlamaIndex等AI框架,实现业务逻辑与大模型能力的无缝对接。3. AI技术落地:主导RAG(检索增强生成)系统的优化、Agent(智能体)任务编排及多轮对话逻辑的实现,提升AI在实际业务场景中的响应准确率与用户体验;主导GraphRAG(知识图谱增强检索)与向量检索的深度融合,负责复杂知识关联的建模与查询优化。4. 中间件与基础设施:负责向量数据库(如Milvus/Pinecone/Weaviate)、图数据库(如Neo4j/NebulaGraph)、缓存、消息队列等中间件的选型、集成与维护。5. 协同与工程化:与模型团队紧密配合,推动模型接口协议标准化,负责AI服务的CI/CD、监控告警及生产环境的稳定运行。 职位要求 1. 计算机、软件工程、电子信息等相关专业本科及以上学历,5年以上后端开发经验,其中至少2年专注于AI应用开发。2. 精通Python后端开发,具备扎实的编程能力、数据结构与算法功底,熟悉异步编程及性能优化;深入理解RAG与Agent开发,能熟练运用LangChain、LlamaIndex、LangGraph等框架解决复杂业务问题。3. 深入理解大模型生态,有实际的大模型应用落地项目经验,熟悉Function Calling、Tool Use等Agent核心技术。4. 熟悉常用后端技术栈,包括但不限于MySQL、Redis、Kafka、Docker/K8s等,具备构建高可用服务的工程能力。5. 知识图谱与检索增强:深入理解知识图谱在RAG场景下的落地路径,熟悉NebulaGraph、Neo4j等主流图数据库的使用及查询语言(如Cypher/nGQL)。6. 语义建模能力:掌握实体识别(NER)、关系抽取(RE)等知识构建技术,具备将非结构化数据转化为结构化知识库的实际项目经验。7. 掌握向量数据库的使用与原理,了解语义搜索、重排序(Rerank)等RAG关键技术。8. 具备优秀的工程化思维,能解决复杂系统中的稳定性、并发及安全问题。加分项1. 有高并发、大流量分布式系统开发经验者优先。2. 同时掌握Python和java生态,有大规模后端系统开发经验者优先。3. 熟悉模型部署工具(如vLLM, TGI, TensorRT-LLM)或有模型微调工程经验者优先。4. 在GitHub有知名AI相关开源项目贡献,或在技术社区有深度技术分享。5. 具备Prompt Engineering高级技巧,能够通过调优显著提升应用端效果。

Premium Full-time
01.AI  1 day ago
Xiaomi jobs

大模型推理部署平台后端研发工程师 武汉 社招 全职 职位 ID:A32259 职位描述 1. 负责大模型平台推理部署的架构设计,包括模型部署、推理优化、模型服务高可用、可观测性等;2. 与业务团队进行沟通和合作,更快落地业务大模型推理部署需求,并持续优化推理性能;3. 跟踪业内最新的大模型推理部署技术,持续完善推理部署功能和使用体验; 职位要求 1. 计算机、人工智能等相关专业本科及以上,5年及以上工作经验;2. 熟练掌握Linux环境下的Go/Python等语言开发和最佳实践, 有解决复杂问题的能;3. 熟悉Kubernetes架构和生态,熟悉Docker/Operator等云原生技术,有云原生系统开发经验;4. 有服务端开发经验,熟悉常用组件MySQL、Redis、Nacos、Prometheus等;5. [加分项]有万级QPS服务端架构设计、分布式架构设计、服务稳定性监控设计经验;6. [加分项]熟悉常用的推理框架TensorFlow、Triton、TGI、vLLM、SGLang等; 投递...

Premium Full-time
Xiaomi  1 day ago
01.AI jobs

AI全栈开发工程师(B端平台 & B端产品) 北京 全职 互联网 / 电子 / 网游 - 研发 职位描述 1. 构建与迭代B端Agent平台与产品能力:工作流编排(DAG / State Machine)、多智能体协作、会话与任务系统(异步/长任务)、记忆与上下文管理。2. 负责 Agent 工具体系工程化:工具注册/版本与兼容策略、参数 Schema(JSON Schema/Pydantic)、鉴权与租户隔离、幂等/重试/限流、失败降级、回放与审计。3. 落地企业级 RAG:多源数据接入(文档 / DB / ES / 内网系统)、切分与索引、混合检索(Milvus / PGVector + ES)、重排、引用溯源、增量更新、权限过滤(ACL /

01.AI  1 day ago

Subscribe for job alerts and resources to make your job search easier!

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

Receive the latest job openings for:

tgi

Confirmation email sent to

Check your email and click on the link to start receiving your job alerts

All Filters Apply
Sort by
Location
Job Type
Employer/Recruiter