Dsl Jobs In China | Recruit.net

Deep Learning Performance Architect, CUTLASS DSL

Nvidia ( Shanghai )

Are you passionate about programming languages, compiler technology, and GPU performance? Do you want to help shape the future of high-performance kernel development for AI? We are looking for outstanding engineers to build CUTLASS DSL, a Python-native

Premium Full-time Dialects Performance Analysis TMA DSL Python

Nvidia 4 days ago

Deep Learning Performance Architect, CUTLASS DSL Testing

Nvidia ( Shanghai )

Are you excited about building world-class quality systems for advanced GPU software? Do you enjoy combining automation, product validation, and code analysis to support fast-moving compiler and kernel innovation? We are seeking a strong test engineer

Premium Full-time Compiler Automated Testing AI Software Testing Quality Assurance

Nvidia 4 days ago

异构AI编译软件栈开发

XPENG ( Shanghai )

异构AI编译软件栈开发上海全职芯片板块职位描述 1、GPGPU特定的指令编译方案设计与开发，包含指令选择、指令调度等；2、针对大模型的下一代AI编译器设计与开发，包括图编译、Cost-Model、低bit量化算法等；3、Triton、Tilelang、Cutlass/Cute、Cute DSL/CuTile、Torch(torch.compile)等AI生态软件适配与支持；职位要求 1、熟悉Clang与LLVM编译框架，熟悉SIMT编译优化经验，熟悉CUDA C兼容是加分项；2、熟悉Triton/IREE/Torch-MLIR/ONNX-MLIR/TPU-MLIR等是加分项；3、熟悉Tilelang/MLC-LLM/Relay/Relax/Ansor等是加分项；4、熟悉Cutlass/Cute/Cute DSL/CuTile/TensorRT/TensorRT-LLM等是加分项；5、熟悉大模型编译部署优化，尤其是跨级优化如图算融合、算子-指令编译融合等优化是加分项；6、自我驱动能力强，对技术有追求，工作细致，有编程竞赛获奖是加分项；岗位介绍：1、对于这个岗位，您将参与针对自研指令集及架构的完整的编译工具链设计与开发；2、工作范围涉及图编译、算子与指令编译，Pythonic DSL及其编译器设计与开发，完整的编程语言与编译器配套软件开发；3、与相关领域专家一起深度程参与自研芯片项目架构设计、硅前硅后AI大模型测试验证、汽车与机器人等场景量产部署全流程。投递...

Premium Full-time

XPENG 28 days ago

Associate Director, Data & Analytics Lead

Abbvie ( Shanghai )

Company Description About AbbVie AbbVies mission is to discover and deliver innovative medicines and solutions that solve serious health issues today and address the medical challenges of tomorrow. We strive to have a remarkable impact on

Premium Full-time Agenda Stakeholder Engagement Neuroscience Strengthening Bridge

Abbvie 18 days ago

Director, Business Development & Regulatory Management

Apple ( Shanghai )

SummaryApple is seeking a visionary and highly strategic Director of Business Development and Regulatory Management to lead our market intelligence, strategic partner ecosystem, and regulatory response for AI features, data governance, and frontier technologies in Greater

Premium Contract Greater China Statements of Work Mitigation Data Acquisition Cybersecurity

Apple 16 days ago

EPM, Regulatory Management

Apple ( Shanghai )

SummaryApple is seeking a highly organized and detail-oriented Engineering Project Manager (EPM) / Program Manager to drive the execution of critical data and regulatory compliance initiatives in Greater China. Reporting to the Director of Regulatory Management,

Premium Contract Regulatory Compliance System Integration Greater China Mandarin Chinese AI

Apple 16 days ago

Get Hired 2x Faster
Connect with Top Employers Directly

算法架构工程师 - 训练推理框架方向

Xiaomi ( Beijing )

算法架构工程师 - 训练推理框架方向北京社招全职职位 ID：A94317 职位描述 1、小米算法架构团队，通过技术及模型能力迭代支撑搜广推业务，持续提升广告/推荐场景点击率、转化率等业务指标，持续提升业务能力2、负责分布式的训练框架及推理框架的研发及性能优化工作，实现大规模稀疏模型的训练及推理能力落地3、负责特征DSL相关能力建设，持续优化特征工程、模型迭代效率4、探索容器化、异构计算、大模型训练/推理等前沿技术架构方向，参与一站式分布式机器学习平台的研发，实时追踪业界最先进技术及落地。5、持续优化代码性能，提升模型迭代效率，为公司节省计算成本。职位要求 1、掌握机器学习/深度学习基础理论知识，了解常见的个性化推荐算法；熟悉TensorFlow/PyTorch等深度学习框架设计原理、阅读过相关源码者优先；2、熟练掌握C++/Rust，会使用Python、Java等编程语言，或者可以在一个月内熟练掌握一门语言；3、掌握GPU编程，熟悉CUDA、并行计算等技术者优先，有算子开发及优化经验者优先；4、有主流大规模推荐/搜索/广告引擎架构经验者优先；5、追求挑战，较强学习能力和实践精神，有强烈的求知欲、好奇心，能及时关注和学习业界最新技术。6、对代码有执念，追求极致，具备一定影响力的开源项目者优先；投递...

Premium Full-time

Xiaomi 14 days ago

大模型推理架构师

Soul APP ( Shanghai )

大模型推理架构师上海社招全职互联网 / 电子 / 网游职位描述 1. 参与 Soul 大模型、多模态模型、推荐模型等核心 AI 任务的训练与推理基础设施建设，提升模型从实验到线上部署的整体效率。2. 负责大规模分布式训练系统的性能优化，包括数据并行、张量并行、流水线并行、专家并行、参数/梯度/优化器状态切分、显存优化、通信调度等方向，提升 GPU/NPU 集群利用率。3. 参与高性能推理引擎建设，围绕大模型在线服务中的低延迟、高吞吐、弹性扩缩容、多租户隔离、KV Cache 管理、批处理调度、量化部署等问题进行系统优化。4. 针对 Soul 的实时社交、多模态内容理解、AIGC 互动等场景，设计和优化端到端 AI 系统架构，降低训练和推理成本，保障核心业务的稳定性和体验质量。5. 参与异构计算算子优化和计算图优化，包括 CUDA、Triton、CUTLASS、Ascend C、TileLang 等方向，针对 Attention、MoE、Embedding、推荐模型特征交互、多模态编码等关键模块进行性能调优。6. 参与 AI 编译器和模型编译优化相关工作，围绕

Premium Full-time Soul AI

Soul APP 13 days ago

AI院-推理Infra工程师（量化算法研究/推理框架优化/GPU优化）

Z.ai ( Shanghai )

AI院-推理Infra工程师（量化算法研究/推理框架优化/GPU优化）北京、上海全职互联网 / 电子 / 网游职位描述【方向一】量化算法研究员-职位描述通过前沿的模型量化、压缩与推理加速技术，显著降低大语言模型及多模态模型的存储占用与计算成本，推动 LLM 的大规模部署。-工作内容1、研发及改进 PTQ（训练后量化）、QAT（量化感知训练）、混合精度量化等核心算法，针对LLM/VLM（大语言模型/视觉语言模型）设计定制化量化方案，持续优化模型精度与推理效率的平衡；2、探索并实践低比特量化（如INT8/INT4/FP8/FP4）、权重稀疏化、知识蒸馏等协同压缩技术，提升压缩率同时控制精度损失；3、开发及优化量化工具链，完成对 GLM 系列模型的转换、量化校准及部署集成；4、跟踪学术界与工业界前沿量化技术，通过论文复现、实验对比推动技术迭代。-职位要求1、计算机科学、电子工程、数学等相关专业硕士及以上学历，3 年以上模型量化或推理加速经验；或优秀本科生具备扎实项目履历；2、深入理解 Transformer 架构及 LLM 推理流程，精通 Python，熟悉常见的开源 LLM 推理框架（sglang/vllm/trtllm 等）；3、掌握量化原理（校准策略、量化粒度、误差分析）及主流算法（如GPTQ、AWQ）；4、具有 CUDA/Triton 编程经验，能自主实现高性能算子或优化内核计算加分。【方向二】推理框架优化工程师-职位描述1、高性能算子开发与优化：负责AI模型（尤其是大语言模型及多模态模型）在GPU上的核心算子（Kernel）的设计、开发与极致性能优化，支撑训练和推理场景的高效运行。2、性能分析与调优：深入分析GPU应用程序的性能瓶颈，通过优化内存访问模式、线程调度、执行效率等手段，显著提升计算密集型任务的吞吐量和降低延迟。3、技术集成与应用：研究并应用业界前沿的优化技术（如模型量化QAT/PTQ、算子融合、动态形状支持、FlashAttention等），并将其集成至推理/训练引擎。-职位要求1、编程能力：具备3年及以上GPU编程与高性能计算优化经验，深入理解GPU架构、并行计算原理、计算机体系结构，具备高性能计算内核的开发与优化经验。2、精通C/C++，具备扎实的编程基础、良好的编程风格和丰富的调试经验；熟练掌握Python；熟悉Linux开发环境。3、性能优化经验：能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具，有实际的性能优化案例和成果，能独立定位和解决复杂的性能问题。4、算法基础：熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法，了解深度学习常见算子的计算方式。【方向三】GPU优化工程师-职位描述利用对 cuda 生态软件和底层体系结构的了解，帮助团队优化训练和推理的计算效率。-工作内容1、高性能算子开发与优化：负责AI模型（尤其是大语言模型及多模态模型）在GPU上的核心算子（Kernel）的设计、开发与极致性能优化，支撑训练和推理场景的高效运行。2、性能分析与调优：深入分析GPU应用程序的性能瓶颈，通过优化内存访问模式、线程调度、执行效率、多流并行协同等手段，显著提升计算密集型任务的吞吐量和降低延迟。3、技术选型：对 GPU 领域相关的 DSL/编译器（例如 triton/cuteDSL/tilelang）等进行尝试和了解，确定团队内的 DSL/编译器的技术选型，为未来的迭代做好技术储备。-职位要求1、编程能力：具备3年及以上GPU编程与高性能计算优化经验，深入理解GPU架构、并行计算原理、计算机体系结构，具备高性能计算内核的开发与优化经验。2、精通C/C++，具备扎实的编程基础、良好的编程风格和丰富的调试经验；熟练掌握Python；熟悉Linux开发环境。3、性能优化经验：能够熟练使用Nsight Compute、Nsight Systems等GPU性能分析工具，有实际的性能优化案例和成果，能独立定位和解决复杂的性能问题。4、算法基础：熟悉基础数学函数、线性代数、矩阵运算、数值计算等数学库相关算法，了解深度学习常见算子的计算方式。

Premium Remote Friendly Full-time CUDA GLM

Z.ai 7 days ago

Director, AI Strategy & Operations, AstraZeneca Beijing AI C...

AstraZeneca ( Beijing )

About the Beijing AI Center The Beijing AI Center is a new strategic investment by AstraZeneca to accelerate drug discovery through AI. The center brings together AI researchers, computational scientists, and platform engineers to apply foundation

Premium Full-time Slide Decks Strategic Planning DSL Governance Rhythm

AstraZeneca 7 days ago

顶尖应届-AI Compiler 开发工程师-芯片

Xiaomi ( Beijing )

顶尖应届-AI Compiler 开发工程师-芯片北京校招正式软件研发类职位描述 1、结合端侧NPU和模型深入研究编译技术，例如针对计算单元的自动向量化，深度融合等；2、研究优化针对Tensor Core计算切分，多种并发模式优化等；3、研究访存优化，Layout最优化求解等；4、利用AutoTuning、机器学习等技术寻找最优化配置方案等；5、探索端到端模型编译新方法，Tile-based DSL设计与开发等。职位要求 1、计算体系结构或者编译技术方向博士；2、从事GPGPU/NPU上AI编译技术研究，并且发表过顶级论文；3、有较强的分析和解决问题能力、较强的动手能力；4、熟悉LLVM等编译器，有传统编译器后端开发经验优先；5、熟悉GPGPU和SIMT架构，有NVGPU上编译优化，算子优化，HPC优化等经验优先；6、有开源社区贡献者优先。职位信息课题名称及内容：端侧高效推理NPU编译技术研究：1、结合端侧NPU和模型深入研究编译技术，包括但不限于，针对Tensor Core计算切分，多种并发模式优化，访存优化，Layout最优化求解等；2、端到端的探索模型编译，DSL设计与开发等。投递...

Premium Full-time Compiler

Xiaomi 6 days ago

AI编译器工程师

小米科技 Xiaomi Technology ( Beijing )

AI编译器工程师 AI人才专项热招北京校招实习软件研发类职位描述 1. 基于llvm/clang框架进行自研NPU芯片的编译器开发与性能优化；2. 针对自研NPU芯片和主流AI算法设计并行编程语言；3. 协同芯片团队进行性能算子开发；4. 基于主流编译栈进行python dsl编程语言设计与编译器开发；职位要求 1.计算机和微电子等相关专业硕士及以上学历；2. 熟悉LLVM/MLIR/CLANG框架；3. 熟悉并行计算体系结构，有NPU/GPU算子编程开发和优化经验优先；4. 良好的团队沟通能力, 责任心强。投递...

Premium Full-time

小米科技 Xiaomi Technology 5 days ago

Deep Learning Compiler Engineer - CUDA

Nvidia ( Shanghai ) +1 other locations

NVIDIA has been transforming computer graphics, PC gaming, and accelerated computing for more than 25 years. It’s a unique legacy of innovation that’s fueled by great technology—and amazing people. Today, we’re tapping into the unlimited potential

Premium Full-time Eras Architects Oral Communication Compiler Parallel Computing

Nvidia 4 days ago

Director/Senior Director, Data Governance (China)

AstraZeneca ( Shanghai )

Role Summary Lead data governance for AstraZeneca’s China R&D office, aligning local policies and controls to enterprise standards. Set policy, assess and mitigate data/AI risk, advise projects, and ensure compliance with China and international regulations, including

Premium Contract Enablement Justice Imaging Internal Auditing AI

AstraZeneca 14 hours ago

Dsl Jobs In China - 15 Job Positions Available

Deep Learning Performance Architect, CUTLASS DSL

Deep Learning Performance Architect, CUTLASS DSL Testing

异构AI编译软件栈开发

Associate Director, Data & Analytics Lead

Director, Business Development & Regulatory Management

EPM, Regulatory Management

算法架构工程师 - 训练推理框架方向

大模型推理架构师

AI院-推理Infra工程师（量化算法研究/推理框架优化/GPU优化）

Director, AI Strategy & Operations, AstraZeneca Beijing AI C...

顶尖应届-AI Compiler 开发工程师-芯片

AI编译器工程师

Deep Learning Compiler Engineer - CUDA

Director/Senior Director, Data Governance (China)

Subscribe for job alerts and resources to make your job search easier!

Also try: