快游戏Runtime高级技术专家 南京 社招 全职 职位 ID:A42354 职位描述 1. 快游戏框架开发与优化参与小米的快游戏框架设计与核心模块开发,重点负责高性能渲染引擎、跨平台适配及底层接口实现基于OpenGL/ES进行图形渲染管线优化,提升框架在移动端的渲染效率与兼容性解决多厂商硬件差异导致的性能瓶颈,确保框架在主流设备上的稳定运行。2. 工具链与生态支持开发配套工具链(如调试工具、性能分析工具),支持开发者高效接入快游戏框架结合Cocos等开源引擎特性,优化框架与第三方引擎的集成方案(加分项)3. 跨平台与网络通信设计并实现跨平台通信协议,支持快游戏在Android、HarmonyOS等多系统的无缝运行优化网络通信模块(如WebSocket、HTTP/2),降低延迟并提升数据传输效率4. 技术研究与文档输出跟踪图形学、编译技术等领域的前沿进展,推动框架技术升级撰写技术文档,主导内部技术分享,提升团队整体能力 职位要求 1. 核心技术能力 精通C++11/14/17,熟悉STL、设计模式及高性能编程技巧(如内存管理、多线程优化) 深入理解OpenGL/ES图形渲染管线,有移动端图形性能调优经验 熟悉Linux/Android底层开发环境,掌握NDK/JNI等跨语言调用机制2. 加分项 熟悉JavaScript/TypeScript开发,能结合C++与JS引擎(如V8)进行混合编程 了解Cocos Creator或其他开源游戏引擎架构,有引擎定制或插件开发经验 具备跨平台框架(如Qt、Flutter)开发经验,熟悉跨厂商技术标准对接流程3. 综合素质 计算机相关专业本科以上学历,3年以上中大型项目开发经验。 逻辑严谨,具备独立技术攻关能力,对性能优化有执著追求。 良好的沟通能力,能适应多厂商协同开发模式 投递...
AI runtime工程师 上海、合肥 社招 全职 数字技术 - 算法 本科及以上 3-5 年 职位描述 负责开发深度学习AI模型的runtime软件,完成计算资源调度、内存管理、host-device并行优化工作。1,分析和解决KMD/UMD的功能、性能和稳定性问题,确保高质量交付AI系统的运行时软件;2,与编译器、驱动工程师协同提供定制优化项和编程api;3,参与故障检测和恢复机制设计,保证AI系统的可靠性;4,参与Profiling工具设计,保证AI系统的性能可视化和瓶颈定位;5,持续改进通信和调度机制, 与业务团队协作完成多模型部署,提高芯片的综合计算效率和系统吞吐量; 职位要求 1,计算机、通信或者电子相关专业,本科及以上学历,有AI芯片系统软件开发或验证经验者优先;2,熟悉NPU/GPGPU体系结构,深入理解ROCm/Cuda Runtime项目;满足以下条件优先:1,熟悉AI系统的运行时开发;2,熟悉集群通信的原理和实现,包括MPI,NCCL等通信库。熟悉AI推理引擎运行机制,理解Pytorch Aten,Executorch,TVM Runtime 投递...
【日常实习】AI Agent 系统平台工程师上海、深圳、杭州实习研发日常实习职位描述岗位使命作为系统平台工程师,你将深度参与支撑AI Agent全生命周期的核心运行时系统与开发框架平台的研发工作。你将在资深系统工程师的指导下,接触并实践高性能Agent Runtime引擎、工具调用框架、可观测性体系等工程化前沿课题,在真实的大规模分布式系统环境中磨砺系统设计与工程实现能力,获得高速成长。核心职责1. Agent运行时模块开发与调试协助开发Agent Runtime的核心功能模块,包括生命周期管理、上下文窗口管理、任务状态持久化等基础能力,参与模块单元测试、集成测试与线上Bug排查修复。2. 工具链与插件框架建设参与在导师指导下,参与Tool/Plugin注册与调用框架的功能迭代,协助完善动态工具发现机制、权限控制逻辑及沙箱隔离执行方案,负责相关模块的文档撰写与测试用例补充。3. Agent编排与工作流支撑协助基于LangGraph/AutoGen等框架完善Agent编排引擎的局部功能,参与多智能体协作调度流程的调试与优化,支撑工作流DAG定义与动态任务路由逻辑的工程实现。4. 可观测性体系建设协助参与Agent全链路可观测性基础设施的建设,协助接入Tracing/Logging/Metrics采集管线,协助开发Agent执行轨迹的可视化分析工具,支撑系统稳定性监控需求。5. 技术调研与工程支撑持续跟踪Agent基础设施、MCP/A2A协议、云原生编排等领域的最新进展,输出有实质内容的技术调研报告,为团队架构演进提供参考输入。职位要求基础技术能力1. 熟练掌握至少一门编程语言(Python/Go/Java均可),代码风格规范,具备独立完成功能模块开发的能力2. 了解分布式系统基本概念(如消息队列、服务调用、状态管理等),有相关课程学习或项目实践经验3. 了解Docker/Kubernetes基本使用,能够在容器化环境中部署和调试服务4. 了解大语言模型基本原理及主流API调用方式,有Agent框架(LangChain/LangGraph/AutoGen等)的基础使用经验者优先学业与时间要求1. 在读本科(大三及以上)或硕士研究生,计算机、软件工程、信息工程等相关专业2. 每周可保证 至少4天 稳定工作,实习周期 3个月以上3. 具备良好的自驱力与文档习惯,能独立拆解任务并按时交付加分项1. 有Kafka/Flink/Spark/Ray等大数据或流计算系统的学习或使用经验2. 有AI Coding工具(Cursor/Claude Code/Copilot等)的实际工程使用习惯3. 有开源项目贡献记录或活跃的GitHub主页4. 对系统性能优化、高并发架构设计有浓厚兴趣投递...
【暑期实习】AI Agent 系统平台工程师上海、深圳、杭州实习研发27届暑期实习职位描述岗位使命作为系统平台工程师,你将深度参与支撑AI Agent全生命周期的核心运行时系统与开发框架平台的研发工作。你将在资深系统工程师的指导下,接触并实践高性能Agent Runtime引擎、工具调用框架、可观测性体系等工程化前沿课题,在真实的大规模分布式系统环境中磨砺系统设计与工程实现能力,获得高速成长。核心职责1. 专题课题独立攻关认领一个与Agent运行时或平台框架强相关的工程专题课题(如:Agent长程任务断点恢复机制设计与实现、基于LangGraph的多智能体编排引擎性能优化、Tool调用安全沙箱隔离方案原型验证、Agent全链路Tracing可观测性体系建设等),在导师指导下完成端到端的方案设计与工程实现。2. 核心平台能力建设参与深度参与Agent Runtime或开发框架的关键模块研发,包括但不限于:状态持久化存储、Token预算管理策略、上下文压缩算法、工具调用链路优化、Agent执行轨迹分析等,产出可集成上线或可复用的代码成果。3. 系统性能评估与基准测试设计合理的基准测试方案,建立延迟、吞吐量、资源利用率、可靠性等量化评估指标,对所负责模块进行系统性性能验证与瓶颈分析,输出完整的性能报告与优化建议。4. 开发者体验与SDK建设参与Agent SDK/CLI/API的模块化封装工作,协助完善开发者文档与最佳实践规范,从开发者视角提出并落地提升框架易用性的具体改进方案。5. 前沿技术探索与创新输出结合课题方向,主动调研MCP/A2A协议标准化、云原生Agent调度、Agent评估体系(SWE-Bench/TAU-Bench等)等最新进展,提出具有创新性的工程方案,鼓励在实习期间产出技术分享、开源贡献或论文/专利思路。职位要求基础技术能力:1. 熟练掌握至少一种系统级语言(Go/Java/Rust之一)或Python,具备扎实的编程功底与独立完成完整项目的工程能力2. 理解分布式系统核心概念(分布式一致性、消息队列、状态管理、高可用架构等),有相关系统(Kafka/Flink/Spark/Ray/Redis等)的实际使用或开发经验3. 熟悉Docker/Kubernetes基本原理与操作,有微服务或云原生环境下的系统部署与调试经验4. 了解至少一种主流AI Agent框架(LangGraph/AutoGen/LangChain/Strands等)的设计理念,理解工具调用、工作流编排、记忆管理等核心机制5. 了解大语言模型推理服务基本原理,有RAG系统或向量数据库使用经验者优先学业与时间要求:1. 在读本科(大三及以上)、硕士或博士研究生,计算机、软件工程、信息工程等相关专业2. 可连续全职实习 3个月以上,保证每周出勤4天以上综合素质1. 对构建高可靠、可扩展的Agent基础设施平台充满热情,有强烈的工程质量意识与结果导向2. 具备出色的跨团队沟通能力,能与AI算法工程师、平台工程师和业务团队高效协作3. 有良好的技术文档写作能力,能清晰表达系统设计思路、接口规范与实验结论4. 能快速适应AI Agent领域的高速技术迭代,对将分布式系统经验迁移至Agent基础设施这一全新领域充满探索欲加分项1. 有从0到1设计并实现某一分布式系统组件、Agent框架模块或平台基础设施的完整经历2. 熟悉Agent评估体系(SWE-Bench/TAU-Bench等),有自动化评测集构建或基准测试经验3. 有AI Coding工具(Claude Code/Cursor/Codex CLI等)的深度工程使用经验,具备AI辅助开发的工程化思维4. 在开源社区有高质量项目贡献(尤其是Agent框架、分布式系统或大数据领域)5. 了解GPU集群管理或模型推理优化(vLLM/TensorRT等)的基本原理6. 熟悉多语言技术栈(Go + Python为佳),有跨语言异构系统的设计或集成经验7. 在ACM-ICPC/系统类竞赛中获奖,或在OSDI/SOSP/ATC/EuroSys等系统顶会发表过相关论文投递...
机器人Agent开发实习生上海实习职位描述1. 参与场景化 Agent 设计与开发面向导览、导购、接待等机器人业务场景,参与 Agent 流程设计、任务拆解、多轮对话和异常处理。2. 参与 Agent 框架与 AgentOS 能力建设协助建设 Agent Runtime、Workflow、Memory、Tool Use 等基础能力,支持不同场景 Agent 的快速配置、调试和迭代。3. 设计和接入 Agent 工具能力参与定义机器人 Agent 可调用的工具接口,包括知识库检索、业务系统查询、预约登记、商品推荐等能力,让大模型能够稳定调用工具完成任务。4. 优化 Prompt、Workflow 和行为约束针对不同机器人角色和场景,设计 Prompt、流程模板和约束规则,提升 Agent 回复、决策和工具调用的稳定性。5. 参与 Agent 仿真评测与数据分析参与测试 Case 设计、运行 Trace 分析、失败样本标注和效果评估,推动 Agent 持续优化。职位要求1.
AI Agent系统平台工程师 - Agent运行时与框架体系方向深圳、上海、杭州全职研发职位描述岗位使命负责构建支撑AI Agent全生命周期的核心运行时系统与开发框架平台。你将站在大模型工程化落地的最前沿,设计并实现高性能、高可用、可扩展的Agent运行时引擎、编排调度核心、工具调用框架及可观测性体系,为上层业务Agent提供稳定、高效、安全的底层基础设施与开发范式。如果你拥有大数据/分布式系统基础设施的深厚背景,并对将大模型能力转化为可规模化运行的Agent系统充满热情,这正是属于你的机会。核心职责1. Agent运行时系统(Runtime)设计与研发:负责Agent Runtime内核的设计、研发与性能优化,涵盖Agent生命周期管理、状态持久化、上下文窗口管理、长程任务执行与断点恢复等核心能力,保障智能体核心引擎稳定高效运行。2. Agent编排框架与工作流引擎:基于LangGraph/AutoGen/Strands等主流框架理念,设计并实现Agent编排引擎,支持多智能体协作调度、复杂状态机与工作流DAG定义、动态任务路由与负载分发,构建统一的Agent执行通道抽象。3. 工具链与基础设施底座:构建Tool/Plugin注册与调用框架,支持动态工具发现、权限控制、安全沙箱隔离执行;设计大规模Sandbox系统与公司级Agent Tool网关,保障多租户场景下的安全与资源隔离。4. 大规模Agent系统集成与性能优化:深度结合分布式计算、流处理与高并发系统设计经验,优化端到端LLM推理调用链路,实现Token预算管理、上下文压缩、提示词缓存与模型路由策略,持续降低系统延迟与成本。5. Agent可观测性与治理体系:建设全链路可观测性体系,覆盖Tracing、Logging、Metrics及Agent执行轨迹追踪与分析;构建Agent行为合规检测、Prompt漂移监控及自动化质量评估与回归验证管线。6.开发者平台与SDK建设:模块化输出Agent开发套件,封装API/SDK/CLI,降低业务团队Agent构建与调优门槛;定义并维护Agent开发规范与最佳实践,支撑业务场景快速集成与规模化交付。7. 前沿技术探索与架构演进:持续跟踪业界Agent基础设施、MCP/A2A协议、云原生编排等方向的技术进展,推动新技术在平台中的规模化落地,持续迭代架构以适应不断增长的智能体规模与复杂度需求。职位要求必备技术能力1. 精通至少一种系统级编程语言(Go/Java/Rust)与至少一种AI/脚本语言(Python),具备扎实的编程功底与优秀的系统设计能力;2. 具备3年以上分布式系统或大数据基础设施(如Kafka、Flink、Spark、Ray、HDFS、消息队列等)的设计开发经验,深刻理解分布式一致性、状态管理、高可用架构与弹性伸缩等核心概念;3. 熟悉Docker/Kubernetes等云原生技术栈,具备微服务架构、服务网格(Service Mesh)、容器编排、CI/CD流水线的工程实践经验;4. 熟悉至少一种主流AI Agent开发框架(LangGraph/AutoGen/LangChain/Strands等)的设计理念与底层实现,理解Agent工作流编排、工具调用、记忆管理等核心机制;5. 理解大语言模型(LLM)基本原理与推理部署流程,有RAG系统、向量数据库或模型服务化的工程经验;6. 具备良好的系统抽象能力与组件化设计思维,熟悉事件驱动架构、插件化架构等常见架构模式。经验背景:1. 在大数据平台、分布式调度系统、云原生PaaS平台或高并发消息系统等相关领域有项目实践经验者优先;2. 有Agent运行时系统、Agent平台基础设施或LLM推理服务平台的设计开发经验者优先;3. 熟悉多租户系统设计,具备大规模系统部署、性能优化与容量规划经验;4. 有AI Coding工具(如Claude Code、Cursor、Codex等)的深度使用经验,具备AI辅助开发的工程化思维综合素质:1. 具备优秀的系统抽象、问题拆解与工程架构能力,对构建高可靠、可扩展的Agent基础设施充满热情2. 拥有出色的自驱力、学习能力和跨团队沟通协作能力——你将同时与算法团队、平台工程团队和业务团队深度合作3. 能够快速适应AI Agent领域的高速技术迭代,在快节奏环境中持续学习并输出高质量工程成果4. 对将大数据/分布式系统经验迁移至AI Agent基础设施这一全新领域充满探索欲与使命感加分项1. 有从0到1构建Agent开发框架、Agent运行时或智能体平台的核心架构经历2. 熟悉Agent评估体系(如SWE-Bench、TAU-Bench等),有自动化评测集构建经验3. 了解强化学习(RL)训练基础设施(采样、Reward、回放、训练闭环),有与算法团队协作优化Agent能力的工程经验4. 在开源社区有高质量项目贡献(尤其是Agent框架、分布式系统或大数据领域)5. 有GPU集群管理、模型推理优化(vLLM/TensorRT等)的实践经验6.
端侧 AI 部署与应用工程师 (2026届校招)北京校招正式智能制造 / 工业互联网 / 工业自动化 - 研发职位描述你将加入我们的核心研发团队,基于Qualcomm计算平台,打通从 AI 模型到端侧应用落地的“最后一公里”。我们需要你不仅懂算法原理,更能通过扎实的工程能力,构建高性能的 AI Agent 与推理系统。1. 模型转换与性能调优 (Model Engineering):使用 Linux 环境下的工具链,将 PyTorch/TensorFlow 训练模型转换为专用格式(DLC/QNN context)。编写 Shell/Python 脚本 实现模型转换、量化(Int8/FP16)及精度验证的自动化流程。分析模型在 Hexagon DSP/NPU 上的性能瓶颈,进行算子优化和推理加速。2. 端侧 AI 系统开发 (System Integration):基于 Android/Linux 系统,使用
General Information Job Title ZeBu Application Engineer Job ID 17304 Country China City Beijing Date Posted 02-May-2026 Job Category Engineering Job Subcategory Applications Engineering Hire Type Employee Remote Eligible No Descriptions & Requirements Job Description and
Career Area:Engineering Job Description: Your Work Shapes the World at Caterpillar Inc. When you join Caterpillar, youre joining a global team who cares not just about the work we do – but also about each other.
Company Description Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance
C++开发工程师20-50K深圳正式技术研发职位描述职位描述:- 负责机器人动作研发平台的客户端(无UI界面)开发工作,并输出技术文档;- 负责网络通信架构、动作虚拟机、实时视频流传输等模块的设计和实现;- 负责机器学习算法部署和推理优化。职位要求任职要求:- 扎实的计算机基础,熟悉基本的数据结构和算法以及常用的设计模式;- 熟练掌握 C/C++,了解 Linux 操作系统和 Bash Shell 命令行编程;- 对 CMake 构建系统、C++ 多线程模型有一定了解;- 适应基于版本控制、代码评审和自动化测试的团队协作模式;- 具备良好的英文技术文档阅读能力。加分项:- 对 CUDA、Taichi、Warp 等高性能并行计算平台或框架有一定了解;- 具备网络通信协议(TCP/UDP、gRPC、Websocket)或低延迟传输优化经验;- 具备实时视频传输经验,熟悉 WebRTC、FFmpeg 等多媒体框架;- 具备 WebAssembly 应用开发经验,了解 Emscripten 工具链;- 了解机器学习模型推理优化(ONNX Runtime)或其他部署加速方案。投递...
AI软件测试工程师/专家上海、杭州全职研发 - 电子 / 半导体职位描述1.AI模型与工具链测试: 负责AI全栈测试,包括但不限于:大语言模型(LLM)、计算机视觉模型(CNN/Transformer等)的精度验证、性能调优与端到端测试;NPU固件通信、算子接口、多芯片互联及算力抽象层的功能与性能测试;基于openVX compiler等编译器框架的AI工具链测试(如模型编译优化、量化部署等)2.RISC-V工具链测试: 负责RISC-V架构下Debug诊断工具(如GDB扩展、Trace工具)及编译器(LLVM/GCC定制)的测试3.设计测试方案,覆盖单元测试、集成测试、系统测试全流程, 开发自动化测试用例,验证工具链的稳定性与性能职位要求1.本科及以上学历,优先考虑计算机科学或者电子工程相关专业;2.熟悉深度学习模型推理流程,有CNN/Transformer/LLM等模型本地部署经验者优先;3.了解AI编译器栈(ONNX Runtime等),能验证模型编译后的精度与性能损失4.熟悉编译器原理(如LLVM/Clang/RVCC),或RISC-V Debug协议5.有嵌入式工具链测试经验(如交叉编译器、性能分析工具)者优先6.具备性能调优经验(如Profiling、瓶颈分析), 精通AI算子精度,性能等回归测试方法者优先7.有NPU/GPU等异构计算平台的测试经验者优先投递...
Company Description Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance
AI Agent开发工程师 - 智能座舱南京全职算法类职位描述1. 主导企业AIAgent系统整体技术架构设计,覆盖Agent Runtime.Memory、Skills、MCP协议、Harness安全层等核心模块。2. 制定技术选型方案,评估并整合OpenClaw、Manus等新一代Agent框架,同时兼容LangChain/LangGraph等成熟框架的已有能力。3. 设计Agent Loop执行引擎、多通道Gateway、任务队列调度机制,确保系统可扩展性与稳定性。4. 规划Agent安全架构(OpenClaw/NanoClaw/IronClaw三层模型),确保企业数据安全合规。5. 建立Agent评测体系,定义评测维度(任务完成率、推理准确性、工具调用成功率、幻觉率等),推动持续质量改进。6. 带领Agent开发团队,制定技术规范,主导架构评审,持续跟踪行业前沿。职位要求1. 本科及以上学历,计算机/Al相关专业,5年以上后端架构或AI系统开发经验。2. 深入理解Al Agent架构,熟悉OpenClaw核心机制。3. 扎实的传统Agent框架经验:精通LangChain、LangGraph、CreewAl、AutoGen中至少两种,有多Agen协作/Workflow编排的生产级落地经验。4. 熟悉MCP (Model Context Protocol)协议,有MCP Server端设计与开发经验。5. 有Agent评测体系搭建经验,熟悉RAGAS、DeepEval、PromptFoo、AgentBench等评测框架或基准。6. 精通Python,熟悉分布式系统设计、微服务架构。7. 熟悉主流LLMAPI(OpenAl、Anthropic、通义千问等),了解漠型路由与Failover策略。8. 有Manus、Genspark、OpenClaw等新一代Agent平台的使用或集成经验者优先加分项:1. 有大模型构建工具,对研发流程提质、提效经验-分析现有的研发流程及管理工具,识别潜在的效率提升点。-设计并实施基于AI的解决方案,提高研发效率和产品质量。2. 有车载行业经验面对项目实施过程中的技术挑战,能够快速定位问题,并提出有效的解决方案。-通过技术创新解决复杂的技术难题,推动项目的顺利进行。投递...
中/高级iOS开发工程师(固件支持方向)深圳社招全职职位描述1、负责Insta360 App中固件连接和拍摄业务的开发与维护;2、深度参与产品需求的全过程,并与上下游团队紧密协作,共同保证固件支持业务顺利开展;3、设计良好的技术架构,与团队共同推进构建可扩展的跨端通信协议层框架;4、根据团队的整体目标和规划,进行相关的研发。职位要求1、本科及以上学历,计算机基础扎实。2、熟练掌握Swift/OC开发,有良好的编程能力与代码风格。3、熟悉runtime原理,多线程操作、内存管理与性能优化等。4、具有较强的分析和解决问题的能力。5、热爱新技术,了解并紧跟业界技术动向,并有效内化。投递...
模型部署工程师上海全职智能制造 / 工业互联网 / 工业自动化职位描述1. 深入研究模型压缩与优化前沿技术,持续探索并跟进如 TensorRT、ONNX Runtime、OpenVINO 等不同深度学习推理和加速框架的最新进展,通过模型剪枝、量化、蒸馏等技术手段,实现模型轻量化与性能优化,提升模型在各类硬件平台上的推理效率;2. 负责感知、规划、端到端无人驾驶等深度学习算法在嵌入式设备、边缘计算平台(OrinX, J6等)及云端服务器的全流程部署工作,包括环境搭建、模型转换、性能调优,确保算法在实际应用场景中高效、稳定运行;3. 与算法研发团队紧密协作,参与 AI 模型的设计与开发阶段,从部署可行性角度提供专业建议,推动算法模型与工程实践的深度融合;4. 针对部署过程中出现的问题,进行系统性的故障排查与性能分析,提出有效的解决方案,保障 AI 系统的可靠性与稳定性。同时,积极关注行业动态,探索新的技术和方法,为公司 AI 项目的持续优化提供技术支持。职位要求1. 教育背景:计算机科学与技术、电子信息、人工智能等相关专业本科及以上学历;2. 编程能力:具备扎实的 C++、Python 开发能力,能够熟练运用两种语言进行复杂业务逻辑的实现与系统开发;3. 深度学习框架:熟练掌握 Pytorch 深度学习框架,熟悉其底层原理与高级特性,能够灵活运用框架实现模型的训练、调试与部署;4. 技术实践:精通深度学习模型的蒸馏、剪枝、量化等优化技术,拥有实际项目开发经历,能够将理论知识应用于实践,解决实际工程问题;5. 加分项:具备 CUDA 开发经验,能够充分发挥 GPU 并行计算能力,加速模型推理;拥有 Transformer 相关深度学习模型部署经验,熟悉其架构特点与部署要点者优先考虑;6. 其他能力:具备良好的团队协作精神、沟通能力和问题解决能力,能够在跨部门协作中高效推进项目;对新技术保持敏锐的洞察力和学习热情,能够快速掌握并应用新兴的 AI 部署技术。投递...
大模型训练框架研发工程师-生成模型方向紧急北京、上海社招全职研发 - 基础架构大模型系统职位描述你将加入一支把“把万卡集群跑到极致”当日常的团队,与业内领先的通用大模型一起成长。你的核心任务是:突破大规模训练的速度、成本与稳定性的极限。你将负责的核心工作:1. 大规模分布式训练系统研发(Scale Matters)- 主导 Data / Tensor / Pipeline / Expert 并行 策略的研发与优化。- 优化高性能通信、计算通信掩盖、显存复用,提升近万卡训练的集群利用率。- 面向上百亿〜万亿参数模型,实践高效并行范式。2. 性能极限优化(Performance Engineering)- 系统性分析训练吞吐瓶颈(comm / compute / IO / kernel / memory)。- 针对关键路径做深度优化:算子融合、精度压缩、通信调度、显存管理策略。- 与推理体系协同推进量化、MoE、Speculative Training 等最新机制的训练端落地。3. 前沿训练技术探索(Frontier Research → Engineering)根据你的兴趣及特长,可主导其中一类:-
端到端算法工程师上海全职智能制造 / 工业互联网 / 工业自动化职位描述岗位职责:1.核心算法研发:负责面向无人驾驶重卡场景的自动驾驶算法研发,包括但不限于3D目标检测、实例分割、占用预测、端到端自驾算法等;2.数据闭环:参与构建和优化自动化数据闭环体系,包括数据挖掘、自动标注、模型评测与Badcase分析,通过数据驱动的方式持续迭代优化模型性能 ;3.工程落地:负责模型在Orin等车规级平台上的量化、剪枝与性能优化,确保算法的实时性与稳定性,支撑量产项目交付 ;4.技术前瞻:紧跟学术界及工业界前沿方向,探索世界模型(World Model)、视觉语言模型(VLM)等新技术在自动驾驶中的应用,提升系统泛化能力与鲁棒性。职位要求任职要求:1.教育背景:硕士及以上学历,计算机科学、自动化、机器人、应用数学或相关专业;2.扎实的算法基础:具备扎实的深度学习理论基础,深入理解 CNN、Transformer 等核心网络结构,熟悉目标检测、分割、跟踪、多任务学习、BEV 感知等主流算法框架;3.行业经验:具备3年以上自动驾驶/机器人领域感知算法研发经验,有量产项目落地经验者优先 ;熟悉主流的端到端自动驾驶模型架构(如UniAD, VAD,SparseDrive等)并有实际复现或优化经验者优先;4.工程能力:熟练掌握Python/C++,精通Pytorch深度学习框架,具备优秀的代码能力和良好的编码习惯;5.问题解决能力:具备优秀的逻辑思维和问题拆解能力,能快速定位并解决模型训练或工程化中的复杂问题 。【加分项】1.在CVPR/ICCV/ECCV/NeurIPS等顶级会议或期刊上发表过论文者 ;2.在Kaggle、Codalab或相关学术竞赛中取得过优秀名次 ;3.熟悉模型部署工具链(TensorRT, ONNX Runtime, CUDA),有Orin平台优化经验;4.对强化学习(RL)、模仿学习(IL)或具身智能有深入理解 。投递...
2026届校招-编译工具链工程师北京、杭州、上海校招正式研发 - 电子 / 半导体职位 ID:A207885职位描述1、硬件加速器软件工具链的开发,包括而不限于:算子开发、性能优化及验证、编译器开发(前端、IR、后端)、模型量化研发、Runtime开发;2、工具链跟系统的集成,业务上线支持,系统软硬件协同优化工作;3、前沿模型探索以及和硬件的适配性评估,前端框架研发相关工作。职位要求1、2026届获得硕士及以上学位,计算机、电子、微电子、通信等相关专业毕业; 2、理解深度学习框架和软件栈,熟悉 C/C++、Python 、汇编等编程语言;3、有主动学习、快速解决问题的能力和自我驱动力。以下为加分项:1、熟悉计算机体系结构和并行计算;2、了解编译器和代码优化技术,熟悉 TVM、XLA 等中间表示,有相关开发经验;3、对常用的深度学习框架有深入理解,包括但不限于 TensorFlow、PyTorch、JAX,Llamacpp;4、有LLVM、MLIR等相关开发经验;5、有AI加速硬件的量化工具开发经验;6、有 GPU、FPGA或AI芯片相关的开发和评测经验。投递...
Company Description Do you want beneficial technologies being shaped by your ideas? Whether in the areas of mobility solutions, consumer goods, industrial technology or energy and building technology - with us, you will have the chance