Our Purpose Mastercard powers economies and empowers people in 200+ countries and territories worldwide. Together with our customers, we’re helping build a sustainable economy where everyone can prosper. We support a wide range of digital payments
Joining Razer will place you on a global mission to revolutionize the way the world games. Razer is a place to do great work, offering you the opportunity to make an impact globally while working across
大模型后训练实习生 上海 社招 全职 职位 ID:E6114 职位描述 1. 数据工程:构建和维护 RTL(Verilog)指令微调数据集,包括 spec→RTL 对齐、功能验证数据生成、DPO 偏好对构建;2. 模型微调:基于 MS-Swift / LLaMA-Factory 等框架,对 Qwen2.5-Coder 等开源代码模型进行 SFT / DPO / GRPO 后训练;3. 评估体系搭建:搭建和维护 GenBen、VerilogEval 等基准测试评估 pipeline,集成 Yosys 综合 + Verilator 仿真;4. 实验迭代:跟踪
优才-具身算法工程师(VLA+RL)-通用业务部 上海 正式 职位描述 VLA 端到端模型研发: 设计并训练端到端视觉-语言-动作模型(如 RT-2、OpenVLA、π0、Diffusion Policy、3D Diffusion Actor 等),实现从视觉输入与语言指令到机器人低维动作空间的直接映射。研究动作表示与生成机制: 动作 Token 化(Action Tokenization)、隐动作量化(Latent Action Quantization, LAPA)、扩散式动作生成(Diffusion Policy)、流匹配(Flow Matching)等前沿方案。探索 RL 与模仿学习(IL)的混合训练范式:利用人类演示数据初始化策略,再通过 RL 进行微调和鲁棒性增强。强化学习运控与策略优化: 包括 PPO、SAC、RLHF(Human Feedback for Robotics)、DAPG 等算法在关节级/任务级控制中的应用。模型部署与实时性优化: 负责 VLA/RL 模型在机器人芯片(Orin、Thor)上的轻量化部署,满足实时控制需求(端到端延迟 50ms,控制频率 ≥ 50Hz),解决长上下文视觉序列与语言指令的并行处理瓶颈。设计模型与底层运控(WBC/MPC)的协同接口: