大模型后训练实习生 上海 社招 全职 职位 ID:E6114 职位描述 1. 数据工程:构建和维护 RTL(Verilog)指令微调数据集,包括 spec→RTL 对齐、功能验证数据生成、DPO 偏好对构建;2. 模型微调:基于 MS-Swift / LLaMA-Factory 等框架,对 Qwen2.5-Coder 等开源代码模型进行 SFT / DPO / GRPO 后训练;3. 评估体系搭建:搭建和维护 GenBen、VerilogEval 等基准测试评估 pipeline,集成 Yosys 综合 + Verilator 仿真;4. 实验迭代:跟踪