小米汽车-Agent 评测高级工程师-智能座舱 北京 社招 全职 职位 ID:A148844 职位描述 1、参与构建Agent评测体系,包括但不限于智能体的任务完成度、决策合理性、工具调用、知识时效、幻觉率等维度等评估,能够独立完成设计与研发工作;2、参与大模型(LLM、多模态、AIGC)效果/性能/安全评测指标设计、数据集构建与评测流程自动化构建;3、负责模型微调训练后的评测工作,设计实验验证微调策略的有效性,确保模型性能提升符合预期;4、探索AI在软件测试领域的应用,包括但不限于AI生成测试用例、AI自动执行测试、测试缺陷预测、智能测试报告生成等,打通AI测试流程闭环;5、跟踪AI测试领域的前沿技术(如LLM在测试中的应用、多模态内容理解等),将新技术应用于实际业务,提升测试技术的先进性。 职位要求 1、本科及以上学历(硕士及以上学历优先),计算机科学、人工智能、软件工程或相关专业;2、具有3年以上测试开发相关经验,其中至少 1 年专注 AI/算法/模型评测/AI-Testing 工具开发或相关领域;3、熟练掌握Python,熟悉常用的机器学习框架(如TensorFlow、PyTorch、Hugging Face等),理解机器学习、深度学习基本原理,对大语言模型(LLM)、Agent系统有基本认知;4、熟悉主流测试框架(pytest、TestNG、Selenium、Playwright、JMeter、Locust 等),有二次开发经验;5、能够熟练运用AI赋能日常工作;6、对质量与效率有较高追求,具备强烈的 Ownership 与自驱力;7、具备良好的问题分析解决能力、沟通能力及团队协作精神,能够与团队紧密合作;8、保持对最新AI技术和研究动态的关注,具备持续学习的能力。 投递...