懂车帝-AI战略 北京 社招 全职 职位 ID:A28335 职位描述 岗位职责1. 趋势洞察:深度调研国内外 AI 领域(LLM, Multi-modal, Agents 等)的最新技术&产品动态、投融资情报及优秀商业案例。2. 场景落地:分析公司现有业务流程,挖掘 AI 提效的切入点,并参与设计、测试基于 AI 的解决方案。3. 工具测评:作为内部“首席测评官”,深度试用各类主流及前沿 AI 工具,并输出针对特定场景的使用指南。4. 战略分析:协助编写战略报告、商业计划书及项目提案,用数据和逻辑论证 AI 投入的 ROI。 职位要求 AI深度用户: - 你是主流 LLM(如 GPT-4, Claude 3, Gemini, 豆包等)的重度用户,不仅会写
AI Agent 产品经理 北京 社招 全职 职位 ID:A02442 职位描述 深入业务部门调研提效需求,识别高价值Agent应用场景,制定产品路线图 1.定义Agent技能优先级(Skills Backlog)和记忆策略,撰写PRD并推动落地 2.深度研究Manus、Genspark、OpenClaw、Perplexity等竞品Agent产品,输出竞品分析报告(功能拆解、交互体验、核心差异) 3.设计Agent交互流程与对话脚本,协调算法、开发、业务团队协作 4.建立提效指标体系,联动评测工程师追踪Agent质量与用户满意度,数据驱动迭代 5.编制Agent使用培训材料,协助赋能全员高效使用 职位要求 1.本科及以上学历,3年以上产品经理经验,有企业效率工具/SaaS产品经验优先2.理解AI Agent技术栈,了解Agent Loop、Memory、Skills、MCP等核心概念3.了解LangChain/LangGraph等传统Agent框架的能力边界,能与技术团队高效沟通技术方案4.深度使用过Manus、Genspark、ChatGPT、Perplexity等AI Agent产品,对Agent交互体验有敏锐洞察5.熟悉飞书生态,有飞书应用或机器人产品设计经验者优先理解大模型应用逻辑与能力边界,能将AI能力转化为可落地的产品方案商业化思维强,执行力强,结果导向能运用AI Coding工具辅助产品构建者加分nowcoder+1 投递...
Agent 评测工程师 北京 社招 全职 职位 ID:A188605 职位描述 1. 搭建Agent端到端评测体系,覆盖单轮问答质量、多轮对话一致性、工具调用准确率、任务完成率等维度。2. 构建和维护评测数据集(Golden Dataset),包括标准问答对、多步推理用例、边界Case、对抗样本等。3. 开发自动化评测Pipeline,集成到CI/CD流程,实现Agent版本发布前的自动回归测试。4. 设计Agent安全性评测方案,包括Prompt注入防御、信息泄露检测、权限越界测试。5. 对标Manus、Genspark等产品的Agent能力,定期进行竞品Benchmark对比评测。6. 输出评测报告,驱动算法和工程团队持续优化。 职位要求 1.本科及以上学历,2年以上AI/NLP评测或QA工程经验。2.熟悉Agent评测框架:RAGAS、DeepEval、TruLens、AgentBench、PromptFoo中至少两种。3.有评测数据集构建经验,熟悉数据标注流程与质量控制方法。4.熟悉LangSmith、LangFuse等LLM可观测性工具,能追踪Agent全链路执行日志。5.了解主流Agent Benchmark(SWE-Bench、WebArena、GAIA、ToolBench等)。6.精通Python,有自动化测试框架开发经验。7.了解红队测试(Red Teaming)、对抗性评测方法者加分。8.有Manus、Genspark、Perplexity等AI Agent产品深度使用与评测经验者优先。 投递...