rl与sft
AI / Agent / System Design
记录 AI、Agent、系统设计与工程实践。内容以一线问题、长期方法和可复用经验为主。
简介
简介 Agent不只是一个工具 AI 能力的边界 LLM带来的自主性给软件开发带来了什么好处呢 与传统软件的差异 agentic局限 把业务知识丝滑地融入到 Agent 有哪些 简介 比尔·盖茨:AI Agent将彻底改变人类生活方式尽管软件在过去几十年里取得了显著...
简介 Prompt的演进:从静态到动态自适应 技术要点 长上下文带来的问题 Agent自省之路-ACE/Agentic Context Engineering 上下文工程之工程 实践 领域 AI代码 工程 lan...
简介(未完成) 挑战 评测流程 与时俱进 简介(未完成) 揭秘大模型评测:如何用“说明书”式方法实现业务场景下的精准评估 大模型评测的目标是通过设计合理的测试任务和数据集来对大模型的能力进行全面、量化的评估。 性能测试通过压测实现。 基础模型的Benchmark(基准测...
简介(未完成) RL赋能 实践 与文档解析 Query生成 tool-use rl 优化Planner 简介(未完成) 精心设计的奖励函数对于有效的强化学习训练至关重要,因为它提供了优化信号,引导策略朝着理想的行为发展。在...