Agent与软件开发
简介 Agent不只是一个工具 AI 能力的边界 LLM带来的自主性给软件开发带来了什么好处呢 与传统软件的差异 agentic局限 把业务知识丝滑地融入到 Agent 有哪些 简介 比尔·盖茨:AI Agent将彻底改变人类生活方式尽管软件在过去几十年里取得了显著的进步,但是,从很多方面来看,它依然有些 “笨拙”。在计算机上完成任务时,你需要告诉设备使用哪...
简介 Agent不只是一个工具 AI 能力的边界 LLM带来的自主性给软件开发带来了什么好处呢 与传统软件的差异 agentic局限 把业务知识丝滑地融入到 Agent 有哪些 简介 比尔·盖茨:AI Agent将彻底改变人类生活方式尽管软件在过去几十年里取得了显著的进步,但是,从很多方面来看,它依然有些 “笨拙”。在计算机上完成任务时,你需要告诉设备使用哪...
简介 Prompt的演进:从静态到动态自适应 技术要点 长上下文带来的问题 Agent自省之路-ACE/Agentic Context Engineering 上下文工程之工程 实践 领域 AI代码 工程 langgraph context 简介 提示工程(PE)的主要关注点是如何编...
简介(未完成) 挑战 评测流程 与时俱进 简介(未完成) 揭秘大模型评测:如何用“说明书”式方法实现业务场景下的精准评估 大模型评测的目标是通过设计合理的测试任务和数据集来对大模型的能力进行全面、量化的评估。 性能测试通过压测实现。 基础模型的Benchmark(基准测试) 业务效果方面的评测。在基础模型发布时,模型厂商提供的测试报告无法覆盖用户实际业务场景...
简介 简介 简介(未完成) OpenTelemetry 跨语言规范 API / SDK Collector 简介(未完成) OPLG:新一代云原生可观测最佳实践 未细读 使用 OpenTelemetry Tracing 最大化 Kubernetes 效率 未读 如何利用 OpenTelemetry 监控和优...
简介(未完成) 耗时耗在哪? ==> 全链路追踪 问答质量 简介(未完成) AI时代的可观测性跟以前不同了,也更重要了,因为LLM带来了非确定性的决策逻辑,系统的行为比以前更难以预测了。可观测性的侧重点不同了,但思路和原则并没有发生颠覆性的变化。以前的系统,复杂度集中体现在分布式服务的调用关系上;而在AI智能体开发中,复杂度来源于如何理解智能体内部的自主行为上,也包括多智...
简介(未完成) RL赋能 实践 与文档解析 Query生成 tool-use rl 优化Planner 简介(未完成) 精心设计的奖励函数对于有效的强化学习训练至关重要,因为它提供了优化信号,引导策略朝着理想的行为发展。在 GRPO 中,基于结果的奖励已被证明既高效又有效,无需密集的中间监督即可支持稳健的策略改进。...
简介(未完成) 简介(未完成) 与ppo对比 与ppo对比 PPO GRPO 价值网络的使用 依赖于一个与策略模型大小相当的价值网络(critic model)来估计优势函数(advantage function)。这个价值网络需要在每个时间步对状态进行评估,计...
简介(未完成) RLHF流程 梳理 一些训练的trick 与sft 对比 简介(未完成) 经典的RL算法一般是“Actor-Critic”架构的,即同时训练两个模型,一个作为“执行者”解决特定任务;一个作为“评论者”对“执行者”的表现进行打分;通过这种协同来实现两者的共同进步;最终一般只使用Actor模型作为线上推理模型。而RLHF,需要增加人类偏好数据(HF)作为待学...
简介 框架 现有框架对比 从能力来看框架 规划能力的存在形态 标准化工作 多 Agent 系统 Harness 框架示例 langchain使用 agno langchain源码 其它 理念之争:agent vs workflow(202...
简介 分布式Agent系统 挑战 协作方案 A2A 概念 通信 安全 A2A vs MCP 源码 low level a2a-python 安全 其它 简介 初探分布式Agent系统架构相对于在单个进...