Agent与软件开发

简介 Agent不只是一个工具 AI 能力的边界 LLM带来的自主性给软件开发带来了什么好处呢与传统软件的差异 agentic局限把业务知识丝滑地融入到 Agent 有哪些简介比尔·盖茨：AI Agent将彻底改变人类生活方式尽管软件在过去几十年里取得了显著的进步，但是，从很多方面来看，它依然有些 “笨拙”。在计算机上完成任务时，你需要告诉设备使用哪...

2025/07/20 技术

提升Agent能力——上下文工程

简介 Prompt的演进：从静态到动态自适应技术要点长上下文带来的问题 Agent自省之路-ACE/Agentic Context Engineering 上下文工程之工程实践领域 AI代码工程 langgraph context 简介提示工程（PE）的主要关注点是如何编...

2025/07/19 技术

llm评测

简介(未完成) 挑战评测流程与时俱进简介(未完成) 揭秘大模型评测：如何用“说明书”式方法实现业务场景下的精准评估大模型评测的目标是通过设计合理的测试任务和数据集来对大模型的能力进行全面、量化的评估。性能测试通过压测实现。基础模型的Benchmark(基准测试) 业务效果方面的评测。在基础模型发布时，模型厂商提供的测试报告无法覆盖用户实际业务场景...

2025/06/28 技术

OpenTelemetry及生态

简介简介简介（未完成） OpenTelemetry 跨语言规范 API / SDK Collector 简介（未完成） OPLG：新一代云原生可观测最佳实践未细读使用 OpenTelemetry Tracing 最大化 Kubernetes 效率未读如何利用 OpenTelemetry 监控和优...

2025/06/21 架构

大模型可观测性

简介（未完成）耗时耗在哪？ ==> 全链路追踪问答质量简介（未完成） AI时代的可观测性跟以前不同了，也更重要了，因为LLM带来了非确定性的决策逻辑，系统的行为比以前更难以预测了。可观测性的侧重点不同了，但思路和原则并没有发生颠覆性的变化。以前的系统，复杂度集中体现在分布式服务的调用关系上；而在AI智能体开发中，复杂度来源于如何理解智能体内部的自主行为上，也包括多智...

2025/06/21 架构

rl微调

简介(未完成) RL赋能实践与文档解析 Query生成 tool-use rl 优化Planner 简介(未完成) 精心设计的奖励函数对于有效的强化学习训练至关重要，因为它提供了优化信号，引导策略朝着理想的行为发展。在 GRPO 中，基于结果的奖励已被证明既高效又有效，无需密集的中间监督即可支持稳健的策略改进。...

2025/06/12 技术

grpo演进

简介（未完成）简介（未完成）与ppo对比与ppo对比 PPO GRPO 价值网络的使用依赖于一个与策略模型大小相当的价值网络（critic model）来估计优势函数（advantage function）。这个价值网络需要在每个时间步对状态进行评估，计...

2025/05/26 架构

rlhf演进

简介（未完成） RLHF流程梳理一些训练的trick 与sft 对比简介（未完成）经典的RL算法一般是“Actor-Critic”架构的，即同时训练两个模型，一个作为“执行者”解决特定任务；一个作为“评论者”对“执行者”的表现进行打分；通过这种协同来实现两者的共同进步；最终一般只使用Actor模型作为线上推理模型。而RLHF，需要增加人类偏好数据(HF)作为待学...

2025/04/26 架构

agent框架

简介框架现有框架对比从能力来看框架规划能力的存在形态标准化工作多 Agent 系统 Harness 框架示例 langchain使用 agno langchain源码其它理念之争：agent vs workflow（202...