Long-horizon Agent
简介(未完成)
AI / Agent / System Design
记录 AI、Agent、系统设计与工程实践。内容以一线问题、长期方法和可复用经验为主。
简介(未完成)
简介
简介(未完成)
简介(未整理)
简介(未完成) 评估什么 核心能力评估(第一层) 应用效果评估(第二层) 如何评估 其它 简介(未完成) Agent评估采用三层金字塔模型,按重要性和实施优先级划分: 第一层:核心能力,规划、工具使用、推理、记忆 第二层:应用效果 ...
简介(未完成) Browser Use CDP computer use GUI Agent code sandbox agent与sandbox 其它 简介(未完成) ...
简介