大模型推理服务框架
AI / Agent / System Design
记录 AI、Agent、系统设计与工程实践。内容以一线问题、长期方法和可复用经验为主。
简介
简介 设计思想 行为范式:从COT到ReAct 从ReAct出发 ReAct + 规划 ReAct + 反思 Ralph Loop 猴版实现 ReAct/交互循环 无反馈的planne...
什么是Prompt 如何写好Prompt——结构化 自动化提示词工程 工程示例 不同角色的Prompt 代码示例 Prompt 能力有上限嘛? 0706Prompt也是一种代码 其它 什么是Prompt Prompt是运行在 LL...
为什么需要微调 整体思路 数学表示 领域微调 如何对大模型进行微调 微调算法 PEFT/LoRA原理 HuggingFace Peft 实现 P-Tuning 系列/可学习的提示 ...
简介 大模型行不行 汪涛 未知 对LLM的理解 张俊林 落地 未来 如何学习技术报告? 三个趋势 其它 简介 汪涛:软件的实现涉及到很多方面资源成本的平衡: 计算能力成本。 存储能力成本。...