RAG与知识图谱

简介全局性问题非结构化数据入知识图谱维护检索知识图谱 GraphRAG 回头看挑战演进（未完成）其它简介 PS：适用于严谨的专业领域(医疗，运维等)，知识的准备需要受到约束的并且知识之间能够明显建立层级关系的。依赖前期高质量，结构化的知识准备，清洗，抽取，通过业务规则通过手动或者自定义SOP流程构建知识图谱。传统的 RAG 技术仍...

2024/07/12 架构

大模型推理服务框架vLLM

简介从PagedAttention开始实现整体架构请求调度源码入口 add_reques/SequenceGroup step()：调度器策略物理块管理器 cacheManager 模型执行推理框架的演进算子层 vl...

2024/07/07 架构

Agent Functon Calling

简介与ReAct对比 llm function-call的能力判定工程 openai like api OpenAI 原生调用结合langchain调用进化 AgentTuning 让大模型主动提出调用工具需求（强化学习的训练方式）利用functioncall来做...

2024/06/22 技术

LLamaIndex入门

简介基本概念/llama-index-core 模型数据（未完成） RAG 索引阶段查询阶段带历史记录带路由多步推理路由 + 工具 + 多步推理。个性化配置 workflow 并发对s...

2024/06/15 技术

另一种微服务架构Multi-Agent

简介 Single-Agent面临的困境/单 agent 能走多远多Agent拓扑结构一个材料主从架构 sub-agent范式与上下文工程（Context Engineering）的结合意图识别准确性与UI的交互多Agent工程问题智能体间的通信 ...

2024/06/10 技术

Python虚拟机

简介虚拟机执行变量、函数、容器（list/dict）面向对象内存管理引用计数实现基于引用追踪的垃圾回收算法基于 Copy 的 GC 算法其它 import generator python vm ...

2024/05/19 技术

LangGraph工作流编排

简介从顺序式为主的简单架构走向复杂的WorkFlow Runnable protocol LCEL 模块化抽象Runnable Runnable串联 LangGraph 构建Agent lcel示例 langgraph示例 LangGraph原理三要...

2024/05/16 技术

Python实践

简介魔法函数 yield和生成器闭包/Closures 装饰器——开闭原则简单示例类装饰器参数化装饰器带属性的装饰器装饰一个类 decorator库 with和上下文管理器动态语言动态属性动态方法 slots ...

2024/03/16 技术

大模型推理服务框架

简介简单封装 FastChat FastChat源码分析请求参数转换 FastChat, How to support a new model? TensorRT-LLM 简介在大模型之前的时代，模型结构不断发散，但推理功能的形态是稳定的，因此推理框架演化的结果是重Builder，轻Runtime。但大模型时...

2024/02/02 架构

模型服务化（未完成）

简介 TensorRT-LLM 简介模型推理服务化框架Triton保姆式教程（一）：快速入门Triton 是 Nvidia 发布的一个高性能推理服务框架，可以帮助开发人员高效轻松地在云端、数据中心或者边缘设备部署高性能推理服务。其中主要特征包括：支持多种深度学习框架（Triton 称之为backend，tf、pytorch、FasterTransformer都有对应bac...

2024/01/23 架构