架构 165
- rl与sft
- 大模型infra综述
- OpenTelemetry及生态
- 大模型可观测性
- grpo演进
- rlhf演进
- agent框架
- reward演进
- 大模型RLHF框架
- 大模型rl后训练系统
- GPU与CUDA
- RL闲谈
- MCTS与LLM
- rl与post-train
- rl入门
- 从Transformer到DeepSeek
- bert
- rerank微调
- 大模型推理tips
- RAG向量检索与微调
- dddfirework源码分析
- RAG与知识图谱
- 大模型推理服务框架vLLM
- 大模型推理服务框架
- 模型服务化(未完成)
- 大模型Post-Training
- 大模型训练
- 大模型推理
- 从Attention到Transformer
- k8s设备管理
- ddd从理念到代码
- 如何应用LLM
- 语言模型的发展
- 多类型负载协调员Koordinator
- controller-runtime细节分析
- finops学习
- kubevela多集群
- kubevela中cue的应用
- 基于k8s的工作流
- kubevela源码分析
- 容器和CPU那些事儿
- 数据集管理fluid
- 应用管理平台kubevela
- karmada支持crd
- 多集群管理
- AutoML和AutoDL
- 特征平台
- 实时训练
- 分布式链路追踪
- K8S YAML 资源清单管理方案
- tensorflow原理——python层分析
- 如何学习tensorflow
- 数据并行——allreduce
- 数据并行——ps
- 推荐系统embedding原理及实践
- 机器学习中的python调用c
- 机器学习训练框架概述
- tensornet源码分析
- 大模型训练和推理
- X的生成——特征工程
- tvm
- tensorflow原理——core层分析
- 模型演变
- 《深度学习推荐系统实战》笔记
- keras 和 Estimator
- tensorflow分布式训练
- 分布式训练的一些问题
- 基于Volcano的弹性训练
- 图神经网络
- pytorch弹性分布式训练
- 从混部到统一调度
- 对序列建模——从RNN到Attention
- pytorch分布式训练
- CNN
- 《动手学深度学习》笔记
- pytorch与线性回归
- 多活
- volcano特性源码分析
- 推理服务
- kubebuilder 学习
- mpi
- 学习pytorch
- client-go学习
- 提高gpu 利用率
- GPU与容器的结合
- GPU入门
- AI云平台梳理
- tensorflow学习
- tf-operator源码分析
- k8s批处理调度/Job调度
- 喜马拉雅容器化实践
- Kubernetes 实践
- 学习rpc
- BFF
- openkruise学习
- 可观察性和监控系统
- 监控系统
- 基于Kubernetes选主及应用
- 《许式伟的架构课》笔记
- Admission Controller 与 Admission Webhook
- 发布平台系统设计
- k8s水平扩缩容
- Scheduler如何给Node打分
- Scheduler扩展
- 深入controller
- openkruise cloneset学习
- controller-runtime源码分析
- pv与pvc实现
- csi学习
- client-go informer源码分析
- kubelet 组件分析
- 调度实践
- Pod是如何被创建出来的?
- 《软件设计之美》笔记
- mecha 架构学习
- Kubernetes events学习及应用
- CRI——kubelet与容器引擎之间的接口
- 资源调度泛谈
- 业务系统设计原则
- grpc学习
- 元编程
- 以应用为中心
- istio学习
- 下一代微服务Service Mesh
- 《实现领域驱动设计》笔记
- 概率论
- serverless 泛谈
- 《架构整洁之道》笔记
- 处理复杂性
- 那些年追过的并发
- 服务器端编程
- 网络通信协议
- 架构大杂烩
- 如何学习架构
- 《反应式设计模式》笔记
- 项目的演化特点
- 反应式架构摸索
- 函数式编程的设计模式
- 服务化
- ddd反模式——CRUD的败笔
- 研发效能平台
- 重新看面向对象设计
- 业务系统设计的一些体会
- 函数式编程
- 《左耳听风》笔记
- 业务程序猿眼中的微服务管理
- DDD实践——CQRS
- 项目隔离——案例研究
- 《编程的本质》笔记
- 系统故障排查汇总及教训
- 平台支持类系统的几个点
- 代码腾挪的艺术
- abtest 系统设计汇总
- 《从0开始学架构》笔记
- 初级权限系统设计
- 领域驱动理念
- 现有上传协议分析
- 移动网络下的文件上传要注意的几个问题
- 推送系统的几个基本问题
- 做配置中心要想好的几个基本问题
- 不同层面的异步
- 分层那些事儿
- 用户认证问题
- 资源的分配与回收——池
- 消息/任务队列