技术

上下文记忆 agentic chat 图数据库的一些考量 LLM一些探索 Agent实践 LLM预训练 向量数据库的一些考量 fastapi+sqlalchemy进行项目开发 LLM微调实践 Python协程实现 Agent Functon Calling LLamaIndex入门 Multi-Agent探索 Python虚拟机 LLM工作流编排 Python实践 下一个平台Agent 激发LLM涌现——提示工程 LLM微调理论 大佬沉思 LLM外挂知识库 LLMOps 多模态LLM Python一些比较有意思的库 Transformers源码学习 LangChain源码学习 通用分布式计算引擎Ray Python并发 go依赖注入 go collection gc的基本原理 golang性能分析及优化 数据湖 高性能计算与存储 Linux2.1.13网络源代码学习 《大数据经典论文解读》 三驾马车学习 Spark 内存管理及调优 Yarn学习 从Spark部署模式开始讲源码分析 容器狂占内存资源怎么办? 多角度理解一致性 golang io使用及优化模式 Flink学习 c++学习 学习ebpf go设计哲学 ceph学习 学习mesh kvm虚拟化 学习MQ go编译器以及defer实现 学习go 为什么要有堆栈 汇编语言 计算机组成原理 运行时和库 Prometheus client mysql 事务 mysql 事务的隔离级别 mysql 索引 坏味道 学习分布式 学习网络 学习Linux go堆内存分配 golang 系统调用与阻塞处理 Goroutine 调度过程 重新认识cpu mosn有的没的 负载均衡泛谈 单元测试的新解读 《Redis核心技术与实现》笔记 《Prometheus监控实战》笔记 Prometheus 告警学习 calico源码分析 对容器云平台的理解 Prometheus 源码分析 并发的成本 基础设施优化 hashicorp raft源码学习 docker 架构 mosn细节 与微服务框架整合 Java动态代理 编程范式 并发通信模型 《网络是怎样连接的》笔记 go channel codereview gc分析 jvm 线程实现 go打包机制 go interface及反射 如何学习Kubernetes 《编译原理之美》笔记——后端部分 《编译原理之美》笔记——前端部分 Pilot MCP协议分析 go gc 内存管理玩法汇总 软件机制 istio流量管理 Pilot源码分析 golang io 学习Spring mosn源码浅析 MOSN简介 《datacenter as a computer》笔记 学习JVM Tomcat源码分析 Linux可观测性 学习存储 学计算 Gotty源码分析 kubernetes operator kaggle泰坦尼克问题实践 kubernetes扩缩容 神经网络模型优化 直觉上理解深度学习 如何学习机器学习 TIDB源码分析 什么是云原生 Alibaba Java诊断工具Arthas TIDB存储——TIKV 《Apache Kafka源码分析》——简介 netty中的线程池 guava cache 源码分析 Springboot 启动过程分析 Spring 创建Bean的年代变迁 Linux内存管理 自定义CNI IPAM 共识算法 spring redis 源码分析 kafka实践 spring kafka 源码分析 Linux进程调度 让kafka支持优先级队列 Codis源码分析 Redis源码分析 C语言学习 《趣谈Linux操作系统》笔记 docker和k8s安全访问机制 jvm crash分析 Prometheus 学习 Kubernetes监控 Kubernetes 控制器模型 容器日志采集 容器狂占资源怎么办? Kubernetes资源调度——scheduler 时序性数据库介绍及对比 influxdb入门 maven的基本概念 《Apache Kafka源码分析》——server Kubernetes类型系统 源码分析体会 《数据结构与算法之美》——算法新解 Kubernetes源码分析——controller mananger Kubernetes源码分析——apiserver Kubernetes源码分析——kubelet Kubernetes介绍 ansible学习 Kubernetes源码分析——从kubectl开始 jib源码分析之Step实现 线程排队 jib源码分析之细节 跨主机容器通信 jib源码分析及应用 为容器选择一个合适的entrypoint kubernetes yaml配置 《持续交付36讲》笔记 mybatis学习 程序猿应该知道的 无锁数据结构和算法 CNI——容器网络是如何打通的 为什么很多业务程序猿觉得数据结构和算法没用? 串一串一致性协议 当我在说PaaS时,我在说什么 《数据结构与算法之美》——数据结构笔记 PouchContainer技术分享体会 harbor学习 用groovy 来动态化你的代码 精简代码的利器——lombok 学习 《深入剖析kubernetes》笔记 编程语言那些事儿 rxjava3——背压 rxjava2——线程切换 spring cloud 初识 《深入拆解java 虚拟机》笔记 《how tomcat works》笔记 hystrix 学习 rxjava1——概念 Redis 学习 TIDB 学习 如何分发计算 Storm 学习 AQS1——论文学习 Unsafe Spark Stream 学习 linux vfs轮廓 《自己动手写docker》笔记 java8 实践 中本聪比特币白皮书 细读 区块链泛谈 比特币 大杂烩 总纲——如何学习分布式系统 hbase 泛谈 forkjoin 泛谈 看不见摸不着的cdn是啥 《jdk8 in action》笔记 程序猿视角看网络 bgp初识 calico学习 AQS——粗略的代码分析 我们能用反射做什么 web 跨域问题 《clean code》笔记 《Elasticsearch权威指南》笔记 mockito简介及源码分析 2017软件开发小结—— 从做功能到做系统 《Apache Kafka源码分析》——clients dns隐藏的一个坑 《mysql技术内幕》笔记 log4j学习 为什么netty比较难懂? 递归、回溯、动态规划 apollo client源码分析及看待面向对象设计 学习并发 docker运行java项目的常见问题 OpenTSDB 入门 spring事务小结 分布式事务 javascript应用在哪里 《netty in action》读书笔记 netty对http2协议的解析 ssl证书是什么东西 http那些事 苹果APNs推送框架pushy apple 推送那些事儿 编写java框架的几大利器 java内存模型和jvm内存布局 java exception Linux IO学习 netty内存管理 测试环境docker化实践 netty在框架中的使用套路 Nginx简单使用 《Linux内核设计的艺术》小结 Go并发机制及语言层工具 Linux网络源代码学习——数据包的发送与接收 《docker源码分析》小结 docker namespace和cgroup zookeeper三重奏 数据库的一些知识 Spark 泛谈 链式处理的那些套路 netty回顾 Thrift基本原理与实践(二) Thrift基本原理与实践(一) 回调 异步执行抽象——Executor与Future Docker0.1.0源码分析 java gc Jedis源码分析 深度学习泛谈 Linux网络命令操作 JTA与TCC 换个角度看待设计模式 Scala初识 向Hadoop学习NIO的使用 以新的角度看数据结构 并发控制相关的硬件与内核支持 systemd 简介 quartz 源码分析 基于docker搭建测试环境(二) spring aop 实现原理简述 自己动手写spring(八) 支持AOP 自己动手写spring(七) 类结构设计调整 分析log日志 自己动手写spring(六) 支持FactoryBean 自己动手写spring(九) 总结 自己动手写spring(五) bean的生命周期管理 自己动手写spring(四) 整合xml与注解方式 自己动手写spring(三) 支持注解方式 自己动手写spring(二) 创建一个bean工厂 自己动手写spring(一) 使用digester varnish 简单使用 关于docker image的那点事儿 基于docker搭建测试环境 分布式配置系统 JVM执行 git maven/ant/gradle/make使用 再看tcp kv系统 java nio的多线程扩展 《Concurrency Models》笔记 回头看Spring IOC IntelliJ IDEA使用 Java泛型 vagrant 使用 Go常用的一些库 Python初学 Goroutine 调度模型 虚拟网络 《程序员的自我修养》小结 Kubernetes存储 访问Kubernetes上的Service Kubernetes副本管理 Kubernetes pod 组件 Go基础 JVM类加载 硬币和扑克牌问题 LRU实现 virtualbox 使用 ThreadLocal小结 docker快速入门

架构

bert rerank微调 大模型推理tips RAG向量检索与微调 dddfirework源码分析 RAG与知识图谱 大模型推理服务框架vLLM 大模型推理服务框架 模型服务化(未完成) 大模型Post-Training 大模型训练 大模型推理 从Attention到Transformer k8s设备管理 ddd从理念到代码 如何应用LLM 小鼠如何驾驭大象(LLM)? 多类型负载协调员Koordinator controller-runtime细节分析 finops学习 kubevela多集群 kubevela中cue的应用 基于k8s的工作流 kubevela源码分析 容器和CPU那些事儿 数据集管理fluid 应用管理平台kubevela karmada支持crd 多集群管理 AutoML和AutoDL 特征平台 实时训练 分布式链路追踪 K8S YAML 资源清单管理方案 tensorflow原理——python层分析 如何学习tensorflow 数据并行——allreduce 数据并行——ps 推荐系统embedding原理及实践 机器学习中的python调用c 机器学习训练框架概述 tensornet源码分析 大模型训练和推理 X的生成——特征工程 tvm tensorflow原理——core层分析 模型演变 《深度学习推荐系统实战》笔记 keras 和 Estimator tensorflow分布式训练 分布式训练的一些问题 基于Volcano的弹性训练 图神经网络 pytorch弹性分布式训练 从混部到统一调度 从RNN到Attention pytorch分布式训练 CNN 《动手学深度学习》笔记 pytorch与线性回归 多活 volcano特性源码分析 推理服务 kubebuilder 学习 mpi 学习pytorch client-go学习 提高gpu 利用率 GPU与容器的结合 GPU入门 AI云平台梳理 tensorflow学习 tf-operator源码分析 k8s批处理调度/Job调度 喜马拉雅容器化实践 Kubernetes 实践 学习rpc BFF openkruise学习 可观察性和监控系统 基于Kubernetes选主及应用 《许式伟的架构课》笔记 Admission Controller 与 Admission Webhook 发布平台系统设计 k8s水平扩缩容 Scheduler如何给Node打分 Scheduler扩展 深入controller openkruise cloneset学习 controller-runtime源码分析 pv与pvc实现 csi学习 client-go informer源码分析 kubelet 组件分析 调度实践 Pod是如何被创建出来的? 《软件设计之美》笔记 mecha 架构学习 Kubernetes events学习及应用 CRI——kubelet与容器引擎之间的接口 资源调度泛谈 业务系统设计原则 grpc学习 元编程 以应用为中心 istio学习 下一代微服务Service Mesh 《实现领域驱动设计》笔记 概率论 serverless 泛谈 《架构整洁之道》笔记 处理复杂性 那些年追过的并发 服务器端编程 网络通信协议 架构大杂烩 如何学习架构 《反应式设计模式》笔记 项目的演化特点 反应式架构摸索 函数式编程的设计模式 服务化 ddd反模式——CRUD的败笔 研发效能平台 重新看面向对象设计 业务系统设计的一些体会 函数式编程 《左耳听风》笔记 业务程序猿眼中的微服务管理 DDD实践——CQRS 项目隔离——案例研究 《编程的本质》笔记 系统故障排查汇总及教训 平台支持类系统的几个点 代码腾挪的艺术 abtest 系统设计汇总 《从0开始学架构》笔记 初级权限系统设计 领域驱动理念 现有上传协议分析 移动网络下的文件上传要注意的几个问题 推送系统的几个基本问题 做配置中心要想好的几个基本问题 不同层面的异步 分层那些事儿 性能问题分析 用户认证问题 资源的分配与回收——池 消息/任务队列

标签

k8s设备管理 多类型负载协调员Koordinator controller-runtime细节分析 finops学习 kubevela多集群 kubevela中cue的应用 基于k8s的工作流 kubevela源码分析 容器和CPU那些事儿 数据集管理fluid 应用管理平台kubevela karmada支持crd 多集群管理 K8S YAML 资源清单管理方案 从混部到统一调度 volcano特性源码分析 kubebuilder 学习 client-go学习 tf-operator源码分析 k8s批处理调度/Job调度 喜马拉雅容器化实践 Kubernetes 实践 openkruise学习 基于Kubernetes选主及应用 Admission Controller 与 Admission Webhook k8s水平扩缩容 Scheduler如何给Node打分 Scheduler扩展 深入controller openkruise cloneset学习 controller-runtime源码分析 pv与pvc实现 csi学习 client-go informer源码分析 kubelet 组件分析 调度实践 Pod是如何被创建出来的? Kubernetes events学习及应用 CRI——kubelet与容器引擎之间的接口 资源调度泛谈 如何学习Kubernetes 以应用为中心 kubernetes operator kubernetes扩缩容 serverless 泛谈 什么是云原生 自定义CNI IPAM docker和k8s安全访问机制 Kubernetes监控 Kubernetes 控制器模型 Kubernetes资源调度——scheduler Kubernetes类型系统 Kubernetes源码分析——controller mananger Kubernetes源码分析——apiserver Kubernetes源码分析——kubelet Kubernetes介绍 Kubernetes源码分析——从kubectl开始 kubernetes yaml配置 CNI——容器网络是如何打通的 当我在说PaaS时,我在说什么 《深入剖析kubernetes》笔记 Kubernetes存储 访问Kubernetes上的Service Kubernetes副本管理 Kubernetes pod 组件
上下文记忆 agentic chat bert rerank微调 大模型推理tips LLM一些探索 Agent实践 LLM预训练 RAG向量检索与微调 LLM微调实践 RAG与知识图谱 大模型推理服务框架vLLM Agent Functon Calling LLamaIndex入门 Multi-Agent探索 LLM工作流编排 大模型推理服务框架 模型服务化(未完成) 大模型Post-Training 大模型训练 大模型推理 从Attention到Transformer 下一个平台Agent 激发LLM涌现——提示工程 LLM微调理论 大佬沉思 LLM外挂知识库 LLMOps 多模态LLM Transformers源码学习 LangChain源码学习 如何应用LLM 小鼠如何驾驭大象(LLM)? AutoML和AutoDL 特征平台 实时训练 tensorflow原理——python层分析 如何学习tensorflow 数据并行——allreduce 数据并行——ps 推荐系统embedding原理及实践 机器学习中的python调用c 机器学习训练框架概述 tensornet源码分析 大模型训练和推理 X的生成——特征工程 tvm tensorflow原理——core层分析 模型演变 《深度学习推荐系统实战》笔记 keras 和 Estimator tensorflow分布式训练 分布式训练的一些问题 基于Volcano的弹性训练 图神经网络 pytorch弹性分布式训练 从RNN到Attention pytorch分布式训练 CNN 《动手学深度学习》笔记 pytorch与线性回归 推理服务 mpi 学习pytorch 提高gpu 利用率 GPU与容器的结合 GPU入门 AI云平台梳理 tensorflow学习 kaggle泰坦尼克问题实践 神经网络模型优化 概率论 直觉上理解深度学习 如何学习机器学习 深度学习泛谈

《用户增长》笔记

2020年06月14日

简介

从开发视角看数据分析 精细化运营的一个典型案例。

什么叫用户增长?以终为始,利用一切资源让更多用户更高频的使用核心产品功能。

  1. 更多
  2. 更高频
  3. 核心产品功能,虽然大家平时经常说拉新、促活, 但如果用户在使用某个产品时没有体验到该产品的核心产品功能,这对产品而言绝对是一个损失,对用户而言也没有意义。

如何做用户增长?

用户增长的本质是通过数据驱动的迭代测试把主观认知变成客观认知(PS:从感觉有用变成数据上的成果),用测试的冗余性换取增长的确定性。如果不能实现快速迭代测试,是无法形成增长势能的。靠提需求、走产研、大排期,是不可能实现快速迭代测试的,必须要有一定的组织保障。

自然界的进化其实也是这样的,用基因变异的冗余性来换取进化的确定性。生物基因会发生各种突变,最终有利于生存的基因被遗传下来,从而促进生物的不断进化。要是没有这种冗余的突变,生物的进化一定不会像今天这样。要想用冗余性来对抗不确定性,就要多次尝试低概率的事儿,这是一个基本规律。

增长项目的类型

  1. 漏斗型增长,把用户在产品中的体验流程拆分为一个个细小的环节,通过优化每个环节的转化效率,提升用户整体的LTV
  2. 功能型增长,给产品增加某个功能,从来带来用户的增长和活跃。
  3. 策略型增长,以给用户发Push为例,让BI 分析下用户数据,形成一些用户标签或画像,给部分用户发某种类型的消息,不断测试,就能找到一部分特别适合推送某种消息的用户。还可以进一步把这一策略自动化,积累足够多的用户,足够多的个性化内容,再把两者配对。以红包车功能为例,功能只是一个外壳,真正带来无限可能和想象力的是实时调整的红包策略(什么场景、什么人拿的红包多),这是靠人力来实现迭代的,但这种迭代比改产品功能要容易很多。
  4. 整合型增长,线上与线下一起构成一个完整的体验闭环。

针对平常就爱分享的KOL用户,尤其是那些分享后还能带来很多用户点击的KOL用户,要提升他们的中奖概率。

用户增长基本方法论

在把用户拉进一个产品生态后,用户增长团队的主要工作就是提升用户LTV。如果该团队面对的业务是交易类的,那就是要想办法让用户多下订单,从而产生更多的GMV;如果面对的是广告变现类业务,那就要增加用户的在线时长和PV。

假设有一个电商平台“货最美”,有个叫小美的用户经常在上面买衣服,她对平台的价值贡献符合曲线1。货最美除了很多衣服,还有很多3C产品, 货最美的用户增长人员经过数据分析, 发现一旦用户在平台上发生过3C产品的购买行为,后续一般都会复购。也就是说,如果小美产生一次3C 购买行为, 小美对平台的价值贡献就会从价值曲线1跃迁到价值曲线2,让小美第一次购买3C产品就是一个典型的HVA。一般比较常见且比较有效地方式就是给小美发一张货最美3C品类的折扣券。此外,还可以物质激励与内容运营相结合,前期给小美推送一系列消息,例如“网上买东西不能被骗”(灌输识别3C正品的方式),“购买哪家在线商品不用担心售后”,这些前期内容的推送可以让小美不断在心中对货最美的3C产品产生认可。

一个收获:要能计算用户价值, 这样你就知道投入多少钱来拉新。如果你的app 有多个价值点,要能计算不同价值点的用户价值,这样你就知道投入多少钱来发放“优惠券”来引导用户从一个价值点走向另一个价值点。在决定优先引导用户产生哪个HVA时,需要在HVA价值、补贴成本、实现难易度之间做一个平衡。

对用户HVA的引导,其实质就是对用户生命周期的管理。既然是对用户整个生命周期的管理,那从新用户进入的第一天开始,就要对他们进行正向引导,直到他们离开我们的产品。例如在用户激活以后,我们是否有合适的新手护航策略来引导他们一步步沿着HVA链条往下走。

用慢思考来设计引导用户产生HVA的快思考产品逻辑:做各种用户增长的相关功能,其核心是引导用户产生我们期望的决策,从而产生我们期望的行动。所以我们需要对大脑的决策机制做深入了解,利用一些经典的决策理论来指导我们设计相应的增长逻辑。丹尼尔.卡尼曼在《思考,快与慢》一书中提出了广为认知的双系统理论,介绍了系统1和系统2的概念,系统1是快思考,它的运作是快速、无意识的,就像条件反射。系统2是慢思考,需要我们耗费大量脑力去专注思考,我们的大脑通常不倾向于用系统2来解决问题。从进化的角度看,为了生存繁衍,我们一般都会尽可能让自己处于低功耗状态。

很多时候,我们的大脑通过启发性思考,直接调用系统1,以减轻我们的认知负担,降低能量消耗。启发性思考的本质就是想办法让遇到的新问题符合大脑中存储的一些加工规则,一旦这些新问题找到匹配的加工规则,我们就能快速利用现有加工规则来处理已知数据并得出结论。如果找不到匹配的加工规则,我们就要调用系统2来思考。我们究竟调用系统1 还是系统2,是受信息呈现方式影响的。比如政府公布了购房贷款利息的减税政策,从购房者的角度说,这肯定是一件好事,但租房者不能享受这种减税优惠,相当于对“租房者的罚金”。“房屋抵押贷款应该享受税收优惠吗?” 比“应该让租房者缴纳更多赋税吗?” 更容易让大家认可这个政策。

如何才能设计出相关的页面和功能,让用户运用快思考流畅的按照我们设想的步骤一步步产生HVA呢?这就需要我们调动慢思考,设计信息呈现框架。有一些原则可以遵循

  1. 引导用户产生强烈情感,强烈的情感会遮蔽系统2
  2. 默认选项引导
  3. 先寸后尺
  4. 欲取先予——引发损失厌恶
  5. 创造认知引力场

如何搭建用户增长中台

很多时候,我们觉得只要能找到做增长的优秀人才,就能马上实现可观的增长。但实际上,用户增长是一个系统性工程,如果缺乏必要的基础能力,再厉害的增长专家也会到处被掣肘,难以发挥自己的能力

  1. AB测试
  2. 流量控制平台
  3. 激励券营销系统
  4. LTV计算跟踪系统

增长中台在获取平台用户的过程中,要遵守两个原则

  1. 如果能把钱给到用户,就尽量不要给渠道、流量平台或广告公司
  2. 如果能给主业优惠券,就尽量不要给红包等现金激励

曲哓音:增长的核心在于减少用户阻力,减少阻力的三个办法

  1. 自动完成
  2. 告诉用户他们会失去什么
  3. 聪明的整合

其它

增长那些事儿增长力=价值力* 价值传递效率 * 覆盖群体量*场景频度。价值决定了客户能够感知到的价值,它是增长的基础; 价值传递效率、覆盖群体量与场景频度决定了事物的增长空间,我们做增长和产品,不能站在自己的视角自High,我们往往做了一个自认为很有价值的产品(经过市场调研能覆盖大量的用户,场景也足够高频),但客户感觉不到产品的价值,这样的结果也是增长无力。

做决定的过程就是发散与收敛,一个决定做得好不好,关键看发散和收敛这两步做的质量。

  1. 发散:尽可能挖掘更多的情景和信息。我们可以从”痛点、痒点、爽点”这个方面进行发散,他们都可能是产品的机会点,都有可能成为对用户有价值的东西。
  2. 收敛:用有效的逻辑从发散的信息收敛出结论。
    1. 一是看受众规模,受众规模决定了一个事物能够发展的规模,比如综合性的电商网站的增长空间一定比垂直类的网站大。如果我们找到的机会点的受众规模很小,这样的可以大胆排除。
    2. 二看场景频度,:频度是判断一个机会点是否有增长空间的很重要的因素,比如女装的市场要比男装大得多,是因为女性换衣服的频率要大得多,大家去商场里也可以关注下,女装的店也多很多。做增长我们都要关注LTV(Long Time Value),当LTV大于获客成本时,这个产品才可能做下去。
    3. 三反向验证:反向验证就是我们将收剑得到的结论去找用户验证,问下他们在生活中、工作中是否有这样的问题,如果有对应的产品来解决他们的这些问题,他们感觉如何。

当我们通过前面发散、收剑、反向验证找到了一些可能的价值点后,我们开始进行产品化,我们开发后会推向市场,拿到市场上去验证,但如果确认一个产品是否成功呢,我们需要有个指标来度量,比如APP的日活、成交的GMV,定单量。一个业务发展过程中会有多个部门相互协同,不同的部门的自己的关注的指标,有时不同指标会相互打架,但整个业务需要一个北极星指标(唯一的关键性)来指引,否则大家会迷失在错综复杂的指标里。值得一提的北极星不是永远不变的,这个会随着业务的发展会发生变化的。

我们要衡量产品的一个变动对于业务的影响,需要有一个有效的度量方式,这个绝对不能主观判断,人经常会高估自己的主观判断,用《原则》的作者,桥水基金创始人达里欧的话来说:“做一个无比现实的人”。最为科学的方式就是通过实验的方式来进行。

小的增长机会靠上面的方法论可以找到,但要找到大的增长机会,需要提升知识与认识结构,看历史,所谓借古鉴今。要得到更快的增长需要从组织能力、行业创新、生态赋能等方面来做增长,要实现产品的增长,需要有三级火箭

  1. 搭建高频的头部流量,第一级火箭是高频的应用,三级火箭是依次递推,一定是高频推低频。这一级火箭只是助推器,自身可以不考虑变现,它是为后面的商业化场景的落地打前锋的,现实的互联网有很多这样的例子。
  2. 沉淀用户的商业场景,这个商业化场景需要实现用户的价值,客户留下来是因为客户对这个场景有依赖,或者说这个依赖的替代成本比较高,所以我们,否则用户无法沉淀下来,后面就不可能有构建商业的闭环。
  3. 实现商业的闭环。

阿里国际站用户增长技术探索与实践 未读。对比了B端和C端增长的异同。