用户画像是指根据用户的属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。 通俗说就是给用户打标签,而标签是通过对用户信息分析而来的高度精炼的特征标识。通过打标签可以利用一些高度概括、容易理解的特征来描述用户,可以让人更容易理解用户,并且可以方便计算机处理。
标签的分类方法比较多样,可以按标签的产出方式分,也可以按实际业务分,也可以组合起来分类。 按产出方式来分的话: 1)事实统计类标签 例如近7日活跃时长、近7日活跃次数等等 2)事实规则类标签 例如消费活跃:近30天交易次数>=2 3)模型类标签 例如RFM模型,AARRR模型 4)算法类标签 例如根据用户购买的商品判断其购物性别、对某商品的偏好程度 按实际业务来分的话: 1)用户属性标签 2)用户消费标签 3)用户行为标签 4)风险控制标签 。。。
在互联网、电商领域用户画像常用来作为精准营销、推荐系统的基础性工作,其作用总体包括: 1)精准营销:根据历史用户特征,分析产品的潜在用户和用户的潜在需求,针对特定群体,利用短信、邮件等方式进行营销,提升营销效率和营销效果。 2)用户统计:根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用户数量、分布;分析不同用户画像群体的分布特征。 3)数据挖掘:以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,提升服务精准度。 4)服务产品:对产品进行用户画像,对产品进行受众分析,更透彻地理解用户使用产品的心理动机和行为习惯,完善产品运营,提升服务质量。 5)行业报告&用户研究:通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析 6)ABtest:用于创建ABtest实验,和实验效果分析
用户画像必须从实际业务场景出发,解决实际的业务问题,之所以进行用户画像,要么是获取新用户,要么是提升用户体验、或者挽回流失用户等具有明确的业务目标。
数据源的数据是标签构建的最底层,来源于各个业务端的数据,主要有离线和实时两大数据来源,一般的大数据架构会有流批处理的链路分别处理,也有流批一体的架构,数据产品可不重点关注。
数据层开始数据产品会比较关注,数据产品在设计标签时需要关注标签的生产在数据仓库的流转口径,特别是在定义原子标签的时候,需要深入理解业务,了解用户的来源,状态,订单的渠道,线上线下,订单状态等等。
标签层一般的,会按照上面说的实际业务分类进行标签的建设,一般构建原子标签就足够了,在服务层的标签工厂可以个性化的创建新的派生标签。
服务层主要包含两块,一个是画像平台的应用,一个是画像数据的统一API服务,给前台的营销系统、广告系统等提供标签分群数据支持。
以上是用户画像系统的基础概念,下一节我们了解下画像系统的难点之一:如何构建oneid?