用户画像构建流程:
基础数据收集:网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据
行为建模:文本挖掘、自然语言处理、机器学习、预测算法、聚类算法
构建画像:基本属性、购买能力、行为特征、兴趣爱好、心理特征、社交网络
1、数据收集与分析
构建用户画像是为了将用户信息还原,构建一个用户数据模型。因此这些数据是基于真实的用户数据。
用户数据可以大致分为网络行为数据、服务内行为数据、用户内容偏好数据、用户交易数据这四类。
网络行为数据:活跃人数、页面浏览量、访问时长、激活率、外部触点、社交数据等
服务内行为数据:浏览路径、页面停留时间、访问深度、页面浏览次数等
用户内容偏好数据:浏览/收藏内容、评论内容、互动内容、生活形态偏好、品牌偏好等用户交易数据(交易类服务):贡献率、客单价、连带率、回头率、流失率等
当然,收集到的数据不会是100%准确的,都具有不确定性,这就需要在后面的阶段中建模来再判断,比如某用户在性别一栏填的男,但通过其行为偏好可判断其性别为“女”的概率为80%。
2、数据建模
该阶段是对上阶段收集到数据的处理,进行行为建模,以抽象出用户的标签,这个阶段注重的应是大概率事件,通过数学算法模型尽可能地排除用户的偶然行为。
这时也要用到机器学习,对用户的行为、偏好进行猜测,好比一个 y=kx+b 的算法,X 代表已知信息,Y 是用户偏好,通过不断的精确k和b来精确Y。
在这个阶段,需要通过定性与定量相结合的研究方法来建立很多模型来为每个用户打上标签以及对应标签的权重。
定性化研究方法就是确定事物的性质,是描述性的;定量化研究方法就是确定对象数量特征、数量关系和数量变化,是可量化的。
3、构建用户画像的三个主要步骤
1)把用户的基本属性(年龄、性别、地域)、购买能力、行为特征、兴趣爱好、心理特征、社交网络大致地标签化。
2)当一切数据标签化并赋予权重后,即可根据构建用户画像的目的来搭建用户画像基本模型了。
3)关于“标签化”,一般采用多级标签、多级分类。
4、数据可视化分析
如图所示,这是把用户画像真正利用起来的一步,在此步骤中一般是针对群体的分析,比如可以根据用户价值来细分出核心用户、评估某一群体的潜在价值空间,以做出针对性的运营。