美高梅4858mgm 1(设计台词)游戏玩家:我真不是拿这个钱去氪金的。图片来源:Pixabay

本月活跃天数(登陆天数)

集成模型的算法

硅工作室的研究人员阿非利加•佩里亚涅斯(África
Periáñez)把这个算法称为“集成”方法。因为不同于基于单个算法研发出的模型,这个算法模型是建立在多个学习算法之上的。它通过研究更多的相关算法与替代模型,来提高预测的准确性。“每次我们运行这个模型的时候,实际上都是在运行1000个单独的子模型。每个子模型的初始设定和重点关注的变量都不同。”佩里亚涅斯说。

研究团队还将生存分析算法(survival analysis
algorithm)放在了每个子模型中。这样的模型可以在医学研究中预测患者在特定情况下的生存曲线,也可以在生物学研究中用来观察体内细胞的表现。

这是首次将存活分析算法与集成模型在游戏产业内结合起来的研究。在应用中,它可以准确预测出玩家在哪天、哪个游戏阶段会爬墙走人,以及原因是什么。

数据指标理解:影响流失的普片判断有:在线活跃、充值或消费活跃、还有玩家账号一些属性(如果细分还有副本的活跃度,某些活动的活跃度,或者社交的数据等)。本文在做流失预测模型之前做以下数据准备:

为了尽可能地留住“鲸”,日本一家游戏公司硅工作室(Silicon
Studio)研发出了一种算法,来预测用户流失状况,以延长高氪玩家游戏生命。该工作室基于这种算法,针对高氪玩家进行了个性化推送提示。这一举动降低了5%的高氪玩家流失率,增加了15%的销售额。

附加一个12月份付费用户在1月份流失的注册时间分布图,大家看有没有发现什么有意思的东西~
美高梅4858mgm 2

算法商用?

现在,硅工作室打算把这个模型作为服务商用。这个算法可以自动适应不同的游戏和数据。

手游的出现改变了游戏产业。商家会囤积用户数据,包括用户操作、关联、氪金情况等等。他们开始明白需要去建立一个数据库为基础的模型,让他们可以了解玩家的特点和喜好、预测玩家的反应。

硅工作室表示,一些大公司已经开始这样做了,但是中小型的工作室没有那么多的资源。因此,这个模型也许可以作为预测工具为这些小公司服务。现在,他们已经与日本和欧洲的一些公司开展了合作。(编辑:锦衣Reload)

题图来源:Pixabay

每活跃天登陆次数

手游玩家的另一个特点是,大部分人不会在游戏里花一分钱。他们说爬墙就爬墙,想卸载就卸载。对商家来说,这些人毫无忠诚度可言。

本月元宝活跃(元宝交易次数)

(vicko238/编译,锦衣Reload、Ent/校)频繁更换游戏,是手游玩家的一个特点。

每活跃天登陆时长

在自己的游戏上做测试

这个模型首先在硅工作室自己旗下的RPG对战手游“伊诗塔亚年代”(Age of
Ishtaria)上进行了测试。在选定2014年10月至2016年2月间的数据后,150万玩家的数据被投入模型,分析出了玩家生存曲线与影响用户流失的相关因素。

研究将“流失”定义为连续10天不登录游戏。根据数据的分析,如果高氪玩家10天都没上线,可能就再也不会登录。即使再次登录,这些玩家回归之后的的氪金量也仅占高氪玩家全部付费额的1.4%。

美高梅4858mgm 3不付费玩家(红)、付费玩家(绿)和高氪玩家(蓝)的生存曲线。图片来源:Periáñez
et al.

研究计算出的生存曲线表示,高氪玩家十分值得挽留,他们不仅氪得多,玩的时间也更长。不管付费多少,整体上氪了金的用户比不付费用户的游戏生命更长。80%的不付费玩家在游戏的第一天就会跑路。作为对比的是,只有20%的高氪玩家在游戏100开始天后会流失。

影响用户流失的重要变量也被列出来。模型考虑的变量包括一些操作行为以及通过量化得出的玩家专注度、忠诚度、游戏强度等等。研究使用了两种不同的算法,一种表示排在前三重要的因素为:最后一次氪金额度、最后一次氪金时间、游戏等级;另一种表示,最初15周游戏平均时长、游戏时间、游戏等级最为重要。

美高梅4858mgm 4用户流失的重要因素。图片来源:Periáñez
et al.

此外,模型还可以预测出随着时间变化,个体玩家的“存活”概率。如果这个概率低于50%,就可能有流失风险,意味着游戏方需要采取行动进一步吸引用户。

美高梅4858mgm 5模型计算出的个体玩家“存活”曲线。图片来源:Periáñez
et al.

“在玩家登录游戏的第一天起,我们就知道这个玩家大概会玩多久、玩到哪一级别。当然,我们最主要也是最重要的研究目的是延长玩家的游戏生命,并让他们尽可能多地氪金。另外,了解用户的需要,设计更有趣的、更刺激游戏也很重要。”研究者说。

选择字段level
OR 注册时间,交叠字段颜色选择我们通过C5.0预测出来的“$C-下月登陆流失”字段,点击运行。

但有一小部分人可不一样,他们就是“高氪玩家”,也被游戏产业称为“鲸”。这种宝贵存在仅占全部玩家的0.15%,付费玩家的10%。而就是这么一点人,能创造氪金总量的50%。

我们再用C5.0模型进一步进行流失分析,添加“直方图”节点:

下月登陆流失

本月登陆总时长

 

接下来就是对一些多余字段的过滤还有数据的清理(如包括空值的数据,或者不合理数据,如活跃度>1为不合理数据)。

下月充值总额

原文地址:

 

美高梅4858mgm 6

 

美高梅4858mgm 7

 

 

 

本月登陆次数

②   有关付费用户的月付费流失(付费用户的月登陆流失定义:本月充值的用户在下个月不再有登陆行为。付费用户的月付费流失:本月充值的用户在下个月不在有付费行为。但有可能还有登陆行为,这部分用户被称为沉默付费用户。)

每活跃天绑定铜币交易次数

美高梅4858mgm 8
可以看到每一个变量的重要性,而“活跃度”这个变量的重要性是最高的。(这也说明了一些衍生字段对后期分析的重要性)

接下来再添加“分析”节点发现准确率达到85%,比贝叶斯要稍微好点。(有一些情况对决策树使用boosting方法或者进行截枝修剪严重性会得到更好的效果)

 

 

打开“选择”节点,模式选择“抛弃”,条件写上一些需要清除的数据,点击确定。

美高梅4858mgm 9

首先声明,该文章是石头哥的最新文章,力作之一。石头哥是游戏数据挖掘与分析QQ群的群主之一,该文出自他手,在此予以转发,望从事游戏数据分析的各位可以从中学到一二。本来我的博客想来很少转文章的,不过在此,这样的好文必须转起来。

玩家ID

贝叶斯这里运用了三种方法:TAN、Markov、Markov_FS

玩家角色名

等级

下月登陆天数