【卡牌建模计划】生灵身材与费用相关数据统计及趋势预测
修改于2022/07/18221 浏览综合
五千字警告!
然而这个东西比想象中会复杂的多,有争议的地方也不少,单用一次帖子很难写完,大家也会看得很累(真的会看吗?),所以我决定分成四次写完,目前工作已大体完成,还有一些琐碎的细节尚待完善,下次更新预计不会等太久(真的不会鸽吗?)。
这一次的水帖我们先不考虑如何进行标准身材的评估,还是像上一期一样,做一些准备工作。
既然我们的目的是要研究:
A系B费C类别生灵的标准白板应该是D攻E血。
那么,在进入到评估和分析之前,我们理应对现有生灵卡牌的攻击、血量对其费用与系别进行一个相应统计,观察其变化趋势。
具体工作就是统计某系所有生灵的攻击、血量,按费分类进行数据分析,画出散点图并尝试拟合观察趋势。
首先是定义与假设部分:
1. 生灵卡价值=身材价值+效果价值。身材价值就是生灵卡的攻击和血量按照一定的攻血转换规则算出的白板身材价值,效果价值则是生灵卡的进场、离场、技能等特殊效果所能发挥的价值,二者量化后加和构成该生灵卡的总战力。简单来说就是某生灵的价值就是其白板身材的价值与其牌面描述的价值的加和。
2. 某费生灵卡的平均效果价值与身材价值的比值不变。即整体来看,如1费生灵平均总价值为10,8点用在身材上,2点用在牌面描述上,而2费生灵平均总价值为20,16点用在身材上,4点用在牌面描述上。虽然具体到每个生灵上各有千秋,但以某费生灵卡的整体来看需大体如此。这个平均总价值本身不一定与费用线性相关(根据计算方法不同会不一样),但其所构成的身材和牌面描述的价值占比要一致(后续证明并不一致,从趋势表现来看六费以上牌面描述价值占比有所提升,六费以下提升不明显)。
3. 每张参与统计的生灵卡牌视为强度一致。虽然实际并非如此,但是因为真正能做到强度接近的卡牌比较少,不一定具备统计学意义,也很难统一标准进行规范化处理,所以只能笼统将其归至强度一致。这会导致在精确拟合或者分析规律的时候具体数值有一定偏差,但是大致趋势还是不会变动的。也就是本文所得结论意义将会定性程度大于定量程度。
这里我们先不介绍数据源的组成,先来看一下我们所需要的统计数据的变量及实际意义,以X系Y费生灵的攻击数据为例:
均值——所统计生灵的平均攻击值,主要用来分析不同费用或是不同系别之间的攻击值差异和一般情况。
中值——所统计生灵的攻击中位数,和均值用处差不多,只是相对来说受极端值的影响性较小,主要配合标准差用于验证数据源中是否有极端数据,多数情况下其值和趋势与均值一致。
众数——所统计生灵中出现最多的攻击值,定位和中值类似,也是排除极端值影响,反应数据源攻击的一般水平。攻击值还好,血量值、总价值会因为统计数据较少而值变动较多,众数受个例影响严重,所以后续弃用了。
最大值——所统计生灵中出现的攻击最大值,攻血的一点差异就会在这里体现,去除牌面负面效果生灵(如夜游神、金灵圣母)后,所统计生灵的攻击最大值近似于标准身材生灵的攻击值(中低费),也就是说这里的攻击最大值按费拟合,基本就可以等同于标准身材的生灵的攻击增长趋势。
这里为什么说攻血差异会在这里有体现,我猜测是为了限制快攻和环境降速,中低费生灵中少有无负面效果还会攻击高于标准身材的生灵,一般都是亏攻击换血或者换牌面效果,很少有亏血量来换攻击或牌面效果的。这也就导致攻击的最大值近似于标准身材生灵攻击值,但血量的最大值与标准身材血量值并不近似。用一种不太恰当但比较好理解的解释来说,金系二费生灵当中剔除负面效果生灵【巨灵神】,攻击最大值是3攻的【七仙女】等,标准身材与【七仙女】的差距可以理解为用一定的血量换了“己方主角受到的攻击伤害-3”,但是于攻击值并未有增加。但是金系二费生灵血量最高值为16血的【善财童子】,它少了的1攻击不仅用于换了牌面效果的0费技能,还可能换了点血量上的提升,毕竟有负面效果的【巨灵神】也就16血,标准身材血量只会比这个低,所以血量最大值只能看个热闹,真要分析趋势还是要关注均值和中值。
(这里说不太恰当的原因是因为攻击和血量都不带小数,只有达到了整数需求才能使得其有实际提升,攻击量值低而血量量值高,本质上其实是因为血量换的攻击可能未到阈值引发其变化被迫去计算为换了牌面效果,不过用上面那种理解方式也行)
最小值——所统计生灵中出现的攻击最小值,其实没啥用,总会有奇葩的个例,也没什么特殊的意义,毕竟不像最大值能近似标准身材,所以后续弃用了。
方差和标准差——都是为了衡量所统计生灵中攻击值的波动大小,但因为方差与检验值相差过大,所以后续弃用了,只用标准差进行研究,标准差大的数据较为离散,反之集中。
那么面向上述统计需求,我们也能得出来所要的数据源的构成了:
1. 按金木水火土五个系分别统计,按统计值与费用进行作图及分析。
2. 为了使攻击最大值曲线更好近似于标准身材攻击曲线,剔除牌面为负面效果和攻击为“?”的生灵。
很简单对吧?让我们再来看一下攻击方面的成果:

(这里因为代码问题,每个系都少统计了最高费的数据,比如水系9费杨戬、土系9费通天教主,不过高费生灵数据太少,不太具备统计学意义,所以也就没改了)
先说现象和一些数据上存在的缺陷:
金木水三系应该是最能反映攻击趋势的三幅图,使用三次函数拟合曲线表示趋势也基本一致,不管是均值还是最大值曲线,都算是两头增长慢中间快。
土系则稍微复杂一些,最大值曲线符合两头慢中间快,但是均值曲线却整体接近于线性,在高费则略有扬升。猜测其原因是一费生灵当中我剔除了【罗刹】、【骷髅仙】、【赤身鬼使】这三个身材好但有负面效果的生灵,剔除数据量过多,所以导致一费均值稍低了一些。高费上则是因为数据量过少,7费生灵只有三个,受个例影响严重(其他系也是如此),所以趋势略有波动。
火系则是因为6费生灵剔除【赵公明】、【廉颇】、【燕赤霞·稀】这几个攻击为“?”的生灵,因数据量过少,只有四个,其中有三个是【烛龙】、【蚩尤】、【玉清真王】这种身材较差的生灵。再加上2费有【神雕】这种疑似相比标准身材攻高血少的生灵,导致最大值曲线拟合不佳。均值曲线也因1费剔除了【天煞星】、【闪电貂】使得1费生灵攻击均值较低,低费趋势显得增长较快。
再说说结论吧:
1. 整体来看五费及以下的攻击最大值对于标准身材攻击的近似情况较为符合预期,六费及以上可能因为实际卡牌在高费更注重牌面效果或是血量,最大攻击值出现增长变慢甚至有下降的现象,而从均值、中值曲线的变化趋势来看也确实如此,只是没到下降的程度。
2. 攻击增长趋势整体来看是一到二费及五费以上生灵增长缓慢,二费到五费增长较快且加速度稳定。
那么让我们更进一步,只关注于二到五费这些看上去比较有规律的散点重新用一次函数拟合一下。同时为了图标更直观,我们将五个系的曲线放在一个图里,并且由于中值和均值曲线差不多,暂时弃用中值曲线,作图如下:

怎么说呢,从图中来看最大值曲线金水土都是老老实实的y=x+1,也就是二费3攻,一费涨1攻,而木系二到四费基本正常,五费是因为【刺藤花妖】变成了7攻。这里可能是两个原因,第一是木系本身的特性导致其生灵在高费就偏重攻击一些,二是这里的7攻可能是用血量换的,毕竟【刺藤花妖】本身就只有15血,这个血量在五费怪中是明显偏低的。然后火系最大值曲线稍显奇怪,二费剔除【神雕】之后其实主流还是3攻,所以二费4攻的原因也和木系五费7攻原因大差不差。五费的原因差不多就是反过来,可能整体更注重牌面效果一些。但是从均值曲线来看,各系都没有特别明显的差异,唯一略显突兀的就是金系的均值曲线,二三费的均值相较于其他生灵曲线更低,四费基本一致,而五费又更高了起来。
因此,我们总结结论如下:
1. 各系生灵标准身材攻击在二到五费基本可视为一费涨一攻。
2. 各系生灵的实际身材攻击在二到五费基本没有太大差异,只有金系二三费攻击略低,五费攻击略高一些。但是实际金系低费生灵当中有诸如【蟠桃仙女】、【金甲校尉】、【黄角大仙】这种牌面效果当中有攻击加成的生灵,所以其实低费生灵攻击质量与其他各系差别不大,而高费生灵应该是实打实的攻击较高一些,这也与我们对金系生灵的一般印象相符。
啊对了,这里忘了标准差的曲线,意义不是很大,也就是看个热闹吧:

这里标准差越低说明该费该系生灵攻击值波动越小,也就是相对差距越小,数值越接近,比较有意思的事金土两系的攻击标准差稳定较低,说直白些就是没有什么特别瘸腿、攻击较低的生灵,其他三系或多或少都有些波动,整体是随着费用增加而增加,也很好理解,不恰当地解释来说,费用越高标准攻击越高,很多生灵就会选择多卖点攻击换牌面效果,这也就导致标准差变大。
对了,这里我们顺便验证一下之前的第二条假设的一部分吧,也就是那个牌面描述效果在平均总价值中的占比,这里我们就先只看攻击均值与最大值之间的比值,后续再结合血量来具体分析:

怎么说呢,很意料之外的结果,但好像又是情理之中。
首先剔除火系6费这个异常值,原因和之前一样,删除了多个攻击为“?”的生灵后受极端值影响严重,还有火系2费,我暂时将最大攻击降到了3,也是因为【神雕】的4攻会使得这里火系攻击均极比明显偏低。
从攻击的均极比整体趋势来看,相比于一费,二费攻击均值会逐渐趋于标准攻击(用人话来说就是一二费标准攻击都是3,但一费3攻比较少见,而2费3攻多),然后开始一直到四费都会呈现下降的趋势,四费这个节点更是做到了极为诡异的五系均极比极其接近现象,后续则又是逐渐走高。
放结论:
1. 生灵攻击在生灵总价值中的占比在一到二费有所上升,之后一直到四费都是有所下降的,四费之后整体又是上升态势。(人话来说就是四费和一费生灵更偏重牌面效果,二费和高费更偏重标准身材的攻击)
2. 这个图只能一定程度上反应攻击与牌面效果随费用之间的差异,并不能完全验证假设2,还需后续结合血量方面的均极比图进行分析。
攻击这一方面基本就告一段落了,让我们再来分析一下血量方面的情况吧,首先还是各系生灵血量单独按费统计的图:

前面说过,因为存在亏攻击来换血的普遍现象,所以血量最大值这里也就看个热闹,没有什么具体的意义。后续会将不符合标准攻击的生灵剔除再做血量最大值的统计,但是因为这个数据量比较少,所以会结合以后的不同方法的标准身材模型一起分析,这里我们主要来关注血量增长趋势就好(其实根本就是懒得做剔除=_=)。
现象很简单,金木水三系血量均值增长速度都是先快后缓再变快,而且导数最小,也就是增长速度最慢的点不约而同地都是四费。至于火系血量均值增长则更偏向于线性,土系则偏向于对数函数,先快后慢的增长。
仔细想想看,是不是之前见过一个与其可以说是几乎完全相反的图和结论呢?

美妙的对称出现了。
那么,我们可以总结出以下结论:
1. 不剔除攻击低于标准值的血量最大值统计可以视作无意义。
2. 血量均值随费用的整体增长趋势可以说是和攻击均值完全相反,一二三费血量增长速度较快,四五六费稍微变缓,高费则持续走高,两头快中间慢。火系则是与其攻击一样基本呈线性,土系略有特殊但也勉强对得上。
因为血量最大值目前来说实际意义不大,所以就只针对均值曲线进行各系之间的一个横向比较(后续也没有均极比的图了):

嘶……好像看不出来啥,略有差异但是差距不大,硬要说的话就是五费以下生灵血量均值木=金>火>水=土,高费上受个例影响严重,就不再分析了。
最后是标准差:

具体含义之前在攻击那里解释过了,现象也基本一致。就是四费这里略有奇怪,金木土的标准差在这里忽然都降下来了,也就是说四费这三系生灵的血量波动不大。
总结一下这将近五千字的内容吧:
1. 攻击增长趋势整体来看是一到二费及五费以上生灵增长缓慢,二费到五费增长较快且加速度稳定。
2. 血量均值随费用的整体增长趋势和攻击均值基本相反,一二三费血量增长速度较快,四五六费稍微变缓,高费则持续走高,两头快中间慢。
3. 中低费情况下攻击最大值曲线可基本模拟标准身材攻击值,但仍需后续研究论证,所以这里尚未做剔除标准攻击值后血量最大值、均值曲线的拟合。
4. 四费生灵作为一个攻击均值增长幅度一般,均极比较低,血量增长速度又是最慢的点,但实战中却显得极为热门。推测一是因为四费生灵更看重牌面效果,二是四法力本身就很关键,属于能进能退的点,快攻上四费不吃百鬼,高修上四费能留截心、触发(个人猜测,有待后续验证)。
后续展望:
预计下一篇文章是永恒天国的生灵标准身材价值的量化方法,再下一篇是空之落的,再下一篇是这两种方法的相关性分析以及一些零散想法的总结,并补充剔除这两种方法推出来的标准身材攻击值的生灵血量均值、最大值曲线拟合。然后生灵身材建模就可以告一段落了。
嗯,八月底前写完就算成功!
那么,本次水贴就先到这里了,后会有期(真的吗?)。