关于某个不公正的Gal综合评分机制的架构初探
评分机制,一般是用于衡量同类候选个体质量的一种评价性体系。作为信息时代的产物,公众评分机制是当代生活中影响最大、范围最广的一种评分机制,它从理论上能够直接反映受评者的综合素质等诸多因素,但随着公众生活的发展,现代公众评分机制“失灵”等现象已经屡见不鲜。
因为这是个非常具体的问题,所以我们也不扯那么多理论上的东西了,如果论述一大堆废话,好像只是为了包装一个所谓的理论体系出来,那就一点实际意义都没有了。
只有一点需要提一下,这点也是本文所尝试提出的这种综合性评分机制的指导思想:在不考虑实际形成的个人倾向的情况下,评价主要受三者影响:受评者自身素质(这是废话)、自上而下的评价社会学;自下而上的评价心理学。而这三者究竟分别占到多少的权重,则是由评价人自己的特点所决定的。也正是这样的一个基本特性,划分出了个人评测和综合评分的泾渭分明的一条分界线。
然后就进入正题,简单来说,galgame即所谓“美少女游戏”,但是实际上我们并不需要一个比较明确的定义,也很难划分出一条明确的界限。
把GAL作为一个单独的评价对象的时候,它具有哪些相对比较明显和特殊性的特点呢?
首先,gal的基础是它的剧情性,这种剧情性在大多数情况下以文本为主要载体,因此它在整体上具备很好的基础。这使得gal的整体评分能够有一个基调。
其次,由于各种各样的原因,gal相较于其他完整的文艺作品,如:小说、动画、戏剧等,在保持联系性的前提下,具有很强的内部割裂性和独立性。与动画、戏剧、电影等相比,gal是主动接受的,而这些题材是受众被动接受的,这就使得受众对这些作品的内容接受不得不在时间上呈现出一致性,因此难以在接受时主动进行分割。而与小说相比,gal则额外具有文字以外的其他表现手法,因此它的接受难度既在纵向上低又在横向上拔高。这使得gal的细项评分成为可能。
最后,gal作为moe要素和故事性结合的特征以及它在受众上的现实,决定了双重评分机制的可行性。
说了这么多,可能是有点冗长了,但这确实在某种意义上来说,已经是需要交待的最低数量了。
现在开始整体论述这个评分机制,并且边描述边解释。
我们先以具体运行的顺序来讲,这样会比较直观。
那么我们现在开始评了!
假定我们以某个作品为例。
现在我们就成了一个比较任性的用户,开始打分。作为一个用户,我们有七个分数可打:
系统、剧情、人设、画面、配乐、CV和总分(这个总分在后面视作观感分处理,与综合分计算机制不同)。
部分作品可能增加一项游戏性指标。部分作品可能无CV。
我们不再赘述这几项分别代表什么,也不会去说每项的评分标准。直接开始!
系统:8 / 4 这里给出两个打分,前者是比较有打分意识以及比较云的玩家大概率会打出的分数,因为这作确实系统非常新颖且有意思,而后者则是在游玩过程中没看攻略因而受到游戏摧残因而迁怒到系统打出的分数。我们在此假定这是一个容易出现两极分化的作品。
剧情:4 / 8 我们假定这作的剧情原案至少不能算差,应该有个7~8分的水准,但是通过这种游戏系统和自我感动式的谜语设计和逻辑上的严重落差,最终给玩家留下的印象也就最多给5分了。甚至有人给3分及以下都是可以理解的。假如把白开水当作6分的话。本作毫无疑问是典型的负分,而它与通常的负分作品不同的是,它并不是因为剧情本身负分的,而是因为表现的形式。如果这不是评分而是个人鉴赏的话,可能我们还能把剧情本身从剧情中摘除,在给一个比较高的剧情分和系统分前提下,以一个非常低的演出|表现分数来说明这种情况。但对于整体用户评分来说,这种做法是不现实且不合理的。
正因为这种原因,我们在评分中根本就不设演出这一条,因为用户在接受时,其他任何项目素质都是可以割裂的,唯有演出是不可割裂的。且演出的结果是直接影响用户对剧情(大)人设(中)画面(小)的看法的,所以它已经被包含在这些评分项里。
人设:5~8 受主观影响较大
画面:5~8 受主观影响较大
配乐:6~7 通常不会有太差或是太好的作品
CV: 7~9 通常不会有太差,偶尔会有很好的作品,但整体质量有保障
当然,某些作品肉眼可见的经费不足问题也必然对质量有所影响,但一个评分机制是不可能去考虑这些厂商的难处的,如果是个人鉴赏还可以考虑。
总分:4 / 8 本作容易出现两极分化的评价趋势,而当这种评价趋势产生之后,想要消除是不合理且不可能的。
到这里,用户需要做的所有事情就结束了,剩下的事情就是对这些结果进行处理,最终得出用户应该看到的东西了。
一些大部分评分通用的基本原则如评价人数等就不再赘述了。
各细项的分数没什么可说的,直接取平均就行了。
首先是“印象分”,这是一个只基于上述用户打分中的总分的分数。是评分社会学占据主导地位的分数。计分方式也是直接采取平均的方法。
这个分数的具体值波动,在没有形成之前是没有办法确定的,因为在评分过程中,用户可以评各项细分之后再评总分,也可以直接评总分。而大多数没有游玩完毕的用户、以及甚至没有玩过的云用户,大概率只会打总分。换句话说,这个分数其实是一个“观感分”,它的具体取值区间是一定会受用户群体的特征影响的,所以不应该去预先地设置一些复杂的评分转换机制,它的效应是双向,并且在动态生成的。在这个基础上,逐渐会形成一个比较稳定的评分氛围,而这个评分氛围本身并没有好坏之分。
对作品不够了解而评价,理论上是一种不当的行为,但是它又是一种合理而现实的行为,正因为如此,评价的社会学意义才显得比较重要。因此,本“印象分”能够自上而下地反映出该作品的整体“风评”大约在哪个阶段之中。
其次是“综合素质”,这是一个基于用户给gal打出的各项细分计算而出的一个“质量分”。这个评分在理论上是客观性最强的,也就是相对比较“婆罗门”的分。
计算流程如下:
首先,在该作品的各项平均分中找出最高平均分项:
(1)如果该项是剧情且在9以上,给予此项0.8的权重,剩余0.2的权重由其他各项均分。这是基于gal的核心和基础是在它的剧情性上的结果。而为什么能给予如此大的权重,是基于这里的剧情分实际上已经是一个比较综合的分数,它已经是“故事表现的结果”分而不是故事本身的分数,在这种情况下,大概率是不会出现“啊,这个游戏剧情非常好,但是有那一项非常差的情况的。”因为这个剧情分,是已经经过玩家筛选的外在的剧情表现,而一部作品外在的整体剧情表现在观众心中达到一个非常高的水平之后,它就不可能有真正意义上的负分点,最多就是有零分点,比如没有CV,画面一般,甚至可以没有配乐,成为真正意义上的画面和文字单独结合的视觉小说。因为负分点一定会影响玩家对剧情的整体评价,而零分点大概率不会。而反人类、NTR之类的道德问题,我们不去考虑,交给玩家自己。
(2)如果该项是人设/画面且在9分以上,给予此项0.5的权重,给予剧情0.2的权重,剩余0.3由其他各项均分。这就是常见的“为了xxx而玩”。这是对一个作品在单纯“技法”上的认可。
(3)如果该项是游戏性且在9分以上,给予此项0.9的权重,剩余0.1由其他各项均分。这个看似很不合理,但实际上又非常合理。不是,到这个地步还能算毛线的gal啊!!!!9分以上游戏性是什么概念!大概率就兰斯10、神采等极少数作品能去尝试一下吧,到这个地步已经脱离gal的领域了。
(4)如果该项是其他且在9分以上,给予此项0.3的权重,给予剧情0.3的权重,剩余0.4由其他各项均分。
(5)如果该项是剧情且在9分以下,给予剧情0.5的权重,其余0.5由其他各项均分。
(6)如果该项不是剧情且在9分一下,给予此项0.2的权重,给予剧情0.3的权重,其余0.5由其他各项均分。
总的来说,这个“综合分”是主要基于受众自身素质而给出的评分,它最能反映一部作品的综合水平。
最后是梯度分,这是一个以评价心理学占据主导的梯度,这个分数大概率能反映作品的“游戏体验”分。
梯度制自上而下从EX、T0、T1、T2、T3到Tn。具体划分机制如下:
首先确定初始梯度:以细项评分中的最高分为基准,具体规则如下:
(1)有三项以上的分数在9以上且其中有一项在9.5以上,以EX为初始梯度。
(2)有一项分数在9以上,以T0为初始梯度。
(3)8.5~9,T1
(4)8~8.5,T2
(5)如果没有任何一项在8分以上,则直接给予Tn评价,因为单项8分真的不难上。
确定初始梯度后,进行降级制,具体规则如下:
(1)EX作品原则上不降级(只有反华,在人类社会的基础上(即没有合理的架空观)反人类之类的情况可以考虑降级)
(2)如无梯度可降则降到Tn
(3)寻找最低分,若无在6分以下的,保持初始梯度。
(4)若有,则下降1梯度,之后每再低2分降1梯度。(即4~6分降1,2~4分降2,0~2分降3,多个低分项不重复计算)(看似吓人,实际上4分以下基本不会出现)
以上,作品的梯度,写作“受众推荐程度”的方式呈现在用户面前,然后用户可以根据自己对该作品的一些先期了解,以及作品附属的标签等信息,确定自己是不是该作品的受众,如果是,那么这个梯度大概率有效。因为人会潜意识地忽视自己认为不重要的方面,除非它坏到了令人生厌的地步,即我冲着某个方面去玩一部作品,只要它在这方面达到了要求,且其他方面没有出现负分的情况,我的游玩体验基本就是可以保证的。
这样,我们假定的这一部作品大概率会呈现出一个T1~T0、印象分6左右,综合分7.2左右的结果,那么对于用户来说,他会发现这部作品对受众的推荐程度很高,但印象分不高,综合分一般的水准,那么就很直白地表现出本作吃受众、两极分化比较严重的现状。然后他再确认自己是否属于该作品的受众,就能有一个比较全面而中肯的认识了。
而梯度和综合分不高,印象分较高的作品,总的来说就要偏向白开水作一些。
这些认识看似比较复杂,但实际上是可以在一个非常短的时间内形成的,因为用户只要不是一部gal都没玩过的纯萌新,那么,在他的心中,一个基准的评分早就建立起来了,所以一切评分机制都不过是对这类评分的汇总和再加工,他自然而然地就能通过两者之间的落差和“印象分”“综合素质”“受众推荐梯度”这三个词语的含义明确它们各自的职权。
总的来说,这个机制虽然在内部比较复杂,但表现是很简单的,玩家可以只评总分,也可以细评各项指标分,而他最终看到的,无非也就“印象分”“综合素质”“受众推荐程度”三个指标而已,如果他想对作品深入了解,那么再进入作品的详细页面,查看它的各项指标分数、标签、简介等其他附属信息,这与前者是不冲突的。
当然,评分的细节和数值,是一定需要具体应用的情况来进行微调和更改的,这也算是实事求是了好吧。