主题:【原创】关于西西河发帖和得花的一些统计与分析 -- Adol

大河奔流 导读 复 116 阅 121981

全看 分页 树展 一览 主题

2011-09-13 10:10:04
3561746 复 3557742
Adol
Adol`23680`/bbsIMG/face/0000.gif`70`2492`3304`33832`从三品:银青光禄大夫|云麾将军`2008-04-05 20:52:28`
【原创】(五)西西河之最 171

Adol:【原创】(四)西西河通胀问题之研究

6 西西河之最

本版有一篇置顶帖子,统计了2006年左右的西西河之最,那个时候鲜花还没怎么贬值,河友、帖子也都比现在少,夏翁河友统计了许多很有趣的结果,本节我来做一些很相似的事情。

在上一节分析的基础上,我把每个帖子的得花数按发帖时间进行标准化。采用如下的策略:以三个月为单位,认为每三个月鲜花数的贬值程度增加0.125(每年0.5)。即,2003年5-7月的文章得花数保持不变,8-10月除以1.125,11-1月除以1.25,……,2010年5-7月除以4.5,最后,通宝改革后的2010年8月至2011年7月的得花数除以8。经过标准化之后,每三个月的文章平均得花情况如下:

点看全图

上图横轴是时间,以季度(三个月)为单位、标记年份,纵轴是对所有帖子的得花数按发帖时间标准化之后,对应月份的平均每篇文章得花的数量。可以看到,标准化后鲜花的贬值基本得到了控制,但8年下来,大约仍然贬值了0.5倍,其中,对于27名参考河友的效果略差一些,但也在1以内。所以,下面的统计结果,仍然将偏向后期的帖子以及河友。此外,第一季度平均得花数较多,推测是因为第一季度中开河河友们搬运的经典老帖比较多的因素。

之所以没有通过调整参数来使得标准化的结果更完美,是因为得花数作为评价文章水平的功能,本身就有着局限性,一篇文章的得花和文章的真实水平,也不是那么精确的关系,只是作为笼统的一种衡量,具有一定统计上的意义。

事实上,包括作者的声望、文章的题材、送花的从众心理、甚至偶然性在内,一篇文章得花多少的因素是十分复杂的。我们可以从统计角度说,100朵花的文章比10朵的要好,但是100朵和90朵,便不能这么比较。

再比如,我们都知道,西西河不同版块的人气也是不一样的,那么对不同板块的文章,单独拿得花相差十朵八朵来精确地比较哪篇好,是没有任何实际意义的。而且不同板块上不同种类的文章,也不是都具有可比性。所以,下面的结果,只能一般性地找出一些“更受欢迎”的文章,并不是说,这些文章一定比其他文章水平要高。

西西河得花最多的20篇帖子:

点看全图

这便是西西河最受欢迎的一些帖子了,本来我只想选前10个,后来还是扩展到了20个。可以看到220朵“西河标准花”附近的帖子已经比较密集,类似数量级的帖子还会有很多,但是由于篇幅的原因,只列出了这些。

这些帖子受到了很广泛的认同,在很大程度上体现了西西河的主流价值观。我姑且僭越总结一番:

首先,西西河最欢迎既讲感情,又讲道理的帖子,特别是用道理来支持感情,使读者类似的却又表达不好的心境共鸣起来;

其次,如果没法做到情理并重,那么感情比道理重要;

第三,如果主要讲道理,那么重实例,重证据,重亲身经历,轻虚浮飘渺的理论;

第四,各行各业的知识来者不拒,也很重视能够带来知识的人;

第五,西西河是讲正直、正义和正气的,是推崇付出、奉献、奋斗、自强和其他各种优秀品德的,不是每个人都能做到,但是每个人都会敬重能够做到的人,不欢迎道德虚无主义;

第六,西西河对于民族独立和经济发展都有着坚定的基本态度和荣誉感,不欢迎历史虚无主义或国家虚无主义;

第七,要客观、平衡的观点,不要主观,极端的观点。

以上都是单贴得花数量,下面来看看西西河得花最多的20篇主题,其中发表时间是主题帖的发表时间,得花数是换算为标准花后、主题帖作者在本楼得花的总数,作者回帖是作者本人在此主题下回帖的个数:

点看全图

这些主题实际上由两部分组成,一部分是超级高楼,基本在300帖以上,得花较多,都是优秀的超长篇连载或写在一个帖子下面的多个优秀主题,这样的高楼有9个。另一部分就是比较经典的单一主题连载,考虑到之前的9个超级高楼,我补充9个排名仅次于它们的单一主题连载(限制作者回帖数在100以下),如下:

点看全图

这些都是十分经典的主题帖,但并不是全部。原因有二,其一,我简单使用“限制作者回帖数小于100”作为筛选“单一主题”的条件,这是根据上表的经验数字,可能会筛掉许多热心回帖的河友,比如有问必答的忙总就是一例,他几乎会回复每个回复贴,所以他的主题里自己的回帖很多;其二是有一些河友的习惯,以及有一段时间河里鼓励不要写太长的主题,因此不少经典的单一主题/系列实际上分布在不同的主题帖当中,而在首帖中以链接互相引用,目前的筛选方式也会漏掉这些主题。

说完了帖子和主题,再来说河友,再一次说明:之前标准化的方法只是一般性地消除了大部分通胀因素,并不是全部,也不很精确;并且得花的数量也不是评价河友的唯一标准。

点看全图

点看全图

点看全图

点看全图

注:原创率,跟帖在自己主题下的帖子占全部发帖的比例;原创得花率,鲜花在自己主题下帖子所得的比例;送花/回复比,送花数量(乐善)与回复数量(含回复自己的主题)的比例。上面几个表的花数都是西西河标准花数。

Adol:【原创】(六)好友识别、圈子划分与马甲辨认


  • 本帖 3 回复
资深推荐:铁手, 通宝推:迷途笨狼,西伊,铁手,笑熬浆糊未糊,鹰从天降,抱朴仙人,乡谊,晨池,踢细胞,威尔谭,
最后于2011-09-15 12:54:19改,共1次;
2011-09-13 10:10:04

全看 分页 树展 一览 主题