淘客熙熙

主题:【原创】基于西西河发帖时间戳的河友发帖习惯分析 -- 菜根谭

共:💬52 🌺415 🌵5 新:
分页树展主题 · 全看首页 上页
/ 4
下页 末页
    • 家园 【讨论】这些被怀疑的ID是燕人的马甲吗?他们在哪里?团伙作案

      【原创】军情六局M16入驻西西河?(西西河发帖时间调查报告)

      【讨论】受某网友启发,关于马甲的简单分析和讨论

      我下面要分析的这些ID都被我屏蔽了,还是用燕人的数据(英国GST时间)作为时间基准轴.

      先说结论:

      这些ID未必是阉人直接运作的马甲,但是很显然和阉人团队具有紧密关系,生活作息比阉人晚2-3个小时,显然是有组织的在发文。这是一个团伙!

      点看全图

      这些数据应该很有说服力了吧?

      他们作息时间对比阉人大概是延迟了2-3个小时,经过时间校准后,和阉人发帖规律相关系统R 在这个范围内:【0.7~0.92】;

      这些ID本身之间发帖时间几乎是一致的,相互之间偏差在1小时之内,已经在误差范围内。

      这些被分析的ID有各种各样的人设:社会底层,台湾ID,左派,右派;但是他们的数据集聚了,并且都一直被阉人团伙以保护多样性的名义保护。

      @铁手

      通宝推:绿色蔬菜我的爱,大胖子,
    • 家园 更多的反例和进一步的分析

      点看全图

      按照上文中的分析方法,可以看到:

      大胖子vs菜根谭:R=0.82;

      菜根谭vs达雅: R=0.79;

      燕人:假日归客:R=0.86;

      聪明的读者,发现问题了么?这三对难道互相都是马甲吗?

      所以问题在哪儿呢?这种相关性到底在寻找什么?

      合理方向正确

      绿色蔬菜的这个解读是最准确的。

      我们认为人都是随着日升日落起居作息的,所以只要时间足够长,每个人的作息时间实际是在时间轴的一个平移。

      点看全图

      用我对燕人的数据举例:

      图1显示我们的数据没有相关性;

      图2是固定燕人的数据,但是我的数据伴随着时间轴进行平移,并再次与燕人的数据进行Regress分析,由于Matlab的原因,Regress函数的R2会返回负值,这种情况下说明线性拟合不成立。我直接设置R=0;

      从图2可以看出,当我的数据平移17个小时的时候,和燕人的数据出现最好的相关性;R接近0.8,如图3所示;

      什么意思呢?也就是说:燕人和我的作息时间差7个小时。之前从我前一系列分析看到,,他在英国GST时区,我在北京时区。看起来我们作息差1个小时,这个解释合理吗?

      只看图3,难道燕人是我的马甲吗?

      下一步,让我们用一些已知老河友的数据验证下这个理论是否正确:

      因为燕人所在时区是GST, 将作为后续分析时间轴基准:

      点看全图

      相对燕人:

      翼德:+1; 翼得2022后注册,而燕人数据覆盖了之前10多年的数据;所以有偏差;

      菜根谭:-7: 东8区,作息晚1小时;

      大胖子: -8:东8区,作息时间类似;

      达雅:-6:东8区,作息时间早1个小时;

      假日归客:0,西1区,作息查一个小时;

      夜如何其:7,西5区,作息晚2个小时;

      以上数据证实时间分析是可行和准确的。

      土鳖抗铁牛。

      通宝推:千里不留行,落木千山,大胖子,起于青萍之末,
分页树展主题 · 全看首页 上页
/ 4
下页 末页


有趣有益,互惠互利;开阔视野,博采众长。
虚拟的网络,真实的人。天南地北客,相逢皆朋友

Copyright © cchere 西西河