惊闻淘宝上有付费刷星服务,如 这家店铺,买的人还不少,相同刷星服务的几家店铺加起来有超过一百人购买(一个星两块钱,灰产的钱真是好赚呀)。
这非常有意思。我打算开一个新坑,目的在于:
- 挖掘出这批不诚信的刷星用户,吊路灯。
- 了解目前 GitHub 上 Star 数据的真实性。
迅速 Demo 一把 :)
通过 GitHub API,分析项目 Stargazers 的行为(没有 repo 的占比),挖出了 24 个涉及刷数据的项目:github-misconduct/github-cheater-cn
下一步计划:
- 全量扫一次 Stars 在 20 ~ 750 之间的项目。
- 搞一个高准确率的作弊判定模型。
嘿嘿。