科学玩推特(2):用户分析

科学玩推特(1):自动清理 foers 脚本 一文中有提到,脚本帮我清了大概七千多用户。因为我的过失,最后只有4390个用户的信息被存了下来。有了这4390个用户的ID就好办啦(?)——用API去查了一下他们的信息(公开可查的 fields 见这里),其中让我感觉值得一查的领域也不多,最后就只留下了七项指标:用户ID,注册时间,蛋头(是/否),界面语言,fo数,foers数,和推数。用 Python 抓完后去掉了重复的记录,其中还有8个用户被禁号了(感想:我这是白忙活了吗),最后弄出来了一个干净的、可供进一步分析的 csv 文档。(果然最麻烦的都是 data collections and cleaning)导入R的时候有冲动想弄个模型来分析一下的,但后来发现这几个指标彼此之间没什么相关性(除非加上正常活跃推友的数据)于是只能作罢(可能未来还真的可以这样做诶)。

Continue reading 科学玩推特(2):用户分析

科学玩推特(1):自动过滤 foers 脚本

因为宅在家里实在是太无聊,也没有能找到工作,所以就天天推上泡着。之前我一度以为自己是推上的大V,光凭 foers 数而言我随随便便就有 16,500+ 可以秒杀不少人了。脚本现在终于快运行完了(每个 foers 都查了一遍。。。),然后这个数字急剧缩减到这样:

Continue reading 科学玩推特(1):自动过滤 foers 脚本