数据来源

采集自推特

这是一个尝试(或者说是开端),试图通过分析 twitter 一个局部的切片,来揭示由 twitter 中文用户群体所构成的信息空间具有什么样的形态特征。 大致通过以下三步实现:
一、以一定的规则选取一批用户 首先,这次实验用以下规则选取一批用户:
2011年1月1日前注册;
至少2011年3月仍然活跃;
跟随数为100。

共选出符合用户107位,以下简称为 107t 。
二、统计 107t 的基本情况
在第二步主要是统计用户的注册时间、所在地、用户网址、发推数量分布,并初步总结他们的群体特征。另外有一个辅助比较,可以大致标注一下 107t 的跟随增长幅度。以下分别说明,最后是一个小总结。
1. 107t 注册时间段

2007年注册的9位;
2008年注册的8位;
2009年注册的52位;
2010年注册的38位。

2. 107t 在简介中填写的所在地 共有88个用户填写了所在地。

Seoul : 1
Quito :1
Hawaii :1
Abu Dhabi :1
Chongqing :1
jakata :2
Sydney : 2
Taipei :2
London : 3
Tokyo :4
Kuala Lumpur:6
Hong Kong : 7
Alaska : 7
Singapore :9
Beijing 41

3. 107t 在简介中填写的网址

用户个人网站往往是一个用户在网络空间中最重要的构成信息,因此特别从用户简介中提取出用户网站网址,共50个,分为六种类型,分别统计数量如下
独立Blog 16
blogspot.com 11
wordpress.com 4
facebook.com 4
google.com/profiles 3
其它空间 12

4. 107t 的发帖情况统计 发推总量幅度 用户数量

1-990 : 47
1000-1999: 27
2000-2999 : 7
3000-3999: 8
4000-4999: 10
5000-5999: 2
6000-6999: 2
7000-7999: 1
8000-8999: 1
9000-9999 : 0
>10000: 2

总发推量: 219470,平均发推量: 2051.121495 ,其中发推量高的前21位用户,发推量占总量的 83% 。

5.一个比较

据另外一项统计,2011年1月1日到2011年5月26日注册的12751位用户中,有3.6%的用户跟随数超过了100,并有两位用户跟随数超过了 13000,32位用户超过了 1000 。
以此做参照,107t 不属于跟随数增长较快的一类用户。
以上统计反映出 107t 的一些特点如下:

107t 中有69位是2010年前注册,到2011年仍然活跃,应该算是比较坚持的用户;
中文国外用户占有不小的比例;
一部分 107t 用户也是 Blog活跃用户;
从20% 用户发推量占总量的80% ,进一步表明这是一个有代表性的群体;
107t 的跟随增长较平缓。
总体来看,107t 属于稳健而活跃、分布范围广泛,书写能力殷实的twitter 的子群体。

comments powered by Disqus