统计调查方案简介
统计调查方案简介依据统计学理论和国际惯例,CNNIC 调查采用了计算机网上自动搜寻、网上联机、电话抽样、相关单位上报数据等调查方法。(一)域名数、网站数、IP 地址调查1. 我国的通用顶级域名数及对应
统计调查方案简介
依据统计学理论和国际惯例,CNNIC 调查采用了计算机网上自动搜寻、网上联机、电话抽样、相关单位上报数据等调查方法。
(一)域名数、网站数、IP 地址调查
1. 我国的通用顶级域名数及对应网站数:
通过各通用顶级域名注册服务机构协助提供。这些数据包括:所有通用顶级域名(gTLD )和有网站(即有WWW 服务)的通用顶级域名(gTLD )总数、所有通用顶级域名(gTLD )和有网站的通用顶级域名(gTLD )按.COM 、.NET 、.ORG 分类的数目、所有通用顶级域名(gTLD )和有网站的通用顶级域名(gTLD )按注册单位所在省份分类的数目。
2. 我国的CN 域名数及对应网站数:
采用计算机网上自动搜索可得到如下数据:CN 下的域名数及地域分布情况;CN 下网站数及其地域分布情况。
3. 我国域名总数、网站总数:
将以上(一)、(二)两部分的相关数据分别相加,即可得到我国的域名总数、网站总数、域名和网站的地域分布、网站分类数等数据。
4.IP 地址总数:
IP地址分省统计的数据来自APNIC ,中国互联网络信息中心(CNNIC ) IP地址数据库,数据统计方法是将两个数据库中已经注册且可以判明地址所属省份的数据,按省分别相加得到,由于地址分配使用是动态过程,所统计数据仅供参考。
(二)网上联机调查
网上联机调查重在了解网民对网络的使用情况、行为习惯以及对热点问题的看法和倾向。具体方法是将问卷放置在中国互联网络信息中心(CNNIC )的网站上,同时在全国各省的信息港与较大ICP/ISP上设置问卷链接,由网民主动参与填写问卷的方式来获取信息。
(三)电话抽样调查
电话抽样调查侧重于了解中国网民的总量、相关的特征及行为特点等。
1. 调查总体
结合调查目的,网下调查的目标总体定义为:全国6周岁以上的居民。从访问实施的角度,把目标总体细分为:
(1)全国有住宅固定电话的6周岁以上的人群(总体A ),采用电话调查的方式;
(2)全国所有高等院校中的住校学生(总体B ),采用电话调查
,的方式;
(3)没有住宅固定电话、但有小灵通的6周岁以上的人群(总体C1),采用电话调查的方式。
由于在实施中,总体A 和C1无法区分,所以将其作为一个总体进行调查。在对全国结果进行推断时,将总体A +C1和总体B 的统计量应用加权公式进行汇总。
2. 总体A +C1抽样方法
按照科学性和可操作性相结合的原则,对总体A +C1按省进行分层。
◇ 抽样指标的确定
从全国的情况来看,各省的城市住宅电话与乡村住宅电话的比例差异很大,由于城市与农村家庭的平均人口数差异很大,所以在用各省数据推断全国时,考虑的指标是“拥有住宅电话的人数(或称住宅电话覆盖的人数)”;在确定各省中地市(此处的地市包括地级市和地区行署,每个地市下都包括城镇和乡村,以下简称地市州)的样本量时,采用地市州的“人口和经济指标”建立回归预测模型估计该地市州的住宅电话数目,并将该地市州的住宅电话数目作为抽样指标。 ◇ 样本量
综合考虑到调查的精度和费用、时间的要求,在保证网民人数最少的省的样本量能满足推断本省网民总数的基本要求下,置信度为95,设计效应为2时,最大绝对误差为2.2。由于各省的网民人数和占本省人口数的比例差异很大,考虑各方面的因素,根据上年度中国互联网络信息中心(CNNIC )的调查结果,以各省网民人数为依据,算得每个省的样本量。
◇ 省内各地市的抽样方法
第一步:从精度上考虑,为使样本更接近自加权样本,在每个省中抽取全部的地市州。省内各地市州的样本量,按各地市州住宅电话数目比例进行分配。
第二步:获得各地市州的所有电话局号,根据该地市州的局号生成电话号码库。电话号码中除局号外的后四位,由随机数生成。 第三步:确定调查对象,在电话(包括没有住宅固定电话的小灵通)拨通后,把接听电话的人作为被访对象,询问家庭基本状况和他(她)本人上网(不上网)的有关情况、个人背景资料和家庭其他成员的最简要资料。如果他(她)不上网,但家中有人上网,则再随机抽取一名上网的成员来接听电话,回答有关上网的问题以及自己的个人基本资料。
◇ 全国加权方法
对全国的推断采用对各省的调查结果进行事后加权处理的方法。
3. 总体B
本部分采用电话抽样调查,总样本量4000个。
总的抽样方法是分层三阶段混合型抽样,使最终样本为近似自加权样本。分层指标为省份(31个省份)和学校层次(本科、专科),
,共分为62层(31*2=62)。在每层中,以在校学生人数作为抽样指标,利用PPS 法抽取200所学校。每所被抽中的学校利用已知的每个学校的宿舍电话名录, 随机抽取宿舍号码拨打, 直到调查了20个宿舍为止。每个宿舍访问1名本宿舍的学生。
将总体A C1和总体B 的结果汇总得到我国网民的总量、相关特征、行为特点等数据。