梁琪原生家庭关系修复课 课程分享,网盘分享
标准的简单随机抽样的做法是:先将全部外延事物编号,然后在数学 手册中找到随机数表,从随机数表中的任意一个数码出发,按照行或列选 出与拟选样本数量一样多的数码,与被选中的数码编号相同的那些外延事 物就是选中的样本。这种最原始、最简单的随机抽样的一大好处是,每一 个外延被选中的机会完全均等,主观意识影响选择过程的可能性完全被排 除。前面例子中提到的泰国航空公司飞行员和“清君侧”的情形就能避免 了。
后来人们发现,简单随机抽样虽然具有机会完全均等和排除主观影响 的优点,但有时并不意味着所选样本的代表性最强。例如,你想调查一个 学校全体5000名学生的平均身高,你准备抽取50个样本,如果你使用简 单随机抽样的方法,一定能排除该学校营养师人为提高身高数据以显示工 作成绩的企图,也一定能排除长期接触高个头学生的篮球队教练凭感觉对 全校平均身高的误判,但是,简单随机抽样仍不能保证50个样本的代表 性。如果抽取的50个样本中45个都是女生怎么办?如果抽取的50个样 本中46个都是男生怎么办?几乎全部用男生的平均身高代表全体学生的 平均身高,或者几乎全部用女生的平均身高代表全体学生的平均身高,误 差真的不见得比非随机抽样小多少。的确存在这样的可能。所以我们说, 简单随机抽样虽然完全放弃了主观性,但取而代之的是完全由老天爷掌控 的运气,运气不好同样不能保证样本达到理想的代表性。
经过探索,人们稍稍放松了一些对客观均等性的要求,稍稍加入了一 些主观性,发明了分层随机抽样、分群随机抽样、等距随机抽样。
分层随机抽样是,当总体中的各个事物从某一个典型特征看存在明显 差异,就先按这个特征对总体进行分层或分组,将准备选取的样本数量按 比例分给各层或各组,再在各层或各组按分到的样本数进行简单随机抽 样。例如,上面那所学校的5000名学生从性别特征看身高有明显差异, 假设有3000名男生,2000名女生,即性别比为3:2,我们决定按照3:2 的比例分配样本,在男生中抽取30个样本,在女生中抽取20个样本,总样本数仍为50。算出这50个样本的平均身高,用来代表5000名学生的平 均身高,样本对总体的代表性就强,误差就小。
再如,税务部门为了提高企业所得税征收的科学性,需要对各个企业 的可计入成本的招待费占总销售额的比率进行摸底调查,这样才能科学制 定企业可计入成本的招待费的最高限额,既照顾到企业经营的需要和避免 加重企业负担,又防止企业滥摊成本致使国家正常税收流失。问题是企业 因规模不同,招待费占总销售额的比率差异明显,如果随机抽取的样本中 小企业过多,调查结果就不能真实反映大企业的情况,反之,就不能真实 反映小企业的情况。这时税务部门往往先在大、中、小企业之间分配样本 数,再分别进行简单随机抽样。分配样本数的比例,有时是按照全部大、 中、小企业的数量比例来确定,有时是按照大、中、小企业以往交纳税收 的比例来确定,具有一定的主观目的性。
分群随机抽样是,当总体中的各个事物在地域上非常分散而调查经费 和时间有限,或者对总体列出全部抽样编码信息非常困难,就先将总体按 地域等标准分成若干个群体,然后用简单随机抽样办法抽取群体样本,最 后在选中的群体中进行普查或进一步的抽样调查。例如,想在全国100个 中等城市中选取10万人进行消费行为调查。如果直接做简单随机抽样, 样本可能分布在全国各地,费用和时间耗费巨大,并且为了抽样需要对 100个中等城市的全部消费者按姓名编码,信息采集工作繁重。如果我们 采用分群随机抽样,情况就不同了。我们把一个城市看作一个群体样本, 先在全国100个中等城市中用简单随机抽样办法抽取10个群体样本,再 在这10个城市中随机抽样选取10万人作为调查样本,这样费用、时间、 信息量都会大大减少。
等距随机抽样是分层随机抽样的一种特例,就是先将总体的每个事物 进行序列编号,再把编号按相同距离分成若干号码段,在第一号码段按简 单随机抽样办法选取一个样本,记下这个样本在第一号码段的排序号,最 后在其他号码段都分别选取一个与第一个样本具有同样排序号的样本。例 如,我们想在100个学生中抽取10个样本,先把100个学生分成10个学习小组,每组10人,然后在第一组中用简单随机抽样办法抽取一人作为 样本,比如抽到了编号为5的同学,最后我们就把编号为5、15、25、35、 45、55、65、75、85、95的10位同学作为选取的样本。等距随机抽样的 好处,一是使抽样操作简化了,只需在第一个号码段进行抽样操作即可; 二是保证每个号码段都有一个样本代表,避免了样本集中于某一个号码段 的可能。
版权声明:内容来源于互联网和用户投稿 如有侵权请联系删除