抽样讲的是如何搜集数据。由于我们希望得到的数据能正确反映实际的状况,所以采用随机地抽样。这是关键所在。应该让学生很好地理解这一点。比如要了解某地区18岁男孩的身高。若这些男孩中一米九以上的有千分之一,随机抽样使每个男孩被等可能抽到,因此,抽到一米九以上的可能性也是千分之一。若这些男孩中一米六到一米八的占百分之七十,那么抽到男孩身高在一米六到一米八之间的可能性也有百分之七十。随机抽样能使得样本中不同身高的百分比和总体中的百分比近似相同。换句话说,随机抽样的样本能很好地反映总体的状况。如果不把这一点说清楚,只单纯地介绍三种抽样的具体操作方法就讲偏了。在抽样的过程中,还应该注意样本的随机性,这是建立随机思想的重要载体。
另外,我们关注三种抽样方法的差别和不同的适用范围。例如,系统抽样通常比简单随机抽样简单。在田野上考察害虫的个数,通常就是从任一地点出发,每隔相同的距离测量害虫的个数。但如果考察马路上的车流量,每隔几天记录一次,若选择不当,例如,每七天测一次,恰选在了星期日。就会造成错误的结果。同样在分层抽样中,如果分的不当,同一组内个体相差太大,结果也会有偏差。在给中学生讲授抽样时,应讲清这些,而不是单纯地讲方法。从统计上说,理解这些比抽样方法本身更重要。
作为教师应该清楚不同的抽样方法得到的是不同的数学模型(样本的分布不同)。在数学上处理起来有难易的差别。最常用的假定是:样本是独立同分布的(粗略地说,独立是指每次抽样和前面的抽取无关,不能因为这次抽到一个男孩身高较高,下次就故意去找一个身材较矮的。同分布是指,若第一次抽到一米九以上的可能性是千分之一,那末第二次抽到一米九以上的可能性也是千分之一,等等)。即假定抽样是有放回的,这是实际问题的一个近似。还应该让学生关注的是:实际问题中的样本是否是随机的。例如,一些心理学实验是由志愿人员完成的,可能缺乏代表性。一些数据只来自某个学校或某个医院,并非随机抽样等等。作为基础教育,让学生认识到,由于缺乏随机性,报刊杂志等提供的数据以及由此产生的结论可能产生误导。这是十分重要的。 |