比如说现在在一个数组中存放了10000位同学的身高和体重信息,现在需要你对这100位同学以概率p=0.002进行抽样,随机取出这10000位同学中约20位同学的信息。
(注意:外部文件的文件名与路径)
关于随机抽样算法,我采用的是,先通过读取外部文件(存放需要进行随机抽样信息的文件),然后统计出该文件的行数(前提是需要抽样的样本必须是每一行存放一条对应信息),再通过随机算法产生出需要抽取的样本所对应的行号(通过输入抽样概率,计算出样本),最后输出随机抽样结果。本程序使用循环覆盖所读取文件的内容,可以很好解决内存消耗问题。