捕鱼→放鱼推算法

发布时间: 2014-07-29 分类: BI Note 作者:杨祖江 7 个吐槽

!本文可能 超过2年没有更新,今后内容也许不会被维护或者支持,部分内容可能具有时效性,涉及技术细节或者软件使用方面,本文不保证相应的技术更新和实践可操作性。

华北某地的一个村庄,很多农户挖塘养鱼,总要先估算一下鱼塘里有多少鱼。假设某农户春季放了大约1万条鲤鱼苗,这些鱼苗不一定都成活。现在我们用“捉放法”来帮该农户估算一下,他的鱼塘中现有多少条鱼?
做法是:先从鱼塘中捕出200条鱼,做上标记之后,再放回鱼塘,过几天后,再从鱼塘中捕出500条鱼,数一下其中有多少条标有记号。根据第2次捕出的鱼中有记号的鱼占捕出鱼数的比例,就可能估计全塘鱼的总数。
也许大家要问:这样做的依据是什么呢?下面我们来给出解答:上面叙述的全过程实际上是四步:捉——做标记——放——捉。我们不妨假定,两次捕捉,塘中鱼的总数不变,做标记的鱼在全部鱼中均匀分布;而且,第2次捕捉必须是随机的,也就是说,鱼塘中的每条鱼(不论是否做了记号)被捕捉到的可能性相同。
我们用n表示塘中鱼的总数,它是未知的,需要我们作出估计。用m表示第一次捕出的鱼数,即做记号的鱼数;用r表示第二次捕出的鱼数;用k表示第二次捕出的鱼中有记号的鱼数。m,r,k是可以观察到的,现在我们想通过观察到的m,r,k去估计未知的n。显然,m/n是做标记的鱼在总鱼数中所占的比例,在我们只知道做标记的鱼数而不知道鱼的总数时,无法得到m/n的值。也就是说,还缺乏信息。于是将做标记的鱼放回鱼塘,待它们与塘中的鱼混合均匀后,又进行了再次捕捉。这次捕捉,可以看作是从全塘鱼中随机抽取的一个样本,样本的大小是r。加上这次捕捉获取的信息,我们就可以作出对塘中鱼数n的估计。所依据的是统计学中用样本估计总体的思想。
前面说到,第2次捕捉是随机的,不论是有标记或无标记的鱼,被捕捉到的可能性相同。这样,在前面假设的前提下,应有
k/r=m/n
于是我们得到塘中鱼数n的估计为
n=mr/k
在估计农户鱼塘中鱼数的例子中,如果第二次捕出的500条鱼中做标记的鱼有12条,则鱼塘中鱼数的估计值是
n=200*500/12≈8333(条)
需要指出的是,用捉放法求得的塘中鱼数,是估计值而不是准确值。但方法的核心思想都离不开统计学的基本原理。为加深对捉放法的理解,读者可以设计一个简单的模拟试验:在一个杯子中放一些大小均匀的黄豆,再放入一些同样大小的青豆。这里青豆就相当于做了标记的鱼。两种豆子之和就是塘中鱼的总数。将杯中的所有豆子充分搅匀后,从中随机取出若干粒豆子,由青豆在取出的豆子中所占比例,进而估计杯子中全部的豆子数(鱼数)。

转载请注明本文链接:http://www.yzjbj.com/07/5058/html

-----------------------------华丽的正文结束了-------------------------------

标签: 数据分析方法

友荐云推荐 相关文章:
  • [尚无相关文章]

7 个吐槽 »

  1. 调节内分泌 调节内分泌

    有意思。特别。
    www.38hzt.com

  2. 很有意思,可是养鱼的人不会这和费心来算。

  3. 我记得小学还是初中数学题里面有这个。

  4. 看起来很有道理,就不知道实际上是不是这样!

  5. 说的头头是道呀!
    请多多支持好邻居:www.hollygee.cn

  6. 统筹学是门学问,高深莫测啊

  7. 支持下!语音群呼www.huixun35.com

登出评论