一组随机发生的数字,各个数字的首位存在一定规律,越小的数字出现的比率越高,既0出现的概率是100%(实际上首位不可能是0,因此我们可以认为其出现的概率是100%),1出现的概率是31%,2出现的概率是18%,依次类推,9出现的概率只有不到5%。其实,本福德定律也服从大数法则和中心极限定理,但是其证明比较复杂,这里不赘述。下图是美国物理学家 t. p. hill 于1998年7-8月试验本福德定律的概率图:本福德定律的应用条件是:(1)数据不能是规律排序的,比如**编号、**号码等;(2)数据不能经过人为修饰。一组平均增长的数据开始时,增长得较慢,由最初的数字a增长到另一个数字a + 1起首的数的时间,必然比a + 1起首的数增长到a + 2,需要更多时间,所以出现率就更高了。从数数目来说,顺序从1开始数,1,2,3,...,9,从这点终结的话,所有数起首的机会似乎相同,但9之后的两位数10至19,以1起首的数又大大抛离了其他数了。而下一堆9起首的数出现之前,必然会经过一堆以2,3,4,...,8起首的数。若果这样数法有个终结点,以1起首的数的出现率一般都比9大。这个定律的严格证明,可以参见hill, t. p. "a stat**tical derivation of the significant-digit law." stat. sci. 10, 354-363, 1996. 20210311