>>502 補足
そこらの勘違いが、この問題のキモだと思うよ (後述の英文サイトなどもご参照)
決定番号 d(s) の確率を考えようとすると、自然に決定番号 d(s) の分布が問題になる
例えば、 d(s) が仮に一様分布だとしよう。https://ja.wikipedia.org/wiki/%E4%B8%80%E6%A7%98%E5%88%86%E5%B8%83 一様分布 - Wikipedia
(引用)
確率変数を x ( α ? x ? β ) とする。 x が整数であるときの離散型の一様分布の確率分布 Pr ( x = X )、 一様分布の確率密度関数は以下の式で定義される。
1/(β ? α)
またいずれの場合も確率の期待値は以下で表される。
(α + β)/ 2
(引用おわり)

つまり、決定番号 d(s) に上限がないとすれば、β→∞を考えなければならないということ
が、d(s) は明らかに一様分布ではない。d(s) が大きいほど、出現頻度は大きい

ここで、確率分布に詳しい人がすぐ気付くことは、普通考える確率分布では、確率変数 x ( α ? x ? β ) で、βが有限か、あるいはβが有限でない場合βが大きくなると分布はゼロになるんだと
例えば、
ベータ分布は前者の例 https://ja.wikipedia.org/wiki/%E3%83%99%E3%83%BC%E3%82%BF%E5%88%86%E5%B8%83
正規分布は、後者の例 https://ja.wikipedia.org/wiki/%E6%AD%A3%E8%A6%8F%E5%88%86%E5%B8%83

しかし、普通考える確率分布と比較すると、d(s)の確率分布がおかしい(d(s)が増大してもゼロに収束しない)ことは、確率分布に詳しい人ならだれでも気付く