東大数学科卒の元官僚はこう分析してるが、お前らはどうなると思う?
http://www.zakzak.co.jp/soc/news/200220/dom2002200003-n2.html
中国国外感染者の中国国内との比率をみると、
1月20日の数字公表以降は、0・8〜2・6%で比較的安定している。
これは、新型肺炎の感染者のほとんどは中国国内、それも湖北省に集中しているからだ。
ちなみに中国国外での感染者数は、中国国内の1・1%だ(2月16日現在)。
本コラムで紹介したが、現時点では、最終的な中国国内の感染者数は20万人超と筆者は推計している。
となると、中国国外の感染者は数千人程度になるだろう。
中国国外のうち日本の比率は1割弱なので、日本の感染者数は数百人程度であろう。
その場合、死者も数人から10人程度になるだろう。
こうした推計をすると、今の感染者は氷山の一角だと思われるが、今後の増加ペースはどうなるだろうか。
新型コロナウイルスの検査は簡単に行えるので、今後、日本での感染者数は増えていくだろう。
ある時点ではそれがネズミ算的に増えるかのように思える局面もあるだろうが、
筆者の推計が正しければ、現時点ではせいぜい数百人が一つのメドだ。
数学 統計に詳しい人が語るコロナウイルス
■ このスレッドは過去ログ倉庫に格納されています
1132人目の素数さん
2020/02/29(土) 02:18:41.53ID:twdO677Q155132人目の素数さん
2020/03/28(土) 11:58:45.95ID:BJlezchp >>151
> m=1000 # 有名人の人数
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 63590201/1002
> as.numeric(E)
[1] 63463.27
6万3000人と計算された。
> m=1000 # 有名人の人数
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 63590201/1002
> as.numeric(E)
[1] 63463.27
6万3000人と計算された。
156132人目の素数さん
2020/03/28(土) 12:46:07.99ID:NK6wIjWT157132人目の素数さん
2020/03/28(土) 15:42:06.57ID:BJlezchp >>156
n(=10)人の中にi人の感染者がいるとき無作為にm(=2)人を選ぶ。
選ばれた2人の中に少なくとも一人の感染者がいる確率をP[x]として、
n個からr個選ぶ組み合わせの数をChoose(n,r)で表すと
P[xi]=1- choose(10-x,2)/choose(10,2)
xを0から10まで変化させて、
Σx*P[x]/(ΣP[x])で
期待値が求まる。
n(=10)人の中にi人の感染者がいるとき無作為にm(=2)人を選ぶ。
選ばれた2人の中に少なくとも一人の感染者がいる確率をP[x]として、
n個からr個選ぶ組み合わせの数をChoose(n,r)で表すと
P[xi]=1- choose(10-x,2)/choose(10,2)
xを0から10まで変化させて、
Σx*P[x]/(ΣP[x])で
期待値が求まる。
158132人目の素数さん
2020/03/28(土) 15:42:43.27ID:BJlezchp タイプミス修正
P[x]=1- choose(10-x,2)/choose(10,2)
P[x]=1- choose(10-x,2)/choose(10,2)
159132人目の素数さん
2020/03/28(土) 16:07:51.35ID:qsSYTF8t 何このアホスレ?
160132人目の素数さん
2020/03/28(土) 16:53:08.32ID:BJlezchp 有名人の数を増やしてみても同様の結果になった。
> # 有名人が感染
> library(gmp)
> m=18200 # 有名人の数(桜を見る会参加人数)
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 1154070201/18202
> as.numeric(E) # E=63463.27 (m=1000) , E=1154070201/18202=63403.48(m=1.268e5)
[1] 63403.48
> # 有名人が感染
> library(gmp)
> m=18200 # 有名人の数(桜を見る会参加人数)
> n=1.268e5 # 日本の人口
> x=0:n # 感染者数:x, 非感染数:n-x
> pmf=1- chooseZ(n-x,m)/chooseZ(n,m) # 1 - (m人全員非感染の確率)
> pdf=pmf/sum(pmf) # 確率密度関数化して
> (E=sum(x*pdf)) # 期待値を計算
Big Rational ('bigq') :
[1] 1154070201/18202
> as.numeric(E) # E=63463.27 (m=1000) , E=1154070201/18202=63403.48(m=1.268e5)
[1] 63403.48
161132人目の素数さん
2020/03/28(土) 19:42:56.69ID:NK6wIjWT >>160
なんだってー。直感に反するな
なんだってー。直感に反するな
162132人目の素数さん
2020/03/29(日) 09:23:06.20ID:WogCQeQk >>161
総人口100人として有名人の数を1〜100人まで変化させて、有名人に感染者がいたときの100人中の感染者の数をグラフにすると
https://i.imgur.com/SMFnNNl.png
有名人の数を変化さえても期待値にさほどの変化はない。
総人口100人として有名人の数を1〜100人まで変化させて、有名人に感染者がいたときの100人中の感染者の数をグラフにすると
https://i.imgur.com/SMFnNNl.png
有名人の数を変化さえても期待値にさほどの変化はない。
163132人目の素数さん
2020/03/29(日) 10:18:20.74ID:2PsxdXJm164132人目の素数さん
2020/03/29(日) 10:39:47.55ID:WogCQeQk Ax: x人の感染者がいる(x=0〜n)という事象
B:最低一人の感染陽性判定という事象
Pr[Ax|B]=Pr[B|Ax]Pr[Ax]/Pr[B]
Pr[Ax]:事前確率
Pr[B|Ax]:尤度
Pr[B]:周辺尤度(規格化定数)
求めたい期待値Eは
Σ(x*Pr[Ax|B])/ΣPr[Ax|B] = Σ(x*Pr[B|Ax]Pr[Ax])/Σ(Pr[B|Ax]Pr[Ax])
Pr[Ax]がxにかかわらず定数であれば
E=Σ(x*Pr[B|Ax])/Σ(Pr[B|Ax])
事前確率分布を一様分布と仮定しての計算
つまり、感染者が1人の確率も50人の確率も100人の確率,....も一定という前提での計算。
B:最低一人の感染陽性判定という事象
Pr[Ax|B]=Pr[B|Ax]Pr[Ax]/Pr[B]
Pr[Ax]:事前確率
Pr[B|Ax]:尤度
Pr[B]:周辺尤度(規格化定数)
求めたい期待値Eは
Σ(x*Pr[Ax|B])/ΣPr[Ax|B] = Σ(x*Pr[B|Ax]Pr[Ax])/Σ(Pr[B|Ax]Pr[Ax])
Pr[Ax]がxにかかわらず定数であれば
E=Σ(x*Pr[B|Ax])/Σ(Pr[B|Ax])
事前確率分布を一様分布と仮定しての計算
つまり、感染者が1人の確率も50人の確率も100人の確率,....も一定という前提での計算。
165132人目の素数さん
2020/03/29(日) 10:47:28.57ID:WogCQeQk >>163
そうみたいですね。
> data.frame(有名人=1:10,期待値=sapply(1:10,function(x) fn(100,x)$mean))
有名人 期待値
1 1 67.00000
2 2 62.75000
3 3 60.20000
4 4 58.50000
5 5 57.28571
6 6 56.37500
7 7 55.66667
8 8 55.10000
9 9 54.63636
10 10 54.25000
> data.frame(有名人=1:10*10,期待値=sapply(1:10*10,function(x) fn(100,x)$mean))
有名人 期待値
1 10 54.25000
2 20 52.31818
3 30 51.59375
4 40 51.21429
5 50 50.98077
6 60 50.82258
7 70 50.70833
8 80 50.62195
9 90 50.55435
10 100 50.50000
そうみたいですね。
> data.frame(有名人=1:10,期待値=sapply(1:10,function(x) fn(100,x)$mean))
有名人 期待値
1 1 67.00000
2 2 62.75000
3 3 60.20000
4 4 58.50000
5 5 57.28571
6 6 56.37500
7 7 55.66667
8 8 55.10000
9 9 54.63636
10 10 54.25000
> data.frame(有名人=1:10*10,期待値=sapply(1:10*10,function(x) fn(100,x)$mean))
有名人 期待値
1 10 54.25000
2 20 52.31818
3 30 51.59375
4 40 51.21429
5 50 50.98077
6 60 50.82258
7 70 50.70833
8 80 50.62195
9 90 50.55435
10 100 50.50000
166132人目の素数さん
2020/03/29(日) 10:58:30.70ID:1Oo79tY3 「有名人」を「wikに載ってる人」と定義し
その数を10000人としてそのうち4人(志村、藤浪、長坂、伊藤隼人)
感染したとしても結果は変わらない
その数を10000人としてそのうち4人(志村、藤浪、長坂、伊藤隼人)
感染したとしても結果は変わらない
167132人目の素数さん
2020/03/29(日) 10:58:36.48ID:WogCQeQk 昨日の東京のコロナ陽性者は87人検査して63人陽性であったという。
検査の感度0.6 特異度0.9と仮定して、87人中に感染者は何人と推定されるか?
真陽性率=感度=0.6
偽陽性率=1−特異度=0.1
87人中の感染者数をxとすると
陽性者数= 感染者数*真陽性率 + 非感染者数*偽陽性率
63=x*0.6+(87-x)*0.1
これを解くとあり得ない答になる。
検査の感度0.6 特異度0.9と仮定して、87人中に感染者は何人と推定されるか?
真陽性率=感度=0.6
偽陽性率=1−特異度=0.1
87人中の感染者数をxとすると
陽性者数= 感染者数*真陽性率 + 非感染者数*偽陽性率
63=x*0.6+(87-x)*0.1
これを解くとあり得ない答になる。
168132人目の素数さん
2020/03/29(日) 11:48:31.42ID:WogCQeQk >>166
総人口n人、有名人m人、そのうち感染者k人とすると
n人中の感染者の期待値は
x = 0 〜 nとして 、xCkはx人からk人選ぶ組み合わせの数を表す
Σ(x*(xCk/nCm))/Σ(xCk/nCm) = =Σ(x*(xCk))/Σ(xCk)
となるのでmの値には依存しない。
n
総人口n人、有名人m人、そのうち感染者k人とすると
n人中の感染者の期待値は
x = 0 〜 nとして 、xCkはx人からk人選ぶ組み合わせの数を表す
Σ(x*(xCk/nCm))/Σ(xCk/nCm) = =Σ(x*(xCk))/Σ(xCk)
となるのでmの値には依存しない。
n
169132人目の素数さん
2020/03/29(日) 14:27:34.63ID:2PsxdXJm >>168
するとこの計算で出てくる推定感染者数6万人って値は意味ない感じですか?
するとこの計算で出てくる推定感染者数6万人って値は意味ない感じですか?
170132人目の素数さん
2020/03/29(日) 14:33:09.96ID:WogCQeQk >>167
陽性者数が87人中63人になるような感度と特異度を最小二乗法で求めると。
> (opt=optim(c(0.6,0.9,63),nazo,method='CG'))
$par
[1] 0.916014625 0.779617519 63.002729987
陽性者数が87人中63人になるような感度と特異度を最小二乗法で求めると。
> (opt=optim(c(0.6,0.9,63),nazo,method='CG'))
$par
[1] 0.916014625 0.779617519 63.002729987
171132人目の素数さん
2020/03/29(日) 14:48:03.55ID:0jXKnAa1 学術の巨大掲示板群 - アルファ・ラボ
ttp://x0000.net
数学 物理学 化学 生物学 天文学 地理地学
IT 電子 工学 言語学 国語 方言 など
ttp://x0000.net
数学 物理学 化学 生物学 天文学 地理地学
IT 電子 工学 言語学 国語 方言 など
172132人目の素数さん
2020/03/29(日) 15:31:10.14ID:WogCQeQk >>170
初期値に依存するから意味のないスクリプトであると判明したので撤回します。
初期値に依存するから意味のないスクリプトであると判明したので撤回します。
173132人目の素数さん
2020/03/29(日) 15:31:33.71ID:WogCQeQk >>169
単なる数字の遊びだろうね。
単なる数字の遊びだろうね。
174132人目の素数さん
2020/03/29(日) 15:37:58.67ID:WogCQeQk >>169
前提となっているのが、
日本人1億2680万人いるとして
日本人の感染者数が1人である確率も1億人である確率も同じと、一様分布を仮定しているのが現実離れしている。
よって現実的には意味がない。
前提となっているのが、
日本人1億2680万人いるとして
日本人の感染者数が1人である確率も1億人である確率も同じと、一様分布を仮定しているのが現実離れしている。
よって現実的には意味がない。
175132人目の素数さん
2020/03/31(火) 03:21:38.60ID:5/cy/U/F176132人目の素数さん
2020/03/31(火) 06:08:43.61ID:2llZ2I8j177132人目の素数さん
2020/03/31(火) 06:12:02.74ID:2llZ2I8j Reed -Frostはパラメータが1個ですむから推定しやすいんだろう。
178132人目の素数さん
2020/03/31(火) 08:54:47.69ID:2llZ2I8j >>76
54119人という値になった。
計算プログラムは以下の通り。
# width of 99% confidence interval when 1000 subjects are examined
p2w <- function(
prevalence,
subjects=1000,
sensitivity=0.6,
specificity=0.9,
conf.level=0.99){
# prevalence -> width of 99% confidence interval
n=subjects
p=prevalence*sensitivity+(1-prevalence)*(1-specificity) # positive rate=prev*TP+(1-prev)*FP
q=1-p
2*qnorm(1-(1-conf.level))*sqrt(p*q/n) # width of 99%CI
}
p2w=Vectorize(p2w)
prevalence=seq(0,1,by=0.01)
plot(prevalence,p2w(prevalence),bty='l',type='l',lwd=2,ylab='99%CI width',
main='subjects:1000\nsensitivity:0.6\nspecificity:0.9')
optimize(p2w,c(0,1),maximum=TRUE)
#
sj2w <- function(subjects){ # subjects -> maximum 99%CI width & its prevalence
optimize(function(prev) p2w(prev,subjects),c(0,1),maximum = TRUE)
}
# at how many subjects 99%ci width equals 0.01
uniroot(function(x,u0=0.01) sj2w(x)$objective-u0,c(1000,100000))
54119人という値になった。
計算プログラムは以下の通り。
# width of 99% confidence interval when 1000 subjects are examined
p2w <- function(
prevalence,
subjects=1000,
sensitivity=0.6,
specificity=0.9,
conf.level=0.99){
# prevalence -> width of 99% confidence interval
n=subjects
p=prevalence*sensitivity+(1-prevalence)*(1-specificity) # positive rate=prev*TP+(1-prev)*FP
q=1-p
2*qnorm(1-(1-conf.level))*sqrt(p*q/n) # width of 99%CI
}
p2w=Vectorize(p2w)
prevalence=seq(0,1,by=0.01)
plot(prevalence,p2w(prevalence),bty='l',type='l',lwd=2,ylab='99%CI width',
main='subjects:1000\nsensitivity:0.6\nspecificity:0.9')
optimize(p2w,c(0,1),maximum=TRUE)
#
sj2w <- function(subjects){ # subjects -> maximum 99%CI width & its prevalence
optimize(function(prev) p2w(prev,subjects),c(0,1),maximum = TRUE)
}
# at how many subjects 99%ci width equals 0.01
uniroot(function(x,u0=0.01) sj2w(x)$objective-u0,c(1000,100000))
179132人目の素数さん
2020/03/31(火) 09:55:37.96ID:cpD4Fk2x 上って、灘校東大理IIIの超秀才のはずなのに、なんで
あんなに頭の悪い発言ばかりしてんの?
変な宗教にでも取り憑かれて理性が狂わされてるのかな?
あんなに頭の悪い発言ばかりしてんの?
変な宗教にでも取り憑かれて理性が狂わされてるのかな?
180132人目の素数さん
2020/03/31(火) 10:07:35.24ID:2llZ2I8j 日本人1億2680万人からX人を無作為に抽出してPCR検査して、感染者数(≠検査陽性者数)を信頼区間99%誤差±1%で検定したい。
PCR検査は感度0.6,特異度0.9とする。
何人を抽出すれば十分といえるか?
54000人程度になったけど、あってる?
PCR検査は感度0.6,特異度0.9とする。
何人を抽出すれば十分といえるか?
54000人程度になったけど、あってる?
181132人目の素数さん
2020/03/31(火) 14:43:06.94ID:2llZ2I8j >>179
超秀才は理Iに行くんじゃないの?
超秀才は理Iに行くんじゃないの?
182132人目の素数さん
2020/03/31(火) 14:50:29.57ID:ncBHjUEo >>180
感染率の程度、感度・特異度の値の精度の言及無しに出された結論に、ほとんど説得力は無い。
感染率の程度、感度・特異度の値の精度の言及無しに出された結論に、ほとんど説得力は無い。
183132人目の素数さん
2020/03/31(火) 15:19:09.38ID:2llZ2I8j >>182
感度 beta(13.6991,9.4661)でmode 0.6 sd=0.1
特異 beta(36.172,4.908) でmode 0.9 sd=0.05
でベイズの階層モデルを組んでみるかな。
感度 beta(13.6991,9.4661)でmode 0.6 sd=0.1
特異 beta(36.172,4.908) でmode 0.9 sd=0.05
でベイズの階層モデルを組んでみるかな。
184132人目の素数さん
2020/03/31(火) 15:45:31.45ID:2llZ2I8j >>183
そのβ分布を弱情報事前分布に設定して、乱数発生させて計算すると
54000人で99%信頼区間の幅の分布は
> summary(s2w(54000))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.008144 0.009912 0.009981 0.009927 0.010005 0.010011
となるから、まあ、概ねあっていると思うな。
そのβ分布を弱情報事前分布に設定して、乱数発生させて計算すると
54000人で99%信頼区間の幅の分布は
> summary(s2w(54000))
Min. 1st Qu. Median Mean 3rd Qu. Max.
0.008144 0.009912 0.009981 0.009927 0.010005 0.010011
となるから、まあ、概ねあっていると思うな。
185132人目の素数さん
2020/03/31(火) 17:50:11.35ID:ncBHjUEo 最も重要なファクターは事前感染率。
事前感染率はいくらに設定したの?
偽陽性が調査対象の10パーセント程含まれる。
医者が怪しいと判断した場合にのみ検査をする場合は、真陽性が調査対象の数十パーセントが期待できる。
このような場合は、真陽性は偽陽性より多数であることが期待でき、検査対象の正確な感染率は把握できるが、
「日本人1億2680万人からX人を無作為に抽出」のような方法だと、感染率0.01%(←現在確認できている感染者の
7倍程度が実際の感染者数に相当)辺りが妥当だと思われるが、この場合、五万人調査して、真陽性5人、偽陽性5000人
のような数字が出てくる。感染率0.02%だったとすると、真陽性10人、偽陽性5000人だ。
中央値のみで判断すると、例えば、5005人の陽性が出ると、0.01%で、5010人の陽性者が出ると0.02% のような
データが出てくる。誤差との見極めは困難。
このような数字から、信頼できる感染率が出せるのか?
事前感染率はいくらに設定したの?
偽陽性が調査対象の10パーセント程含まれる。
医者が怪しいと判断した場合にのみ検査をする場合は、真陽性が調査対象の数十パーセントが期待できる。
このような場合は、真陽性は偽陽性より多数であることが期待でき、検査対象の正確な感染率は把握できるが、
「日本人1億2680万人からX人を無作為に抽出」のような方法だと、感染率0.01%(←現在確認できている感染者の
7倍程度が実際の感染者数に相当)辺りが妥当だと思われるが、この場合、五万人調査して、真陽性5人、偽陽性5000人
のような数字が出てくる。感染率0.02%だったとすると、真陽性10人、偽陽性5000人だ。
中央値のみで判断すると、例えば、5005人の陽性が出ると、0.01%で、5010人の陽性者が出ると0.02% のような
データが出てくる。誤差との見極めは困難。
このような数字から、信頼できる感染率が出せるのか?
186132人目の素数さん
2020/04/01(水) 07:44:43.76ID:xwYPMdxl >>185
一様分布
一様分布
187132人目の素数さん
2020/04/01(水) 07:48:29.51ID:xwYPMdxl 確率の分布を考えずにスポットで考える思考のやつとは議論にならんな。
ベイズ階層モデルやったことないの?
ベイズ階層モデルやったことないの?
188132人目の素数さん
2020/04/01(水) 09:12:32.13ID:bZbNlxPT 0%〜100% までの一様分布のようだな。
つまり、事前確率全く不明だから、1/2教の経典に従い、0.5=50%でやったということ。
医者が検査を行った方がよいと判断した集団でも、なかなか有病率50%はいかない。
そのような結果は、無作為抽出で必要なの調査人数はどれくらいか等という議論では使えない。
全住民を対象にした無作為抽出なら、十万人に一人 以上いる(いた)のは確実だった一方、
百人に一人 という程たくさんはいないだろう と見積もれる。0.001%〜1% 辺りで行うべき。
ちょっと考えれば判ることを指摘しているに過ぎない。
調査対象の有病率0.01以下の集団に対し、特異度90%の性能の機器で調査しても、ほとんどがエラー。
せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。
特異度99.99%の機器を用意するか、でなければ、有病率を10パーセント程度以上に煮詰めてからやれというお話。
つまり、事前確率全く不明だから、1/2教の経典に従い、0.5=50%でやったということ。
医者が検査を行った方がよいと判断した集団でも、なかなか有病率50%はいかない。
そのような結果は、無作為抽出で必要なの調査人数はどれくらいか等という議論では使えない。
全住民を対象にした無作為抽出なら、十万人に一人 以上いる(いた)のは確実だった一方、
百人に一人 という程たくさんはいないだろう と見積もれる。0.001%〜1% 辺りで行うべき。
ちょっと考えれば判ることを指摘しているに過ぎない。
調査対象の有病率0.01以下の集団に対し、特異度90%の性能の機器で調査しても、ほとんどがエラー。
せめて 有病率 は、 1-特異度 と同じオーダーか、1-特異度 より大きくないと、扱えない。
特異度99.99%の機器を用意するか、でなければ、有病率を10パーセント程度以上に煮詰めてからやれというお話。
189132人目の素数さん
2020/04/01(水) 09:19:12.86ID:deMoC1lt >>188
東京都の行政検査では陽性率が50%を越える日があるぞ。
東京都の行政検査では陽性率が50%を越える日があるぞ。
190132人目の素数さん
2020/04/01(水) 09:26:31.89ID:deMoC1lt 有病率の事前分布を一様分布として
日々の陽性数は二項分布に従うとして
オリンピック延期決定後の検査を受けた集団での有病率をMCMC出だすと
(感度特異度は既述のβ分布を仮定)
> subjects=c(74,95,87,143,244,330)
> positives=c(17,41,47,40,63,68)
> PCRs3(subjects,positives,iter=10000,warmup=1000)
mean lower upper
0.37288732 0.09822213 0.63719043
日々の陽性数は二項分布に従うとして
オリンピック延期決定後の検査を受けた集団での有病率をMCMC出だすと
(感度特異度は既述のβ分布を仮定)
> subjects=c(74,95,87,143,244,330)
> positives=c(17,41,47,40,63,68)
> PCRs3(subjects,positives,iter=10000,warmup=1000)
mean lower upper
0.37288732 0.09822213 0.63719043
191132人目の素数さん
2020/04/01(水) 09:31:13.39ID:deMoC1lt >>188
別に有病率を(0,0.1)の一様分布にしても計算できるけど
都の行政検査も陽性率が50%を越える日もあったから一様分布でいいと思うね。行政検査に回った集団の話だけど。
感度・特異度も弱情報事前分布が設定できる。
別に有病率を(0,0.1)の一様分布にしても計算できるけど
都の行政検査も陽性率が50%を越える日もあったから一様分布でいいと思うね。行政検査に回った集団の話だけど。
感度・特異度も弱情報事前分布が設定できる。
192132人目の素数さん
2020/04/01(水) 09:33:18.24ID:deMoC1lt 一変数のポイント確率しか計算できない奴との議論は不毛だね。
193132人目の素数さん
2020/04/01(水) 09:43:53.68ID:HHJL1yTu 結局なんの疫学データにも基づかない、疫学データで追試することもできない、なんの理論的根拠もない統計仮説下のお話なんて統計学、疫学できないな意味なんかないんだよな。
計算機で遊んでる以上の意味なんかない。
計算機で遊んでる以上の意味なんかない。
194132人目の素数さん
2020/04/01(水) 09:46:36.01ID:bZbNlxPT195132人目の素数さん
2020/04/01(水) 12:55:21.15ID:xwYPMdxl >>193
計算機で遊ぶこともできずに電卓で計算して必死で書いていて虚しくない?
CTの診断能を検討した論文。
https://doi.org/10.1148/radiol.2020200823
誰でも鑑別できるのか疑問に思った
このペーパのTable 3に3人の読影医の結果が載っている。
TP FP TN FN sen spc PPV NPV accuracy
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60
陽性尤度比、陰性尤度比、Diagnostic Odd Ratio(陽性尤度比/陰性尤度比)を計算して加えると
TP FP TN FN sen spc PPV NPV acc PLR NLR DOR
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83 11.4 0.30 38
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80 6.1 0.32 19
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60 1.2 0.25 5
PPV,accuracy,DORから読影医3が劣っているようにみえる。
PPVで三者を検定してみる。多重比較になるので一番厳しいBonferri法で補正
Pairwise comparisons using Pairwise comparison of proportions
data: TP out of TP + FP
1 2
2 0.4 -
3 1e-15 2e-11
明らかに3が劣っている。
計算機で遊ぶこともできずに電卓で計算して必死で書いていて虚しくない?
CTの診断能を検討した論文。
https://doi.org/10.1148/radiol.2020200823
誰でも鑑別できるのか疑問に思った
このペーパのTable 3に3人の読影医の結果が載っている。
TP FP TN FN sen spc PPV NPV accuracy
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60
陽性尤度比、陰性尤度比、Diagnostic Odd Ratio(陽性尤度比/陰性尤度比)を計算して加えると
TP FP TN FN sen spc PPV NPV acc PLR NLR DOR
1 158 13 192 61 0.72 0.94 0.92 0.76 0.83 11.4 0.30 38
2 157 24 181 62 0.72 0.88 0.87 0.74 0.80 6.1 0.32 19
3 206 156 49 13 0.94 0.24 0.57 0.79 0.60 1.2 0.25 5
PPV,accuracy,DORから読影医3が劣っているようにみえる。
PPVで三者を検定してみる。多重比較になるので一番厳しいBonferri法で補正
Pairwise comparisons using Pairwise comparison of proportions
data: TP out of TP + FP
1 2
2 0.4 -
3 1e-15 2e-11
明らかに3が劣っている。
196132人目の素数さん
2020/04/01(水) 12:55:59.40ID:xwYPMdxl 読影医1,2を加算して計算すると
感度72% [67-76]
特異度91% [88-94]
という結果が得られた。
しかし、現実には何でもコロナと診断する傾向のある読影医3も紛れこむからこういう読影医も加算して計算しないと現実的でないね。
問題
3人を統合したときの感度・特異度とその95%信頼区間を述べよ。
感度72% [67-76]
特異度91% [88-94]
という結果が得られた。
しかし、現実には何でもコロナと診断する傾向のある読影医3も紛れこむからこういう読影医も加算して計算しないと現実的でないね。
問題
3人を統合したときの感度・特異度とその95%信頼区間を述べよ。
197132人目の素数さん
2020/04/01(水) 12:59:59.63ID:YULTPcko 昔パソコンは習うより慣れろ、理屈なんかわからなくても使ってたらわかるってのがあったけど、まさに正反対の方向にダメダメだな。
学問に対するなんの畏敬の念もない。
学問に対するなんの畏敬の念もない。
198132人目の素数さん
2020/04/01(水) 13:08:31.65ID:xwYPMdxl199132人目の素数さん
2020/04/01(水) 13:14:52.37ID:xwYPMdxl Housefield数の計算原理がわからなくても
この画像が新型コロナ肺炎かどうか、診断できる方が有用なんだよな。
https://pubs.rsna.org/na101/home/literatum/publisher/rsna/journals/content/radiology/0/radiology.ahead-of-print/radiol.2020200823/20200309/images/medium/radiol.2020200823.fig3d.gif
中心極限定理の証明できなくても、学問への畏敬とかなくても、二項分布を正規分布で近似して計算できる。
この画像が新型コロナ肺炎かどうか、診断できる方が有用なんだよな。
https://pubs.rsna.org/na101/home/literatum/publisher/rsna/journals/content/radiology/0/radiology.ahead-of-print/radiol.2020200823/20200309/images/medium/radiol.2020200823.fig3d.gif
中心極限定理の証明できなくても、学問への畏敬とかなくても、二項分布を正規分布で近似して計算できる。
200132人目の素数さん
2020/04/01(水) 18:34:14.58ID:zMY/D89k201132人目の素数さん
2020/04/02(木) 06:13:09.84ID:+vJJzaTC >>200
サンプルサイズは期待値の信頼区間幅に影響するけど期待値そのものに影響しないってことでは?
サンプルサイズは期待値の信頼区間幅に影響するけど期待値そのものに影響しないってことでは?
202132人目の素数さん
2020/04/02(木) 09:26:20.10ID:mzm7EAoV 市中感染率が増加の時はもちろんそうだが、一定、あるいは、減少傾向であっても、
経過日数が多くなれば、感染者数は多くなる。
例えば、十日に一人有名人の感染が報告されるというのが継続されていたなら、感染率は一定と
考えられるが、それが、一週間に一人 → 五日に一人 → 三日に一人 → ほぼ毎日 →...
のように、報告されるペースに変化があると、感染率も変化していると考えられる。
経過日数が多くなれば、感染者数は多くなる。
例えば、十日に一人有名人の感染が報告されるというのが継続されていたなら、感染率は一定と
考えられるが、それが、一週間に一人 → 五日に一人 → 三日に一人 → ほぼ毎日 →...
のように、報告されるペースに変化があると、感染率も変化していると考えられる。
203132人目の素数さん
2020/04/02(木) 09:30:08.05ID:mzm7EAoV 補足だが、あまりにも、有名人感染の報告頻度が多くなると、ニュースとしての価値が低くなり、
以前であったら報告されていたであろうケースが報告されなくなるということもあるので、
その辺も考慮して考える必要はある。
以前であったら報告されていたであろうケースが報告されなくなるということもあるので、
その辺も考慮して考える必要はある。
204132人目の素数さん
2020/04/03(金) 11:52:46.56ID:cch/ocoF 横浜市立大学データサイエンス学部佐藤彰洋教授のCOVID-19(新型肺炎)の感染拡大抑止に関する研究・検討資料内容を共有するページ
https://www.fttsus.jp/covinfo/#Tokyo
矢原 徹一:九州大学理学研究院教授の試算
https://jbpress.ismedia.jp/articles/-/59942
https://www.fttsus.jp/covinfo/#Tokyo
矢原 徹一:九州大学理学研究院教授の試算
https://jbpress.ismedia.jp/articles/-/59942
205132人目の素数さん
2020/04/04(土) 11:37:34.81ID:ZFu90Xbq SEIR MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R + nu*S(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
の微分方程式の数値解を使ってシミュレーション
対策しない(外出を控えず、マスクもしない)方が患者や死者は増えるけど早く収束するな。
contact_rate と trannsmission_probabilityを変化させてグラフにしてみた。
https://i.imgur.com/6OgJkDb.png
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R + nu*S(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
の微分方程式の数値解を使ってシミュレーション
対策しない(外出を控えず、マスクもしない)方が患者や死者は増えるけど早く収束するな。
contact_rate と trannsmission_probabilityを変化させてグラフにしてみた。
https://i.imgur.com/6OgJkDb.png
206132人目の素数さん
2020/04/04(土) 15:28:24.87ID:zerwqPau 一次産業ごと消滅していいならそうかもな
207132人目の素数さん
2020/04/05(日) 09:54:53.42ID:fV/kgtmE オリンピック延期決定以後の東京都の行政PCR検査での陽性率をグラフにすると
https://i.imgur.com/XMKErLV.png
(陽性数より検査件数の公表は2〜3日遅れる)
PCR検査は感度60%、特異度90%くらいなので検査を受けた集団の有病率はもっと多いはず。
感度(最頻値0.6 標準偏差0.1)、特異度(最頻値0.9 標準偏差0.05)のベータ分布に設定、有病率は(0,1)の一様分布でMCMCしたみた。
https://i.imgur.com/1ZkOk33.png
有病率40%くらいありそうだな。
https://i.imgur.com/XMKErLV.png
(陽性数より検査件数の公表は2〜3日遅れる)
PCR検査は感度60%、特異度90%くらいなので検査を受けた集団の有病率はもっと多いはず。
感度(最頻値0.6 標準偏差0.1)、特異度(最頻値0.9 標準偏差0.05)のベータ分布に設定、有病率は(0,1)の一様分布でMCMCしたみた。
https://i.imgur.com/1ZkOk33.png
有病率40%くらいありそうだな。
208132人目の素数さん
2020/04/05(日) 23:57:53.16ID:fV/kgtmE 新型コロナ肺炎に再感染があるとして流行具合をシミュレーションしてみた。
赤が感染者
上:再感染率0%
中:再感染率1%
下:再感染1%に治癒確率を5倍にする治療薬がある場合
https://i.imgur.com/nhCe0aZ.png
赤が感染者
上:再感染率0%
中:再感染率1%
下:再感染1%に治癒確率を5倍にする治療薬がある場合
https://i.imgur.com/nhCe0aZ.png
209132人目の素数さん
2020/04/06(月) 00:03:24.55ID:xOX4/rO7 >>208
準拠したモデルはこれ
SEIRS MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t) + rho*R(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R(t) + nu*S(t) - rho*R(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
rho:再感染率(R->S)
Rのスクリプトはここに置いた
https://egg.5ch.net/test/read.cgi/hosp/1584050953/417-420
準拠したモデルはこれ
SEIRS MODEL
dS(t)/dt = mu*(N-S) - b*S(t)*I(t)/N - nu*S(t) + rho*R(t)
dE(t)/dt = b*S(t)I(t)/N - (mu+sig)*E(t)
dI(t)/dt = sig*E(t) - (mu+g)*I(t)
dR(t)/dt = g*I(t) - mu*R(t) + nu*S(t) - rho*R(t)
mu:自然死亡率 b:感染率(S->I)
nu:ワクチン有効率(S->R) sig:発症率(E->I),g:回復率(I->R)
rho:再感染率(R->S)
Rのスクリプトはここに置いた
https://egg.5ch.net/test/read.cgi/hosp/1584050953/417-420
210132人目の素数さん
2020/04/06(月) 01:00:30.67ID:taqqH9Ce211132人目の素数さん
2020/04/06(月) 05:54:28.61ID:xOX4/rO7 >>210
検査を受けた集団の有病率の事前分布を(0,0.2)に設定して実行すると
https://i.imgur.com/QSd9OAj.png
MCMCで感度や特異度の事後分布が出せるのが面白い。
検査を受けた集団の有病率の事前分布を(0,0.2)に設定して実行すると
https://i.imgur.com/QSd9OAj.png
MCMCで感度や特異度の事後分布が出せるのが面白い。
212132人目の素数さん
2020/04/06(月) 08:06:29.84ID:xOX4/rO7 >>209
基本的に鎖国しているモデルだから、
入国者や出国者による人口増減とその保菌率・感染率を組み込んだモデルにしないと実態にそぐわないな。
昨今、輸入されているコロナの発症率・回復率などが異なるとすると益々、複雑なモデルになっちゃう。
基本的に鎖国しているモデルだから、
入国者や出国者による人口増減とその保菌率・感染率を組み込んだモデルにしないと実態にそぐわないな。
昨今、輸入されているコロナの発症率・回復率などが異なるとすると益々、複雑なモデルになっちゃう。
213132人目の素数さん
2020/04/06(月) 16:39:50.15ID:taqqH9Ce 死者数が少ないのは注目すべきことだけど、それもいつまで続くか、、、
発症から集中治療室に入るまで2週間弱。死ぬまでがさらに一週間。
ってことは、この2週間での感染者激増が死者数に反映するまで、
あと一週間かかるってこと。
重症者の激増もそろそろ始まることだと思われる。
検査数とか感染者数、重症者数etc.を可視化したデータってここくらいか?
https://toyokeizai.net/sp/visual/tko/covid19/
発症から集中治療室に入るまで2週間弱。死ぬまでがさらに一週間。
ってことは、この2週間での感染者激増が死者数に反映するまで、
あと一週間かかるってこと。
重症者の激増もそろそろ始まることだと思われる。
検査数とか感染者数、重症者数etc.を可視化したデータってここくらいか?
https://toyokeizai.net/sp/visual/tko/covid19/
214132人目の素数さん
2020/04/06(月) 17:50:09.18ID:taqqH9Ce 韓国は46万件の検査で感染者が1万人。
感染かどうかをどう確定したのか知らないけど、有病率が2%だと
すれば、特異度がよほど高くないと、陽性者のかなりの割合が
偽陽性ってことになりそう。
感染かどうかをどう確定したのか知らないけど、有病率が2%だと
すれば、特異度がよほど高くないと、陽性者のかなりの割合が
偽陽性ってことになりそう。
215132人目の素数さん
2020/04/06(月) 22:07:12.60ID:Sgr4CLg/ >>207
東京都は陽性者数は公表しても検査人数を迅速に公表しないのでRのパッケージAmeliaを使って多重代入法による欠測データ処理してみる。
#
subjects=c(74,95,87,143,244,330,41,145,164,469,NA,NA,NA)
positives=c(17,41,47,40,63,68,13,78,66,97,89,117,143)
(dataset=data.frame(subjects,positives))
# 検査実施人数を欠測データとしてAmeliaで推定
library(Amelia)
na.idx=which(is.na(subjects))
M=1000
set.seed(1234) ; a.out=amelia(dataset,m=M)
imp=a.out$imputations
NAsubject=NULL
for(i in 1:M){
NAsubject=rbind(NAsubject,imp[[i]][na.idx,1])
}
missing.data=round(apply(NAsubject,2,mean))
subjects[na.idx]=missing.data
PCRs3(subjects,positives,iter=10000,warmup=1000,verbose=TRUE)
行政検査例の有病率と95%信頼区間
mean lower upper
0.3745734 0.1048757 0.6575508
https://i.imgur.com/DxVNXad.png
東京都は陽性者数は公表しても検査人数を迅速に公表しないのでRのパッケージAmeliaを使って多重代入法による欠測データ処理してみる。
#
subjects=c(74,95,87,143,244,330,41,145,164,469,NA,NA,NA)
positives=c(17,41,47,40,63,68,13,78,66,97,89,117,143)
(dataset=data.frame(subjects,positives))
# 検査実施人数を欠測データとしてAmeliaで推定
library(Amelia)
na.idx=which(is.na(subjects))
M=1000
set.seed(1234) ; a.out=amelia(dataset,m=M)
imp=a.out$imputations
NAsubject=NULL
for(i in 1:M){
NAsubject=rbind(NAsubject,imp[[i]][na.idx,1])
}
missing.data=round(apply(NAsubject,2,mean))
subjects[na.idx]=missing.data
PCRs3(subjects,positives,iter=10000,warmup=1000,verbose=TRUE)
行政検査例の有病率と95%信頼区間
mean lower upper
0.3745734 0.1048757 0.6575508
https://i.imgur.com/DxVNXad.png
216132人目の素数さん
2020/04/07(火) 07:24:45.67ID:TwUCHcsI 4月5日の陽性者数が検査人数より多いのは単純ミス?
https://stopcovid19.metro.tokyo.lg.jp/
Ameliaでの欠測推測を確認しようと思ったのにもとのデータがあてにならない。
https://stopcovid19.metro.tokyo.lg.jp/
Ameliaでの欠測推測を確認しようと思ったのにもとのデータがあてにならない。
217132人目の素数さん
2020/04/07(火) 07:48:06.64ID:TwUCHcsI 晋型コロナ肺炎に感度0.9,特異度0.9の迅速検査が開発されたと仮定する。
日本人1億2595万人からX人を無作為抽出して有病率を推定したい。
有病率の99%信頼区間幅を1%以内で検定したい。
何人を抽出すれば十分といえるか?
日本人1億2595万人からX人を無作為抽出して有病率を推定したい。
有病率の99%信頼区間幅を1%以内で検定したい。
何人を抽出すれば十分といえるか?
218132人目の素数さん
2020/04/07(火) 08:24:28.18ID:TwUCHcsI >>76
感度0.6 特異度0.9として1000人検査したときはの有病率の99%信頼区間幅は何%以内におさまるか?
感度0.6 特異度0.9として1000人検査したときはの有病率の99%信頼区間幅は何%以内におさまるか?
219132人目の素数さん
2020/04/07(火) 10:09:26.39ID:/UNISUK0220132人目の素数さん
2020/04/07(火) 20:47:10.10ID:/iaYsYaQ https://imgur.com/3TTYKk8
スプレッドシートのgrowthで予測してみると、9月には人類滅亡しそうです。
元データは
https://www.worldometers.info/coronavirus/coronavirus-death-toll/
スプレッドシートのgrowthで予測してみると、9月には人類滅亡しそうです。
元データは
https://www.worldometers.info/coronavirus/coronavirus-death-toll/
221132人目の素数さん
2020/04/07(火) 21:10:10.27ID:TwUCHcsI ソース不明な数字だけど
"名前:名無しさん@1周年[sage] 投稿日:2020/04/07(火) 20:29:49.57 ID:GcsEpAfR0 (PC)
他国の総感染者数が今の日本と同程度の時の死者数
イタリア, 感染3089人 死者107人
スペイン, 感染2965人 死者 84人
アメリカ, 感染3499人 死者 64人
イラン , 感染3513人 死者107人
フランス, 感染3661人 死者 79人
日本 , 感染3123人 死者 77人
"
country=c('イタリア','スペイン','アメリカ','イラン','フランス','日本')
infected=c(3089,2965,3499,3513,3661,3123)
dead=c(107,84,64,107,79,77)
df=data.frame(country,dead,infected)
df
re.lm=lm(dead~infected,data=df)
summary(re.lm)
chisq.test(dead,infected)
names(infected)=country
names(dead)=country
pairwise.prop.test(dead,infected)
> chisq.test(dead,infected)
Pearson's Chi-squared test
data: dead and infected
X-squared = 24, df = 20, p-value = 0.2424
Warning message:
In chisq.test(dead, infected) : Chi-squared approximation may be incorrect
> pairwise.prop.test(dead,infected)
Pairwise comparisons using Pairwise comparison of proportions
data: dead out of infected
イタリア スペイン アメリカ イラン フランス
スペイン 1.00000 - - - -
アメリカ 0.00066 0.11005 - - -
イラン 1.00000 1.00000 0.01762 - -
フランス 0.01843 0.79242 1.00000 0.24130 -
日本 0.24724 1.00000 0.79242 1.00000 1.00000
P value adjustment method: holm
"名前:名無しさん@1周年[sage] 投稿日:2020/04/07(火) 20:29:49.57 ID:GcsEpAfR0 (PC)
他国の総感染者数が今の日本と同程度の時の死者数
イタリア, 感染3089人 死者107人
スペイン, 感染2965人 死者 84人
アメリカ, 感染3499人 死者 64人
イラン , 感染3513人 死者107人
フランス, 感染3661人 死者 79人
日本 , 感染3123人 死者 77人
"
country=c('イタリア','スペイン','アメリカ','イラン','フランス','日本')
infected=c(3089,2965,3499,3513,3661,3123)
dead=c(107,84,64,107,79,77)
df=data.frame(country,dead,infected)
df
re.lm=lm(dead~infected,data=df)
summary(re.lm)
chisq.test(dead,infected)
names(infected)=country
names(dead)=country
pairwise.prop.test(dead,infected)
> chisq.test(dead,infected)
Pearson's Chi-squared test
data: dead and infected
X-squared = 24, df = 20, p-value = 0.2424
Warning message:
In chisq.test(dead, infected) : Chi-squared approximation may be incorrect
> pairwise.prop.test(dead,infected)
Pairwise comparisons using Pairwise comparison of proportions
data: dead out of infected
イタリア スペイン アメリカ イラン フランス
スペイン 1.00000 - - - -
アメリカ 0.00066 0.11005 - - -
イラン 1.00000 1.00000 0.01762 - -
フランス 0.01843 0.79242 1.00000 0.24130 -
日本 0.24724 1.00000 0.79242 1.00000 1.00000
P value adjustment method: holm
222132人目の素数さん
2020/04/08(水) 00:23:04.14ID:KlmY0AUa アメリカの致死率高くない?
現時点での死者数と感染者数からだと3%くらいなんだが、これは
見かけ上の数値で、実際には発症から死亡まで2週間以上かかかる
から、10日くらい前の感染者数を分母にしないと見誤る。
で、このタイムラグを考慮にいれると少なくとも10%くらいの致死率
になりそ。日本の2,3倍になる計算だ。
現時点での死者数と感染者数からだと3%くらいなんだが、これは
見かけ上の数値で、実際には発症から死亡まで2週間以上かかかる
から、10日くらい前の感染者数を分母にしないと見誤る。
で、このタイムラグを考慮にいれると少なくとも10%くらいの致死率
になりそ。日本の2,3倍になる計算だ。
223132人目の素数さん
2020/04/08(水) 00:27:12.88ID:KlmY0AUa224132人目の素数さん
2020/04/08(水) 19:19:57.90ID:gX6rmgSD >>223
感染から死亡までの期間は一定でないからどうだろね。
感染から死亡までの期間は一定でないからどうだろね。
225132人目の素数さん
2020/04/08(水) 19:24:23.22ID:gX6rmgSD SEIRモデルに再感染(免疫を失ってR からSへの変遷)があるとしてグラフ化してみた。
1万人に1人の感染者と9人の保菌者がいるとして、
再感染率0%のとき
https://i.imgur.com/XWzQN7I.png
再感染率0.1%(1000人に1人の割合で免疫を失う)場合
https://i.imgur.com/EdxIhMT.png
再感染率0.1%で外出自粛等で接触が8割減になった場合
https://i.imgur.com/sDppUfY.png
1万人に1人の感染者と9人の保菌者がいるとして、
再感染率0%のとき
https://i.imgur.com/XWzQN7I.png
再感染率0.1%(1000人に1人の割合で免疫を失う)場合
https://i.imgur.com/EdxIhMT.png
再感染率0.1%で外出自粛等で接触が8割減になった場合
https://i.imgur.com/sDppUfY.png
226132人目の素数さん
2020/04/09(木) 01:14:30.66ID:m5ECJkjO >>224
まあ、発症してすぐ感染が発覚するわけでもないから、
症状がある程度続いてから陽性判定されるとすれば、
10日前後のディレイかな。しかも、どのくらいの分散
かわかんないけど、正規分布で畳み込んだ感じで。
まあ、発症してすぐ感染が発覚するわけでもないから、
症状がある程度続いてから陽性判定されるとすれば、
10日前後のディレイかな。しかも、どのくらいの分散
かわかんないけど、正規分布で畳み込んだ感じで。
227132人目の素数さん
2020/04/09(木) 02:02:32.53ID:m5ECJkjO 英国もフランスも致死率高いな。
のきなみ10%越え。
のきなみ10%越え。
228132人目の素数さん
2020/04/09(木) 02:09:10.50ID:NyLklR2N 英国とフランスは医療崩壊してるの?
229132人目の素数さん
2020/04/09(木) 09:37:43.05ID:m5ECJkjO しらんがな
230132人目の素数さん
2020/04/09(木) 11:57:57.57ID:cpUiyQfM これこそ、国を守るってことだな。
キューバ政府は2020年3月24日(火)以降、外国人観光客の入国を認めないと発表しました。
キューバに入国できるのは居住者のみで、これには出張で短期または長期滞在する外国人も含まれます。
加えて、キューバに入国する人は全員14日間隔離されます。
商業活動は維持されますが、商船や航空機の乗務員の移動は制限されます。キューバの領空は封鎖されません。
今回の制限措置は30日間有効で、状況に応じて延長される可能性もあります。
キューバ政府は2020年3月24日(火)以降、外国人観光客の入国を認めないと発表しました。
キューバに入国できるのは居住者のみで、これには出張で短期または長期滞在する外国人も含まれます。
加えて、キューバに入国する人は全員14日間隔離されます。
商業活動は維持されますが、商船や航空機の乗務員の移動は制限されます。キューバの領空は封鎖されません。
今回の制限措置は30日間有効で、状況に応じて延長される可能性もあります。
231132人目の素数さん
2020/04/09(木) 12:26:32.60ID:cpUiyQfM >>216
オリンピック延期決定以降のデータで検討
陽性人数が検査人数を上回るデータは検査人数を欠測データ(NA)として計算する。
dates subjects positives
1 2020-03-24 74 17
2 2020-03-25 95 41
3 2020-03-26 87 47
4 2020-03-27 143 40
5 2020-03-28 244 63
6 2020-03-29 330 68
7 2020-03-30 41 13
8 2020-03-31 145 78
9 2020-04-01 164 66
10 2020-04-02 469 97
11 2020-04-03 551 89
12 2020-04-04 NA 117
13 2020-04-05 NA 143
14 2020-04-06 356 83
15 2020-04-07 271 79
16 2020-04-08 NA 144
その設定で
# LittleのMCAR検定 データが MCAR または MAR であるという帰無仮説のもとで検定
library(BaylorEdPsych)
LittleMCAR(dataset)$p.value
LittleMCAR(dataset)$p.value
this could take a while[1] 0.004907289
有意差がでて出鼻をくじかれた
オリンピック延期決定以降のデータで検討
陽性人数が検査人数を上回るデータは検査人数を欠測データ(NA)として計算する。
dates subjects positives
1 2020-03-24 74 17
2 2020-03-25 95 41
3 2020-03-26 87 47
4 2020-03-27 143 40
5 2020-03-28 244 63
6 2020-03-29 330 68
7 2020-03-30 41 13
8 2020-03-31 145 78
9 2020-04-01 164 66
10 2020-04-02 469 97
11 2020-04-03 551 89
12 2020-04-04 NA 117
13 2020-04-05 NA 143
14 2020-04-06 356 83
15 2020-04-07 271 79
16 2020-04-08 NA 144
その設定で
# LittleのMCAR検定 データが MCAR または MAR であるという帰無仮説のもとで検定
library(BaylorEdPsych)
LittleMCAR(dataset)$p.value
LittleMCAR(dataset)$p.value
this could take a while[1] 0.004907289
有意差がでて出鼻をくじかれた
232132人目の素数さん
2020/04/09(木) 14:54:07.49ID:pa+n/S2z233132人目の素数さん
2020/04/10(金) 00:25:10.35ID:EjAtBG4Z 日本もすでに欧州同様指数関数ラインにのってる模様、
https://i.imgur.com/qAJa2Ty.png
欧州並になるのは文字通り時間の問題かと
日本のコロナ感染発覚者数
3月24日 1193
3月25日 1307
3月26日 1387
3月27日 1499
3月28日 1693
3月29日 1866
3月30日 1953
3月31日 2178
4月 1日 2384
4月 2日 2617
4月 3日 2935
4月 4日 3139
4月 5日 3654
4月 6日 3906
4月 7日 4257
4月 8日 4667
オリンピック延期決定した3月24日をDay1として線形回帰すると
https://i.imgur.com/Q45Xo8V.png
y=c(1193,1307,1387,1499,1693,1866,1953,2178,2384,2617,2935,3139,3654,3906,4257,4667)
z=as.Date("2020-03-24")+ 0:(length(y)-1)
plot(z,y,bty='l',pch=19)
x=1:length(y)
plot(x,y,bty='l')
(re.lm=lm(log(y)~x))
b0=re.lm$coef[1]
b1=re.lm$coef[2]
names(b0)=''
f <- function(x) exp(b0)*exp(b1*x) # 1059.063*exp(0.09231543*x)
curve(f(x),add=T)
n=1:50
plot(n,f(n),bty='l')
f1 <- function(y) print(log(y*exp(-b0))/b1 + as.Date("2020-03-24"),quote=F)
f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
感染者が5千、1万、5万、10万、50万、百万、1千万、1億、1億2595万人に達する日は
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
[1] 2020-04-09 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28
https://i.imgur.com/qAJa2Ty.png
欧州並になるのは文字通り時間の問題かと
日本のコロナ感染発覚者数
3月24日 1193
3月25日 1307
3月26日 1387
3月27日 1499
3月28日 1693
3月29日 1866
3月30日 1953
3月31日 2178
4月 1日 2384
4月 2日 2617
4月 3日 2935
4月 4日 3139
4月 5日 3654
4月 6日 3906
4月 7日 4257
4月 8日 4667
オリンピック延期決定した3月24日をDay1として線形回帰すると
https://i.imgur.com/Q45Xo8V.png
y=c(1193,1307,1387,1499,1693,1866,1953,2178,2384,2617,2935,3139,3654,3906,4257,4667)
z=as.Date("2020-03-24")+ 0:(length(y)-1)
plot(z,y,bty='l',pch=19)
x=1:length(y)
plot(x,y,bty='l')
(re.lm=lm(log(y)~x))
b0=re.lm$coef[1]
b1=re.lm$coef[2]
names(b0)=''
f <- function(x) exp(b0)*exp(b1*x) # 1059.063*exp(0.09231543*x)
curve(f(x),add=T)
n=1:50
plot(n,f(n),bty='l')
f1 <- function(y) print(log(y*exp(-b0))/b1 + as.Date("2020-03-24"),quote=F)
f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
感染者が5千、1万、5万、10万、50万、百万、1千万、1億、1億2595万人に達する日は
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8))
[1] 2020-04-09 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28
234132人目の素数さん
2020/04/10(金) 06:57:42.69ID:EjAtBG4Z >>233
1日ずれていた。
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8,77e8))
[1] 2020-04-10 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28 2020-09-10
世界の人口77億人にたっするのは9月10日となった。
1日ずれていた。
> f1(c(5000,1e4,5e4,1e5,5e5,1e6,1e7,1e8,1.2595e8,77e8))
[1] 2020-04-10 2020-04-17 2020-05-04 2020-05-12 2020-05-29
[6] 2020-06-06 2020-07-01 2020-07-26 2020-07-28 2020-09-10
世界の人口77億人にたっするのは9月10日となった。
235132人目の素数さん
2020/04/10(金) 07:03:11.67ID:EjAtBG4Z236132人目の素数さん
2020/04/10(金) 07:18:35.21ID:EjAtBG4Z https://toyokeizai.net/sp/visual/tko/covid19/
のデータ使って
全国と東京の線形回帰の係数を比べると
全国
Call:
lm(formula = log(y) ~ x)
Coefficients:
(Intercept) x
6.84962 0.09253
東京
Coefficients:
(Intercept) x
5.1707 0.1332
東京の方が感染者増加速度が速いね。
東京都の人口13,951,636(令和2年1月1日現在) に達する日は
> f1(13951636)
2020-06-15
となった。
のデータ使って
全国と東京の線形回帰の係数を比べると
全国
Call:
lm(formula = log(y) ~ x)
Coefficients:
(Intercept) x
6.84962 0.09253
東京
Coefficients:
(Intercept) x
5.1707 0.1332
東京の方が感染者増加速度が速いね。
東京都の人口13,951,636(令和2年1月1日現在) に達する日は
> f1(13951636)
2020-06-15
となった。
237132人目の素数さん
2020/04/10(金) 07:23:05.91ID:EjAtBG4Z 今日の東京の感染者予想人数は
> d2i("2020-4-10")
daily total
241.1515 1934.2759
> d2i("2020-4-10")
daily total
241.1515 1934.2759
238132人目の素数さん
2020/04/10(金) 11:19:37.42ID:oS02oOtl239132人目の素数さん
2020/04/10(金) 11:22:37.55ID:wWOTJ0FB >>238
だから何なの?
だから何なの?
240132人目の素数さん
2020/04/10(金) 11:47:04.58ID:EjAtBG4Z241132人目の素数さん
2020/04/10(金) 12:02:00.39ID:K2O0fmDQ242132人目の素数さん
2020/04/10(金) 12:04:52.16ID:K2O0fmDQ 有名人の感染がボチボチ出てくるってことは、市中感染率も
それなりに高いんだろうな。0.1%は超えてそう。
それなりに高いんだろうな。0.1%は超えてそう。
243132人目の素数さん
2020/04/10(金) 14:27:39.01ID:XjWf1V4z >>242
120万人罹患してるってこと?
発症者が5000人いってないのに?
発症率0.4%しかない雑魚ウィルスならサイトカインストームなんて起こさないでしょ?
これウィルスが強すぎて免疫系が異常に発動して起こるもんらしいから。
120万人罹患してるってこと?
発症者が5000人いってないのに?
発症率0.4%しかない雑魚ウィルスならサイトカインストームなんて起こさないでしょ?
これウィルスが強すぎて免疫系が異常に発動して起こるもんらしいから。
244132人目の素数さん
2020/04/10(金) 14:29:22.80ID:XjWf1V4z あ、0.1%か。
12万人で発症率4%。
どのみちないだろな。
12万人で発症率4%。
どのみちないだろな。
245132人目の素数さん
2020/04/10(金) 14:58:22.90ID:K2O0fmDQ >>244
0.1%ってのはあくまで都内や大阪を想定した推測ね。
0.1%ってのはあくまで都内や大阪を想定した推測ね。
246132人目の素数さん
2020/04/10(金) 15:52:37.05ID:Qxo2/Tvi247132人目の素数さん
2020/04/11(土) 01:01:52.46ID:g/e7gi/j そういうミスは統計資料にはつきもの。それでもデータさえ
多ければ大勢に影響なし。
多ければ大勢に影響なし。
248132人目の素数さん
2020/04/11(土) 06:07:34.88ID:Dikmq831 >>8
優秀ですね
優秀ですね
249132人目の素数さん
2020/04/11(土) 13:47:45.91ID:mKhDXvLi 東京都のこのデータを使って
https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
オリンピック延期決定前後で陽性者の増え方に違いがあるかをグラフにしてみた。
https://i.imgur.com/DG2Kohu.png
黒塗り丸が延期決定前で黒線がその回帰曲線1日毎に1.078594 倍に増加
赤丸が延期決定後で赤線がその回帰曲線 1日毎に1.136801 倍に増加
青は全体での回帰曲線 1日毎に1.088687 倍に増加
https://stopcovid19.metro.tokyo.lg.jp/data/130001_tokyo_covid19_patients.csv
オリンピック延期決定前後で陽性者の増え方に違いがあるかをグラフにしてみた。
https://i.imgur.com/DG2Kohu.png
黒塗り丸が延期決定前で黒線がその回帰曲線1日毎に1.078594 倍に増加
赤丸が延期決定後で赤線がその回帰曲線 1日毎に1.136801 倍に増加
青は全体での回帰曲線 1日毎に1.088687 倍に増加
250132人目の素数さん
2020/04/11(土) 15:33:13.43ID:mKhDXvLi >>247
集計ミスじゃなくて、集計デザインそのものに問題があるよ。
陽性数は東京都全部の集計なのに、検査数は行政検査だけで指定医療機関での検査を除外している集計している。
これじゃ陽性率から有病率を推測するのも不可能。
集計ミスじゃなくて、集計デザインそのものに問題があるよ。
陽性数は東京都全部の集計なのに、検査数は行政検査だけで指定医療機関での検査を除外している集計している。
これじゃ陽性率から有病率を推測するのも不可能。
251132人目の素数さん
2020/04/11(土) 17:18:33.74ID:HlGO5aHy 風邪ひいたみたい。感染予防には抜かりはないのに、
252132人目の素数さん
2020/04/11(土) 21:40:53.17ID:vjB1aI8B ランダムに検査して、感染者数を推定してほしいんだけな
253132人目の素数さん
2020/04/12(日) 09:01:25.70ID:uhjyERyF オーストリアがやったらしいよ。
それによりますと、全体のおよそ0.3%が陽性と判定され、分析の結果、この時期に少なくとも1万200人、最大で6万7400人が感染していた可能性があることがわかったということです。
オーストリアの人口はおよそ890万人で、政府は最も可能性が高い数字として、この時期におよそ2万8500人が感染していたと推定しています。
それによりますと、全体のおよそ0.3%が陽性と判定され、分析の結果、この時期に少なくとも1万200人、最大で6万7400人が感染していた可能性があることがわかったということです。
オーストリアの人口はおよそ890万人で、政府は最も可能性が高い数字として、この時期におよそ2万8500人が感染していたと推定しています。
254132人目の素数さん
2020/04/12(日) 09:56:34.10ID:uhjyERyF >>253
コピペしそこなったけど、検査は1533人に施したそうだ。
感度100%、特異度100%の完璧な検査だったと仮定して、サンプルサイズ1500と
サンプル比率0.3%で、信頼度95%で推定すると母集団での比率は0.12%〜0.7%
くらいだと推定できるから、オーストリア政府発表と一致するね。そういう
単純な計算なのかねぇ?
コピペしそこなったけど、検査は1533人に施したそうだ。
感度100%、特異度100%の完璧な検査だったと仮定して、サンプルサイズ1500と
サンプル比率0.3%で、信頼度95%で推定すると母集団での比率は0.12%〜0.7%
くらいだと推定できるから、オーストリア政府発表と一致するね。そういう
単純な計算なのかねぇ?
255132人目の素数さん
2020/04/12(日) 10:02:10.44ID:uhjyERyF もひとつコピペし忘れた、判明している感染者数は12,200人ね。
特異度が100%って考えにくいから、まあ、結構な捕捉率じゃねーの?
>当時医療機関などで確認されていた感染者はおよそ1万2200人だったことから、
>政府は、実際に感染していた人は公表の2倍以上に上るとみられるとしています。
特異度が100%って考えにくいから、まあ、結構な捕捉率じゃねーの?
>当時医療機関などで確認されていた感染者はおよそ1万2200人だったことから、
>政府は、実際に感染していた人は公表の2倍以上に上るとみられるとしています。
■ このスレッドは過去ログ倉庫に格納されています
ニュース
- 【W杯】日本と同組のオランダ5発完勝で暫定首位に ハクポ、ブロビーが2発 スウェーデンを圧倒 [ゴアマガラ★]
- 【W杯】日本と同組のオランダ5発完勝で暫定首位に ハクポ、ブロビーが2発 スウェーデンを圧倒★2 [ゴアマガラ★]
- 【サッカー】日本戦の交代策に批判殺到… オランダ代表監督・クーマン「ミスをしたのは私だ。大人として責任を受け入れる」 [冬月記者★]
- 【節約】物価高でも「食費月1万円」は可能? 月7000円台、レバーと100円キャベツで回す強者も★4 [ひぃぃ★]
- 【芸能】田中みな実、500円のイヤリング付けていた堀井美香に「500円のは500円に見えます。だから、ある程度いい物を」 [冬月記者★]
- 【サッカーW杯】『恋人にしたい日本代表選手』ランキング発表! 5位 中村敬斗、4位 久保建英、3位 堂安律、2位 田中碧、1位は……? [冬月記者★]
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★118【メキシコ/カナダ/アメリカ】
- 【地上波/DAZNほか】 FIFAワールドカップ2026 総合スレ★117【メキシコ/カナダ/アメリカ】
- ハム専 気合入れていけ、ファイターズ
- はません ワッチョイ
- 西武線 3
- 巨専】 祝勝会
- 【FIFAワールドカップ2026】F組オランダ×スウェーデン2:00(NHK1:45~,DAZN),E組ドイツ×コートジボワール5:00(日本テレビ4:40~,DAZN [226731781]
- たった200年前の人ってパンツにウンコカス付けたまま外を歩いてたんだろ?
- 【画像】抜いたケツ毛を半年集めてひじき丼作った
- 新人「でもAIはこう回答してます!」 俺「いいから」
- 土日のこんな時間から牛丼屋で飯食ってる奴らなんなん?
- 大人気作品、「ぼくの彼女はアマゾネス」がついに書籍化決定!