探検


数学 統計に詳しい人が語るコロナウイルス

■ このスレッドは過去ログ倉庫に格納されています
1132人目の素数さん
垢版 |
2020/02/29(土) 02:18:41.53ID:twdO677Q
東大数学科卒の元官僚はこう分析してるが、お前らはどうなると思う?

http://www.zakzak.co.jp/soc/news/200220/dom2002200003-n2.html

中国国外感染者の中国国内との比率をみると、
1月20日の数字公表以降は、0・8〜2・6%で比較的安定している。
これは、新型肺炎の感染者のほとんどは中国国内、それも湖北省に集中しているからだ。
ちなみに中国国外での感染者数は、中国国内の1・1%だ(2月16日現在)。
本コラムで紹介したが、現時点では、最終的な中国国内の感染者数は20万人超と筆者は推計している。
となると、中国国外の感染者は数千人程度になるだろう。
中国国外のうち日本の比率は1割弱なので、日本の感染者数は数百人程度であろう。
その場合、死者も数人から10人程度になるだろう。

こうした推計をすると、今の感染者は氷山の一角だと思われるが、今後の増加ペースはどうなるだろうか。
新型コロナウイルスの検査は簡単に行えるので、今後、日本での感染者数は増えていくだろう。
ある時点ではそれがネズミ算的に増えるかのように思える局面もあるだろうが、
筆者の推計が正しければ、現時点ではせいぜい数百人が一つのメドだ。
2020/05/18(月) 14:04:29.41ID:jxOnYm2h
>>551
何ですかそれは?
2020/05/18(月) 14:08:09.39ID:1P7V5xJn
>>550
正確にはキャバ嬢がXより先に感染していた確率だな。
2020/05/18(月) 14:08:59.46ID:1P7V5xJn
>>552
確率分布が対称じゃないときの信頼区間
2020/05/18(月) 14:13:34.68ID:1P7V5xJn
>>554
こんな感じ。https://i.imgur.com/C8jOPlx.jpg
2020/05/18(月) 14:26:48.33ID:jxOnYm2h
>>554
ただ、それだとそもそもモードに近いとこをやってます。
信頼区間は密度関数を横に切るのではなく両裾を縦に切ってハズレ部分が1-λになるようにするので少しイメージが違うしきがします。
モードなのかメジアンなのかの違いです。
いずれにせよ、こうやればいいという拡張のための俺様ルールを設定するのはいくらでもできますが、統計の話なのでそんな俺様ルールについて語っても意味ありません。
2020/05/18(月) 15:34:14.71ID:1P7V5xJn
>>556
単峰性の場合、信頼区間幅が最小になるのがHighest Density Interval

>550なら
HDI
> HDInterval::hdi(x)[1:2]
lower upper
0.5822687 12.5635525

分位数
> quantile(x,c(0.025,0.975))
2.5% 97.5%
1.148711 15.334698

HDIの方が幅が小さい。
2020/05/18(月) 15:36:39.83ID:jxOnYm2h
>>557
???
2020/05/18(月) 15:44:16.03ID:jxOnYm2h
ああ、わかった。HDIやCIの意味を誤解してませんか?
HDIでググって調べたらコレ↓ですよ。

https://rindalog.blogspot.com/2015/10/hdi-highest-density-interval.html?m=1
560132人目の素数さん
垢版 |
2020/05/18(月) 19:32:28.41ID:4BbElJo8
>>179
単にお勉強ができただけ。
頭が良くないのさ。
自分の頭で物事を考えるってことができない。
561132人目の素数さん
垢版 |
2020/05/18(月) 19:34:11.31ID:4BbElJo8
>>181
その通り。
具体的には理学部の数学科と物理学科。
工学部にも時々もの凄いのがいる。
2020/05/18(月) 19:49:54.23ID:1P7V5xJn
>>559
いや、Rのパッケージ HDIntervalで計算しているから誤解していないと思う。
内部の処理コードをみると信頼区間幅が最小になるのを最尤法で出しているね。
2020/05/18(月) 19:51:25.60ID:1P7V5xJn
>>561
ほんとうに頭のいい人は医学部でなく理学部か工学部に行く。
ほんとうに頭の悪い奴は底辺シリツ医大に行く。
シリツ医大には手先の器用な人もいるが、頭が器用な奴をみたことがない。
2020/05/18(月) 20:05:42.34ID:1P7V5xJn
>>550(自答)
#
# 人物dが発症してdelay日後に濃厚接触したキャバ嬢cが発症
# cの感染がdより先行していた確率は?
rm(list=ls())
stancode=
"
data{
real onset_delay;
real ln_par1;
real ln_par2;
}
parameters{
real <lower=0> d_incubation;
real <lower=0> c_incubation;
}
transformed parameters{
real infection_delay = onset_delay + d_incubation - c_incubation;
}
model{
d_incubation ~ lognormal(ln_par1,ln_par2);
c_incubation ~ lognormal(ln_par1,ln_par2);
}

"
model=stan_model(model_code = stancode)
#--- incubation period ---
# from Li et al NEJM 2020
# lognormal mean = 5.2
ln_par1 = 1.434065
ln_par2 = 0.6612
fn.stan <- function(delay, print=FALSE, ...){
dataList=list(onset_delay=delay,ln_par1=ln_par1,ln_par2=ln_par2)
fit=sampling(model,data=dataList, ...)
ms=rstan::extract(fit)
if(print) BEST::plotPost(ms$infection_delay,compVal=0,xlab='infection delay')
mean(ms$infection_delay < 0)
}
fn.stan(2,print=T,iter=5000,warmup=1000)
onset_delays=0:20
y=sapply(onset_delays,fn.stan)
plot(onset_delays,y, ylab='Pr[ Infected Later ])')

2日後の発症だと
> fn.stan(2,print=T,iter=5000,warmup=1000)
[1] 0.2945
3割くらいはあとから発症した方が先に感染していた可能性がある。
2020/05/18(月) 20:48:18.33ID:1P7V5xJn
Temporal dynamics in viral shedding and transmissibility of COVID-19
https://www.nature.com/articles/s41591-020-0869-5
のRのコード
https://github.com/ehylau/COVID-19/blob/master/Fig1c_Rscript.R

西浦モデルのコード
https://nbviewer.jupyter.org/github/contactmodel/COVID19-Japan-Reff/blob/master/scripts/C.%20Calculating%20the%20Rt%20in%20Stan.ipynb

から発症間時間(serial interval)の分布を重ねてみた。

https://i.imgur.com/vrnra5F.png
566132人目の素数さん
垢版 |
2020/05/18(月) 21:01:41.77ID:4BbElJo8
>>563
一方的で申し訳ないが私立大医学部は金持ちのバカ息子が行くイメージ。
567132人目の素数さん
垢版 |
2020/05/18(月) 21:02:26.04ID:4BbElJo8
西浦さんはさんざん適当なことを言って世論を煽ってどう責任を取るのかな?
2020/05/18(月) 21:18:52.42ID:AArRB0Ix
>>567
少なくとも西浦氏は算出コードを公開しているだけでも好感が持てる。
2020/05/18(月) 21:20:19.41ID:AArRB0Ix
>>566
それは正しい認識。

凄いのはド底辺シリツ医の馬鹿さ加減だよ。
裏口バカと呼ばれるのがよくわかる。

http://imagizer.imageshack.com/img923/2715/RosCsf.jpg
http://i.imgur.com/XBFnEcU.jpg

馬鹿だという自覚がないので救いようがない。

ICU Bookの最終章の冒頭で著者がこう書いている。

In clinical matters, ignorance can be dangerous,
but ignorance of ignorance can be fatal.

「叱られないと勉強しない」の対偶を「勉強すると叱られる」
と答えるのはignorance can be dangerousの範疇だが、

ドヤ顔で
>対偶をとれば意味が逆になる例文。
というのは、まさに
ignorance of ignorance can be fatal.
2020/05/21(木) 11:39:47.57ID:hAZkHjNF
西浦モデルの再生算数の事前分布を変化させてグラフにしてみた。

西浦モデルでのデフォルト
https://i.imgur.com/G1wVYgI.png

事前分布を一様分布(0,10)近似の正規分布で近似させた場合
https://i.imgur.com/doS5LEu.png

再生算数の平均0、標準偏差1の場合
https://i.imgur.com/doS5LEu.png


印象としては、西浦モデルは頑強性robustnessのあるモデルとは言えない。
事前分布に大きく影響されるモデルだと思う。
2020/05/21(木) 11:42:59.41ID:hAZkHjNF
(url訂正)

西浦モデルの再生算数の事前分布を変化させてグラフにしてみた。

西浦モデルでのデフォルト
https://i.imgur.com/G1wVYgI.png

事前分布を一様分布(0,10)近似の正規分布で近似させた場合
https://i.imgur.com/doS5LEu.png

再生算数の平均0、標準偏差1の場合
https://i.imgur.com/0J1RpDa.png


印象としては、西浦モデルは頑強性robustnessのあるモデルとは言えない。
事前分布に大きく影響されるモデルだと思う。
2020/05/21(木) 11:59:00.68ID:hAZkHjNF
>>571
誤解されるのは不本意なの追記するけど、ソースを公開する西浦先生の姿勢は高く評価している。
隠蔽・改竄・破棄する安倍とは大違い。
2020/05/21(木) 12:04:41.13ID:RwIzsMl5
だからベイズ推定が統計学の世界でメジャーにならんのだろ?
論理的根拠のない“事前分布”なるもので答えがひょいひょい変わるのでは社会的な影響が大きい防疫政策の決定には使えない。
普通の統計学の検定なら理論的に根拠のある数字、推論しか使わない。
計算は大変だけど。
2020/05/21(木) 12:36:51.92ID:hAZkHjNF
>>573
成人の平均身長を1〜2mに事前分布にするのは納得できるし、
生まれる子供が男子である確率は0.4〜0.6というのも俺は納得できる。
PCRの感度が30〜70%として計算するのも納得できるからその設定で階層ベイズモデルを組むことには異論はないな。
2020/05/21(木) 12:43:16.10ID:hAZkHjNF
こういう問題

あるタクシー会社のタクシーには1から通し番号がふられている。
タクシー会社の規模から保有タクシー台数は100台以下とわかっている(弱情報事前分布)。
この会社のタクシーを5台みかけた。最大の番号が60であった。
この会社の保有するタクシー台数の期待値と95%信用区間(信頼区間)を求めよ。

をベイズで解くときは、
60台〜100台である確率を一様分布として処理しているから
これに異論があるのは理解できるけど

日本人成人の平均身長を推定に1〜2mを事前分布に想定するのには俺は異論はないね。
一様分布ではなくてガンマ分布にすべきだというのは議論になるとは思うけど。
2020/05/21(木) 13:00:03.35ID:hAZkHjNF
>>573
ベイズ信奉者から、ベイズ論者を採用したGAFA(Google等)が成長したと教わった。
迷惑メールのフィルタリングとか雑音の除去とか日常的に役立っているというぞ。
2020/05/21(木) 13:04:49.04ID:hAZkHjNF
>普通の統計学の検定なら理論的に根拠のある数字、推論しか使わない。
>計算は大変だけど。

普通の統計学こそ、無理やり既知の分布に当てはめようとするんだよね。
MCMCの方の方が応用が広い。
2020/05/21(木) 13:12:59.01ID:hAZkHjNF
プロ野球選手の打率は?と問われたら選手次第で異なる、と誰でもわかるのに
確定不能の平均値が存在していると妄想して計算を始めるのが古典主義統計。
つまり、値は存在するけど確定できないという信仰の世界。

昨今の新コロナでいえば、PCRの検査の感度・特異度が一定と考えるのが古典主義。
プロ野球選手の打率と同じでそんなのは場面場面で変化するよ、と考えて計算するのがベイズ。
2020/05/21(木) 13:16:04.83ID:EdpRqUGW
>>576
もちろん推定の有力な方法であるにせよ、元の仮定に何の根拠もないわけだからそれから得られる結論には論理的根拠はない、ないが、数学的に伝統的な手法で与えるた結論と大差ない事がなんらかの保証があるなら、有力になる。
それが論理的に“大差ない結論が得られる”事が示されてるなら単なる計算手法に過ぎないし、示されていなくても経験的に“よい結果ぎ得られる事が多い”ならそのジャンルではそこそこ信頼するに値するんだろう。
しかしなんらかのモデルでは答えが一意に定まらず、事前分布の選び方により大きく答えが違ってしまう場合があっても不思議はないし、そのような場合ではやはり、“ではどう計算するのが正しいかのか”の論証を待たなければ信頼するのは危険になる。
2020/05/21(木) 13:19:12.39ID:hAZkHjNF
古典的(頻度主義)統計信者って、この計算はどうやるんだ?
俺は乱数発生させて計算できるけど、
そればベイズなのかどうかは知らんが、条件付き確率なのでベイズなんだろうな。
(開業医スレに投稿したけど、回答できるやつは0)

COVID19の潜伏期間の論文

https://www.nejm.org/doi/full/10.1056/NEJMoa2001316

結論は
#--- incubation period ---
# from Li et al NEJM 2020
# lognormal mean = 5.2
ln.par1 = 1.434065
ln.par2 = 0.6612


ある開業医が新型コロナ肺炎に罹患したとする。
行動調査によって発症前にキャバクラに行っており接客したキャバ嬢が開業医発症の2日後に発症していたことがわかった。
キャバ嬢は開業医から移されたと主張して1億円の賠償を求めている。
潜伏期間には幅がありキャバ嬢から移された可能性もあると主張してその確率を計算して賠償金を値切りたい。
いくら値切れるか計算せよ。
2020/05/21(木) 13:31:57.01ID:3Y6HuNza
>>580
潜伏期間なんて数学的に決定できるハズないやん?
数学がやるのは例えば感染日と実際発症した日が確定できるような症例がある程度以上あって、それが従うと病理学的に信頼できる分布の族があって、その中からデータに最も“沿う”分布を選び出すことしかできない。
それは何件も実際の患者のウイルス量の統計をとったり、ウイルスが体内でどのように増えていくのかの病理学的研究データがあって初めて可能になる。
2020/05/21(木) 17:20:41.64ID:Du+rgnHD
>>571
よく理解できていないので質問ですけど
事前分布とは具体的に何の分布ですか?
基本再生算数の推定値の分布?
実行再生算数の推定値の分布?

実行再生算数の事前分布は基本再生算数の分布としたらいいのかなと思いますけど
2020/05/21(木) 17:26:10.57ID:BjgAHZWs
まぁこのスレは用語がめちゃくちゃだからなぁ。
2020/05/21(木) 17:58:56.26ID:hAZkHjNF
モデル前提での計算できないアホ発見!
2020/05/21(木) 18:22:49.17ID:hAZkHjNF
潜伏期は病原体と罹患者のパワーバランスで決まるだろうから
定数でなくてばらつきはあると思うね。
586132人目の素数さん
垢版 |
2020/05/21(木) 18:25:39.76ID:8+K/mYXQ
>>572
>隠蔽・改竄・破棄する安倍とは大違い。
安倍ちゃんがやってるわけじゃないだろ。
指示もされてねーのに、官僚がやってんだよ。

そんなこともわからんようでは、あんたの解析もあてにならんな。
2020/05/21(木) 18:26:26.25ID:hAZkHjNF
>>582
西浦のソースだと Rt ~ normal(2.4 ,2)
2020/05/21(木) 18:28:21.45ID:hAZkHjNF
>>586
安倍じゃなければ官僚もまともだったんじゃねえの?
安倍らの集団に組み込まれると東大卒も馬鹿になるようだぞ。
589132人目の素数さん
垢版 |
2020/05/21(木) 18:31:24.22ID:8+K/mYXQ
>>581
その通り。
結局、そういう本質的なデータや理論抜きでは、ベイズ推定やったって
限界があるし、結果の説得力もない。
まあ、適用限界ってものがあるのは何やっても同じだけど。
590132人目の素数さん
垢版 |
2020/05/21(木) 18:32:55.80ID:8+K/mYXQ
>>588
>安倍らの集団に組み込まれると東大卒も馬鹿になるようだぞ。

統計的に確認してみれば?ベイズ推定でもっともらしい結果が出るんじゃね?w
2020/05/21(木) 18:33:59.08ID:hAZkHjNF
>>590
今は2/2かなw
加藤と西村
2020/05/21(木) 18:40:02.83ID:hAZkHjNF
>>590
馬鹿になる事後確率分布はこんな結果になりました。

https://i.imgur.com/ZhpWJdo.png
2020/05/21(木) 18:41:26.76ID:hAZkHjNF
95% CI は 0.5005265 1
2020/05/21(木) 18:46:18.61ID:hAZkHjNF
>>592
ちなみに事前分布は一様分布に設定。
2020/05/21(木) 18:53:16.25ID:hAZkHjNF
結局、統計ってこういう道楽なんだよなぁ。
2020/05/21(木) 19:01:50.90ID:hAZkHjNF
>>581
いやウイルスの振る舞いも素粒子の振る舞いもばらつきがあるんじゃないの?
存在も位置も確率的にしかわからない、という議論になると思う。
2020/05/21(木) 21:14:17.00ID:hAZkHjNF
>>571
最初の2つでは頑強と言えそう。
平均身長のたとえだと
事前分布に1〜2mを選んでも1〜10mを選んでも同様の結果だが、0〜1mを選ぶと現実離れした結果が返ってくるという感じだな。
2020/05/21(木) 21:27:14.41ID:hAZkHjNF
次のおもちゃ

しばらく、これで遊べそう。

臨床所見からロジスティック回帰でCOVID19の確率を出すペーパーがでるだろうなと思っていた。

Real-time tracking of self-reported symptoms to predict potential COVID-19

https://www.nature.com/articles/s41591-020-0916-2
599132人目の素数さん
垢版 |
2020/05/22(金) 01:26:24.95ID:MSJJjK3u
>>591
馬鹿の定義は?単なるお前の主観じゃねーかw

ベイズ統計にのめり込むと馬鹿になる事後確率分布でも求めてろ。
2020/05/22(金) 04:53:19.66ID:C0tPqEF8
こういうのも興味ある人多い?感染してからの日数とPCR陰性になる確率の関係。

https://twitter.com/AdamJKucharski/status/1260839061318705152
https://twitter.com/5chan_nel (5ch newer account)
2020/05/22(金) 05:39:46.28ID:s9txG4+B
各国のロックダウンの度合いを数値化してるところ。色々と分析に使えるかも。
https://ourworldindata.org/grapher/covid-stringency-index?tab=chart&;year=2020-05-07&country=JPN+NOR+SWE+USA
2020/05/22(金) 08:35:38.57ID:DQesskhT
>>599
あれ3/3になったのか。
それだと、95%CrIは0.5559329 1
事前分布にはJeffereysで計算
2020/05/22(金) 09:06:15.24ID:DQesskhT
>>600
ありがとうございます。
おねーちゃんと濃厚接触したあとは、何日目に検査したらいいかの参考になりました。
2020/05/22(金) 09:49:33.72ID:DQesskhT
>>600
論文を検索してみた、この論文からのグラフのよう。
Variation in False-Negative Rate of Reverse Transcriptase PolymeraseChain Reaction?Based SARS-CoV-2 Tests by Time Since Exposure
https://www.acpjournals.org/doi/pdf/10.7326/M20-1495
2020/05/22(金) 10:18:18.92ID:DQesskhT
Measurements: A Bayesian hierarchical model was fitted to estimate
the false-negative rate by day since exposure and symptom
onset.

とのことで、

こんな、ありふれたベイズ階層モデル

x[j,t] ~ Binomial(n[j,t],p[j,t])
logit(p[j,t]) = βj + β*1log(t) + β2*log(t)^2 + β3*(t)^3
βj ~ Normal(β0,σ2)
2020/05/22(金) 10:36:46.69ID:DQesskhT
Rとstanのコードが公表されているので、遊べそう。

https://github.com/HopkinsIDD/covidRTPCR
607132人目の素数さん
垢版 |
2020/05/22(金) 17:38:12.58ID:MSJJjK3u
>>602
1/1だよ。あんただけw
2020/05/22(金) 19:01:13.85ID:DQesskhT
>>607
信頼区間出せない馬鹿発見!
2020/05/22(金) 19:09:59.83ID:xdbfxKAO
このスレででてる信頼区間なんかほとんど統計の検定試験では出てこない俺様信頼区間だけどな。
信頼区間の定義ちゃんと言える奴の方が少ないだろ。
2020/05/22(金) 19:11:40.90ID:DQesskhT
1/1でも信頼区間を出せちゃうのがベイズ
2020/05/22(金) 19:13:01.67ID:DQesskhT
>>609
ベイズでは信用区間と呼んで信頼区間と区別する人もいるね。
CIでなくてCrIという記載も目にする。
2020/05/22(金) 19:20:12.80ID:DQesskhT
ベイズではconfidence interval でなくてcredibility interval
613132人目の素数さん
垢版 |
2020/05/22(金) 23:34:07.85ID:MSJJjK3u
>>612
あんたの独占スレになったな。1/1達成、おめでとうw
2020/05/23(土) 06:44:49.05ID:COZ69QMb
bootstrap使うと大抵の数値の信頼区間は出せるけど1/1には無理だな。
2020/05/23(土) 15:08:38.08ID:COZ69QMb
JAGSを使って1/1のときの95% Credibility Intervalを求めるスクリプト
事前分布はJeffereys

library(rjags)
data=list(x=1,n=1)
cat('
model{
x ~ dbin(p,n) # binomial distribution
p ~ dbeta(0.5,0.5) # Jeffereys prior
}',file='tmp.txt')
jagsModel=jags.model('tmp.txt',data=data,n.chains=4)
update(jagsModel)
codaSamples=coda.samples(jagsModel,n.iter=1e5,var='p')
gelman.plot(codaSamples) # 収束を確認
js=as.data.frame(as.matrix(codaSamples))
HDInterval::hdi(js$p) # 95% Highest Densty Interval

# 既存のパッケージで確認。
HDInterval::hdi(qbeta,shape1=0.5+1,shape2=0.5)
binom::binom.bayes(1,1)
2020/05/23(土) 17:34:11.28ID:COZ69QMb
エクセルのツールをCDCが公開しているね。


https://www.cdc.gov/coronavirus/2019-ncov/hcp/COVIDSurge.html

COVID-19Surge is a spreadsheet-based tool that hospital administrators
and public health officials can use to estimate the surge in demand for
hospital-based services during the COVID-19 pandemic. A user of
COVID-19Surge can produce estimates of the number of COVID-19 patients
that need to be hospitalized, the number requiring ICU care, and the number
requiring ventilator support. The user can then compare those estimates
with hospital capacity, using either existing capacity or estimates of expanded capacity.

With COVID-19Surge, users define the population in the hospital “catchment area” or local jurisdiction.
The user also enters the number of cases to date, and the available hospital resources (non-ICU beds, ICU beds, and mechanical ventilators).
Users can assess up to three community mitigation strategies simultaneously and
compare the impacts on hospital resources versus a “no intervention” scenario.
2020/05/24(日) 08:44:40.30ID:6T3JvGbL
@kazu_fujisawa
西浦先生が一番の功労者だというのは僕も同意見だな。あと、細かいこと言うと、
あの限られたデータしかない中で、8割削減なら1ヶ月で収束、接触6-7割削減なら2ヶ月で収束、という予測精度もお見事としか言いようがない。
2020/05/24(日) 10:47:51.67ID:uCyuaPog
アレは単に再生産数の推定値から出しただけやろ。
619132人目の素数さん
垢版 |
2020/05/26(火) 15:13:08.51ID:SaUF2oVL
わかった後からだと
「簡単じゃん!」とか言えるけど
先んじて発表した西浦先生は
すごくまともな研究者だと思います。
2020/05/26(火) 16:32:28.61ID:+yxrXOhy
中国・武漢全域で行われた新型コロナウイルスのPCR検査で、189人が無症状の感染者と確認されました。

 武漢では35日ぶりに新たな感染者が確認されたため、14日から「10日間大戦争」と銘打ち、延べ900万人にPCR検査を行いました。中国メディアによりますと、そのうち657万人の結果が出て、189人が無症状の感染者でした。
10万人のうち2.87人が無症状感染者の計算になるとしています。中国のSNSには、検査人数のあまりの多さに看護師が泣き叫ぶ動画が投稿されていて、
一日の検査能力である最大10万件を大幅に超えた検査の精度を疑問視する声もあります。10日間ですべての検査が終わらなかったので、検査は26日午後も続いています。

[2020/05/26 13:22]
https://news.tv-asahi.co.jp/news_international/articles/000184795.html
https://news.tv-asahi.co.jp/articles_img/000184795_640.jpg
2020/05/26(火) 16:47:55.61ID:+yxrXOhy
189/6570000は
有病率、感度、特異度の事前分布はどうするかな?

有病率:一様分布
感度:最頻値0.6標準偏差0.1のベータ分布
特異度:最頻値0.9標準偏差0.05のベータ分布
として検査陽性数は有病率*感度+(1−有病率)*(1−特異度)の確率に従う二項分布
でいいか?
2020/05/26(火) 16:50:21.89ID:+yxrXOhy
>>618
再生産数から収束に至るまでの期間の計算法って公開されてたっけ?
2020/05/26(火) 18:11:34.24ID:5HIYV6Gm
>>622
それは簡単に計算できるだろ?逆は難しくて、それが西浦先生の功績だと思うけど。
2020/05/26(火) 18:34:15.87ID:aYF++qy3
>>622
いっぱんに再生産数Rの伝染病が収束を始める免疫の比率は1-1/R。
R=2.5なら免疫獲得者が1-1/2.5=60%になれば拡大はしない。
なので60%になれば平衡状態になり、最低でもそれ以上減らさないとダメなのは明らか。
集団免疫の話読んだ事ある人間なら常識。
オレみにわかではあるが。
感染率が70%減、80%減になったとき、どれくらいの速度で落ちていくかもsirでだいたいわかる。
625132人目の素数さん
垢版 |
2020/05/26(火) 21:08:44.19ID:hVGZ6ofy
え? >>617って皮肉じゃないの?w

西浦さんの8割削減って言葉がメディアに乗るころには拡大再生産数は
1を切ってたんだよね(4/1頃)。拡大再生産数が2を越えて高止まりして
たのは3/15-3/25頃で、そこから1週間ほどで急落して1を切ってんだよね。
東京、大阪で自粛が叫ばれ、危機感がつのってたころだ。
626132人目の素数さん
垢版 |
2020/05/26(火) 21:10:56.84ID:hVGZ6ofy
×拡大再生産数
○実効再生産数
2020/05/26(火) 21:46:56.85ID:aYF++qy3
>>625
それは今でも良くわかってないだろ。
何せ4月の初め頃って検査リソースの限界で東京とか陽性率が8割に近かった、もうほとんど陽性確定の人しか検査してなかった頃。
この“認知されたケース(confirmed case”となったケースのピークと実際の感染者数のピークは当然ずれてる。
実際の東京の罹患者は8万人を超えてるらしいので、相当数が検査されずに見過ごされてる。
おそらく見過ごされた多くのケースは陽性者数がピークを迎えた(陽性率が8割ぐらいあった)4/15前後に発症したケースだろうけど、それは明らかにconfirmed casesのピークより遅い。
2020/05/27(水) 00:41:21.74ID:SJ9C7hro
>>620
5〜10人の検体を混ぜて検査して、陽性が出たロットだけ全部検査してるらしい。
https://www.sankei.com/smp/photo/daily/news/200524/dly2005240012-s.html
陽性はほとんどいないから、1日に50〜100万人分検査できる。
629132人目の素数さん
垢版 |
2020/05/27(水) 00:42:18.53ID:VNGePIH1
>>627
4月の初め頃の検査対象はその1週間前に感染してんだから、
まさに専門家委員会が示したconfirmed casesの感染者数の
ピークの頃だよ。
2020/05/27(水) 01:15:53.98ID:sG8aLkL9
>>629
confermed casesのピークはもっと遅い4/15前後だよ。
その前と後に二つの最大のピークがある。
いずれにせよ、検査拒否の陽性率の最大がそのあたりにあって、どのくらいの見逃しがどのくらいあったのか科学的に推し量る方法などない。
その当時どんなコールセンターへの相談があり、どの程度怪しいケースを弾いていたのかなどコールセンターの資料をツブサに調べていくしかない。
そんなもんここで議論するような話ではない永遠の水かけ論にしかならない。
2020/05/27(水) 04:32:30.99ID:DONHjyrT
>>624
収束する時期は再生産数だけじゃでは計算できないのではという疑問。
2020/05/27(水) 07:13:32.08ID:DONHjyrT
>>628
有病率を10万分の3として、何人の検体を混ぜるのが一番効率がいいんだろ?
10万を3でわった3万3千人くらいかな?
2020/05/27(水) 08:58:32.23ID:olFI7/IU
>>632
n/k+n/k(1-(1-p)^k)kを最小にするkだから、k=2Productlog(-0.5√-log(1-p))/log(1-p)だね。
p=3/100000を代入してk=183。
ちなみにk=10となるのはp=0.0111の時。そんなに陽性率が高いと見積もったわけでは無いだろうから、10ぐらいが混ぜて検査の限界なのだろう。

もっと究極的に検査回数を少なくすると>>419 の方法に行き着くと思う。
2020/05/27(水) 09:20:13.89ID:DONHjyrT
>>633
早速のレスありがとうございました。
635132人目の素数さん
垢版 |
2020/05/27(水) 12:14:38.96ID:VNGePIH1
>>630
だ、か、ら、検査結果の判明した日付では4/15頃がピークだけど、検査の
待ち時間や発症までの潜伏期間を含めると、感染したのはその2週間以上
前になるっていうのが、専門家委員会の見積もり。
https://www.mhlw.go.jp/content/10900000/000630718.pdf
2020/05/27(水) 12:23:58.30ID:cpzgnD1W
>>635
confirmed cases の罹患→発症の平均時間と
all cases の罹患→発症の平均時間にはズレが出る。
confirmed cases のそれが2週間以上でそのピークが4月より前でも
all cases のそれはもっと小さいのでそのピークはもっと後ろになる。
2020/05/27(水) 12:48:12.43ID:0C2sk63u
具体例で実験してみればいい。
山がある曲線かく。
山をy軸方向に0.7倍したもの(軽症段階で相談した人)と0.3倍したもの(重篤化して認知されたもの)を作り、後者はx軸反転する。
前者は右に1週間、後者は左手に一週間ずらす。
この二つの曲線の差がその日に検査要請がかかった件数。
しかし検査リソースには限界があるのでx軸より下の重症者は全部検査されたとして、そこから一定幅より上の部分は検査拒否されたと考える、つまりy軸より下の部分を検査リソースの限界分だけ上に平行移動したものより下が実際に検査された軽症者の人数。
もとまった検査された軽症者の曲線を改めて一週間前にずらし、重症者のカステラの曲線と足してみる、コレがconfirmed casesに限った推定発症日の曲線。
元の山とできた山のピーク比べてみる。
ズレてるから。
638132人目の素数さん
垢版 |
2020/05/27(水) 13:01:39.14ID:VNGePIH1
>>636
だ、か、ら、>>627で検査が滞って隠れ感染者が相対的に増えてたと
君がいう4月上旬の検査対象は3月下旬の感染者なんだから、全感染
者数のピーク時期はconfirmed casesの4/1頃のピークの前にこそなれ、
後ろにはならんでしょ?
2020/05/27(水) 13:04:06.21ID:Rn3481n9
>>637
なるよ。
>>635の実験やってみた?
必ずconfirmed casesのピークはall casesのピークより前にズレる。
つまりall casesのピークはconfirmed casesのピークより後ろにズレる。
640132人目の素数さん
垢版 |
2020/05/27(水) 14:10:34.29ID:VNGePIH1
>>637
前提に問題がありすぎ。検査数は逐次増えてて、感染者のピーク前後では
ほぼ検査数に比例して陽性者数も増えてる(陽性率は十数%前後で大きな
変化はない)。キャパ一定で推移してるわけではない。
2020/05/27(水) 14:36:45.45ID:m+sqB0p7
>>640
前にも書いたけどその話をしだすとココでは絶対答えが出ない水掛け論にしかならない。
結局症状が出てても検査を断られる4月頭時点での検査体制では、実際どれくらいのズレが発生したのかはハッキリとは言えない。
それは後年の調査である程度はわかるかもしれないけど。
何せ1日数万件もあった相談と検査拒否の実態を掴むのは容易ではない。
いずれにせよ、実際の感染のピークが
confirmed casesのピーク日
-conformed cases内の(確定日-推定罹患日)の平均
より後ろにズレるのは確実。
何故ならどの程度の検査拒否があったにせよ、この相談日-罹患日の値が小さいグループ(症状の軽いグループ)の方が検査拒否された割合が有意に高いので。
まぁ実際confirmed casesのピーク日-(xxx)
のxxxに入れるべき数値は2週間よりはずっと小さい。
2020/05/27(水) 18:01:10.48ID:DONHjyrT
職場で最初に発症した人が感染源と決めつけてはならないことを
数学的には確認。

あるクリニックで院長が新コロナを発症。
翌日2人の看護師が発症、その次の日に3人の看護師が発症。
各人が最初に感染していた確率を計算せよ。

こういう計算ができると、誰が移したとか責めたりせずにすむ。
(春節ウェルカムした安倍が悪い、で職員の心が一つになるw

計算に必要な数値は
#--- incubation period ---
# http://www.nejm.org/doi/full/10.1056/NEJMoa2001316
# Li et al NEJM 2020
# 潜伏期間は対数正規分布でパラメータは
ln_par1 = 1.434065
ln_par2 = 0.6612
2020/05/27(水) 18:03:06.39ID:DONHjyrT
RとStanでやってみた。
> data.frame(p=round(sapply(1:n,fi),2))
p
1 0.26
2 0.18
3 0.18
4 0.13
5 0.13
6 0.13
コードはここ
https://egg.5ch.net/test/read.cgi/hosp/1583407025/199
2020/05/27(水) 18:05:18.29ID:1E963DQR
>>632
ウイルスを検出できる最低限度の濃度とかあるんじゃないかな
制約付きで何人分を混ぜるかを最大化する問題になると思う
645132人目の素数さん
垢版 |
2020/05/27(水) 19:07:41.79ID:VNGePIH1
>>641
しつこいな。どこからそんな式が出てくるんだよw
現状で分かってる事実から推測して全感染者数の
ピークが後ろにくる理由はないよ。むしろ前にくるほうが自然。
646132人目の素数さん
垢版 |
2020/05/27(水) 19:13:02.09ID:VNGePIH1
>>642
発症前から感染力があり、潜伏期間にも幅があるんだから、
その情報だけでだれが感染源かなんて断定できるわけない
のは当たり前だろ。それでも最初の発症者が一番怪しい
ってことに変わりはない。
常識で考えろ。
2020/05/27(水) 19:21:49.47ID:v/kXgPR4
>>645
>>637の実験やってみた?
2020/05/27(水) 19:34:58.61ID:DONHjyrT
>>646
院長と3日めの発症した看護師とどれくらい確率が違うかは
常識では出せないだろ。

こういう計算には数値化が必要。

ある開業医が新型コロナ肺炎に罹患したとする。
行動調査によって発症前にキャバクラに行っており接客したキャバ嬢が開業医発症の2日後に発症していたことがわかった。
キャバ嬢は開業医から移されたと主張して1億円の賠償を求めている。
潜伏期間には幅がありキャバ嬢から移された可能性もあると主張してその確率を計算して賠償金を値切りたい。
いくら値切れるか計算せよ。
2020/05/27(水) 20:06:50.12ID:olFI7/IU
>>642

Mathematicaだと
cond = Distributed[{a, b, c, d, e, f},ProductDistribution[{LogNormalDistribution[1.434065, 0.6612], 6}]];
NProbability[a > Max[b - 1, c - 1, d - 2, e - 2, f - 2], cond]
NProbability[b - 1 > Max[a, c - 1, d - 2, e - 2, f - 2], cond]
NProbability[d - 2 > Max[a, b - 1, c - 1, e - 2, f - 2], cond]

>0.257392
>0.178947
>0.128264
2020/05/27(水) 20:50:23.83ID:DONHjyrT
>>649
レスありがとうございます。
有効数字2桁で同じ結果なので自分のコードの検証になりました。
2020/05/28(木) 18:53:42.43ID:9QoKXLHk
中国湖北省武漢市(人口約1100万人)が今月中旬から全市民を対象に実施していたPCR検査(遺伝子検査)がおおむね終了した。
地元紙「湖北日報」(電子版)によると、直近に検査を済ませた人や乳児を除く900万人以上から検体を採取。
武漢では1日に100万人以上の検査が可能で、24日までに約650万人の検査が終わり、無症状感染者が218人見つかった。

事前分布に有病率は一様分布、感度は40-60%、特異度は90−100%のベータ分布を設定してStanでMCMCしてみた。
mean se_mean sd 2.5% 50% 97.5% n_eff Rhat
spc 0.999977 0.000000 0.000008 0.999965 0.999976 0.999994 12593 1.00001
sen 0.452612 0.002116 0.220226 0.073638 0.444200 0.871391 10834 1.00000
prev 0.000041 0.000001 0.000118 0.000001 0.000023 0.000183 8206 1.00004
p 0.000034 0.000000 0.000002 0.000030 0.000034 0.000039 36412 0.99998

spc:特異度、sen:感度  prev:有病率 p:陽性率

900万人での陽性者数の予想

最頻値 306.15

95%信頼区間
lower upper
266.46 346.70

1100万人のうちの有病者数予想

> summary(ms$prev*11e6) ; MODE(ms$prev*11e6)[1] ; hdi(ms$prev*11e6)[1:2]
Min. 1st Qu. Median Mean 3rd Qu. Max.
0 108 251 449 483 137796
x
179.24
lower upper
0.020213 1360.523395
■ このスレッドは過去ログ倉庫に格納されています

ニューススポーツなんでも実況