La formula del latte è Vacca2O

Di più
4 Anni 3 Settimane fa #41011 da FranZeta
Nuove branche della matematica nascono: ecco a voi la matematica esponenziale!

(La fase esponenziale era quando ci invitavano a mangiare involtini primavera, ora siamo nella terra incognita della fase iperbolica, qualcuno glielo spieghi.)

FranZη

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 3 Settimane fa #41017 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O
ciao Franzη,

avendo rinunciato a controbattere la narrativa ufficiale con i numeri ufficiali, perché evidentemente vedere due picchi di mortalità di altezza completamente diversa (intendo marzo/aprile e settembre/ottobre) non risulta convincente per molti, ho provato a fittare gli attuali dati con un modello GRM per capire a che punto siamo della progressione dell'epidemia.
Ho preso questo articolo come riferimento per la forma matematica del modello: www.sciencedirect.com/science/article/pi...717300234?via%3Dihub .
Volevo chiederti se pensi cosa pensi di questo tipo di fit. Non ho ancora provato a mettere tutto in Matlab, perché non ho familiarità con il toolbox per il fit dei dati e dovrei studiarmelo un po', per cui per ora ho selezionato i parametri "a mano". Le curve mi vengono così:
ibb.co/tDFbfDg
ibb.co/JKjcT3Q
ibb.co/6Fxn6J7
ibb.co/fnHT4Gs
ibb.co/wzVywhT
ibb.co/6HmcQLY

Ho una perplessità sull'affidabilità di questo tipo di predizioni, e volevo chiederti un parere.
Il fatto è che se il picco cambia leggermente forma il fit può cambiare non poco. Inoltre è chiaro che un fit matematico di questo tipo è un'approssimazione assai rozza della realtà. Tuttavia questa forma della curva fitta abbastanza bene sia la forma del picco di marzo/aprile sia la forma del picco attuale. Inoltre una conferma del fatto che siamo quasi al picco si ha facendo la derivata della curva dei dati, che ha superato il massimo e si sta avvicinando a 0.
ibb.co/zm0BD9F
ibb.co/ZdpBSDr

Grazie per il tuo parere, se avrai tempo di guardare.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 3 Settimane fa #41019 da Pandroid
Franzη mi sono letto gli ultimi tuoi post, veramente interessanti.
Si, ero io che avevo osservato delle anomalie nell'andamento di positivi, tamponi e relativo rapporto. Non solo per quanto riguarda l'anomalia del Lunedì, ma anche per quanto riguarda altro (paradossalmente, e senza le tue capacità, ho inziato ad osservare queste "anomalie visive" intorno proprio a ferragosto).
Se sei interessato/disponibile (al di là degli screzi passati) sarei particolarmente interessato a sottoporti un piccolo pdf che le riassume, magari sei in grado di smontarle dal punto di vista matematico, oppure di fornire un parere veramente preparato.
Ti dico subito che ho mandato in questi giorni per la prima volta i dati ad un medico per un parere non matematico (ad esempio un medico potrebbe essere in grado di giustificare l'anomalia del Lunedì secondo l'ipotesi che facevi te, oppure di smentirla), ma un parere sul versamente matematico è senz'altro fondamentale.
Se sei interessato fammi sapere anche in privato e ti spiego le cose.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 3 Settimane fa #41022 da Tonki
Risposta da Tonki al topic La formula del latte è Vacca2O
Poi mi raccomando postateli anche qui eh quei dati, vi seguo con gusto ;D

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 3 Settimane fa #41053 da FranZeta

ma.pa ha scritto: Volevo chiederti se pensi cosa pensi di questo tipo di fit. Non ho ancora provato a mettere tutto in Matlab, perché non ho familiarità con il toolbox per il fit dei dati e dovrei studiarmelo un po', per cui per ora ho selezionato i parametri "a mano".


Penso che se va bene questo tipo di fit funziona sul breve periodo, ma solo nell'ipotesi che i dati di base siano genuini. Per come la vedo io questa ipotesi andava bene nella prima ondata, non va più bene adesso.

Entrando un po' nel dettaglio, mi pare di capire che come curva dei nuovi casi prendi la media mobile dei dati ISS, a sette giorni immagino. Il fatto è che nel documento che hai linkato usano i dati grezzi + il metodo dei minimi quadrati per ricavare i parametri, se usi la media mobile + l'approssimazione a occhio (contro la quale non ho assolutamente niente e anzi la uso spesso e volentieri) difficilmente potrai beccare il flesso della curva C (e quindi il picco di C', i nuovi casi giornalieri). Infatti mi sembra che già con i dati di questi ultimi 2-3 giorni la curva risulti cambiata non poco.

Altro problema di questo tipo di modellazione matematica è che se ricavi tutti i quattro parametri dell'equazione (2) che definisce C (con il metodo a occhio o con quello più raffinato dei minimi quadrati) ricavi in particolare la costante K che ti dice quanti saranno i casi totali alla fine dell'epidemia (o meglio dell'ondata epidemica, nel nostro caso). Insomma è una specie di circolo vizioso: la curva descrive bene l'evolversi futuro dell'epidemia solo se sai già stimare bene il numero finale delle persone contagiate. D'altronde anche nell'articolo le previsioni dell'evoluzione dell'epidemia, fatte prima del picco, risultano alquanto aleatorie:


FranZη

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41107 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O
ciao franzeta,

grazie per la risposta. Confermo che uso i dati ufficiali con media mobile a 7 giorni.
Ho visto anch'io che appena ho scritto abbiamo avuto una repentina crescita dei numeri (ovviamente :cry: , ho avuto un momento di depressione assoluta :angry: :cry: ), e in effetti concordo che il sistema è abbastanza aleatorio.
Tuttavia stavo (e sto ancora) cercando un modo per mostrare ad amici poco esperti che non siamo più nella fase di crescita pre-flesso di C', ma siamo oramai verso il picco. In effetti il picco della derivata seconda l'abbiamo passato, anche i dati stessi lo dimostrano.
Vero che risulta impossibile predire con esattezza, ma la cosa importante non mi sembrava predire con esattezza ma dare una forma di previsione di qualche tipo, sempre con l'idea che se poi il picco è a 150 o 200 morti non cambia (dal punto di vista del trattamento dati, non dei poveracci che ci hanno lasciato la pelle), mentre cambia se il picco è tra 3 giorni o tra 30.
Per depressione avevo smesso di aggiornare il file per qualche giorno, e ieri sera che l'ho aggiornato, ho scoperto che in realtà la previsione non era così fallace, per cui ho aggiornato il mio file, e provo a postarlo anche qua, se qualcuno vuole fare dei commenti costruttivi (se è una cagata, ditelo eh!).
gofile.io/d/qtbmw4
Ovviamente nulla vieta che tarocchino ulteriormente i tamponi e che quindi ogni morto in Italia diventi magicamente positivo. Però a me sembra che sia evidente il picco almeno negli ospedalizzati e nelle terapie intensive, quindi la narrativa ufficiale dovrà inventarsi qualcos'altro a breve, per giustificarsi...
Ultima Modifica 4 Anni 2 Settimane fa da ma.pa.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41109 da Pandroid
In merito alla cosa che mi aveva scritto franzeta sul discorso terapie intensive, sto continuando a chiedere a Protezione Civile e Ministero della Salute.
Questa è l'ultima risposta che mi hanno dato:

Domanda: Recentemente avete mandato questa pagina come risposta ad una mia precedente domanda: opendatadpc.maps.arcgis.com/apps/opsdash...478eaac82fe38d4138b1 .
Ma non vi riesco a trovare questa informazione: quanti posti nelle terapie intensive sono occupati tra pazienti covid e non?. Il calcolo che effettua Infodata è sul totale dei posti letto disponibili (circa 6500), quindi immagino abbiate a disposizione anche il livello di saturazione complessivo (covid e non covid).
Mi sembra un dato importante


Risposta: In riferimento alla Sua richiesta, La informiamo che uno schema descrittivo relativo ai dati sanitari è disponibile alla pagina github.com/pcm-dpc/COVID-19/blob/master/...to-covid19-italia.md
Per ulteriori informazioni sui dati della sorveglianza integrata in Italia può consultare il portale Epicentro a cura dell'Istituto Superiore di Sanità (ISS), alla pagina www.epicentro.iss.it/coronavirus/sars-cov-2-dashboard
Le ricordiamo, infine, che il flusso dei dati sanitari aggregati inviati dalle Regioni è coordinato dal Ministero della Salute pertanto, per ulteriori informazioni e chiarimenti, La invitiamo a rivolgersi al suddetto Ministero di cui, di seguito, Le forniamo i contatti:
tel: 06.59941
modulo on line: www.salute.gov.it/portale/p_sendMail2.jsp



Saluti, il Contact Center del Dipartimento della Protezione Civile.


Sto guardando a quei link, ma non mi pare ci sia l'informazione richiesta

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41112 da Tonki
Risposta da Tonki al topic La formula del latte è Vacca2O

La informiamo che uno schema descrittivo relativo ai dati sanitari è disponibile alla pagina github.com/pcm-dpc/COVID-19/blob/master/...to-covid19-italia.md


Ma cosa sarebbe questo? Un software?

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41116 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O
è lo schema del file csv che puoi scaricare da loro. Il file dei dati regionali, o provinciali, ha quell'elenco di dati lì.
Serve solo a capire esattamente quali sono i dati che stai guardando sul file csv.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41117 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O
Mi sono accorto che nel file che ho linkato sopra ( gofile.io/d/qtbmw4 ) c'è un errore concettuale. Lo cancello.
Per la terapie intensive e gli ospedalizzati ho guardato la derivata seconda della curva, mentre devo guardare la derivata prima. Correggerò.
A questo punto non siamo al picco neanche delle terapie intensive, ma abbiamo superato il flesso. Quindi probabilmente anche il picco dei morti salirà ulteriormente, rispetto a quello che sembra adesso.
Ultima Modifica 4 Anni 2 Settimane fa da ma.pa.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41119 da Pandroid

Tonki ha scritto:

La informiamo che uno schema descrittivo relativo ai dati sanitari è disponibile alla pagina github.com/pcm-dpc/COVID-19/blob/master/...to-covid19-italia.md


Ma cosa sarebbe questo? Un software?


E' più un database.
Io non sono riuscito a trovarvi i dati in questione, e la protezione civile mi ha confermato da poco che:

In merito alla Sua richiesta, La informiamo che gli unici dati elaborati e gestiti da questo Dipartimento sono quelli pubblicati quotidianamente sulla "mappa della situazione" disponibile al link: opendatadpc.maps.arcgis.com/apps/opsdash...478eaac82fe38d4138b1

Tradotto in italiano non ce li hanno. I buffoni, aggiungo io

Ho chiesto di nuovo al Ministero della Salute, dopodichè lascio perdere per qualche tempo.
Purtroppo questo si ricollega a:

Per la terapie intensive e gli ospedalizzati ho guardato la derivata seconda della curva, mentre devo guardare la derivata prima. Correggerò.
A questo punto non siamo al picco neanche delle terapie intensive, ma abbiamo superato il flesso. Quindi probabilmente anche il picco dei morti salirà ulteriormente, rispetto a quello che sembra adesso.

Il picco salirà ulteriormente perchè c'è effettivamente una seconda ondata in corso, oppure salirà come inevitabilmente sale ogni anno a cavallo tra Dicembre e Gennaio il numero di decessi?

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41125 da FranZeta

Pandroid ha scritto: In merito alla cosa che mi aveva scritto franzeta sul discorso terapie intensive, sto continuando a chiedere a Protezione Civile e Ministero della Salute.
Questa è l'ultima risposta che mi hanno dato
...
Sto guardando a quei link, ma non mi pare ci sia l'informazione richiesta

Sì beh, in pratica ti hanno rimandato ai dati ISS che conoscevamo già. Diciamo anche a beneficio degli altri utenti che fra le varie cose che ci siamo scritti in privato c'era quella, secondo me prioritaria, di trovare da qualche parte lo storico del livello di occupazione delle terapie intensive, giusto per capire se quei 2225 ricoverati Covid (ad oggi) sono pazienti in più rispetto alla norma, o se al contrario il livello di occupazione, fra pazienti covid e non covid, è in linea con quello dello storico del periodo. Per intenderci, sei mesi fa guardavamo in mancanza di dati più precisi questo tipo di grafico:



cioè lo storico della mortalità in 19 città campione che usavano per valutare l'andamento delle ondate influenzali (quando l'influenza c'era ancora...). La linea nera, che rappresenta la mortalità attesa statisticamente, presenta ogni anno in questo periodo un andamento di tipo esponenziale, che poi ovviamente dopo qualche mese regredisce nuovamente fino ai minimi estivi. Questi sono i morti, immagino che anche per le TI ci sia una curva analoga che però non si trova e non si può confrontare con la situazione attuale.

Se non altro a uno di quei link sembrerebbe esserci la spiegazione dell'arcano del lunedì:



Ricordavo di aver già visto quel grafico, ma non ricordavo dove, ora grazie alla gentile risposta della Protezione Civile l'ho ritrovato. Qui i casi sono segnati per data di prelievo e di inizio sintomi (per chi li ha), quindi non abbiamo il ritardo dovuto alla raccolta e divulgazione dei dati. Ebbene, come prevedibile alla domenica (sono le barrette segnate con la "D") c'è un minimo dei test, contestualmente risulta anche minima la differenza fra la barretta blu dei sintomatici e quella verde dei test, cioè alla domenica testano in proporzione più sintomatici che negli altri giorni, da cui si deduce una maggiore percentuale di positivi.

********

ma.pa ha scritto: Vero che risulta impossibile predire con esattezza, ma la cosa importante non mi sembrava predire con esattezza ma dare una forma di previsione di qualche tipo, sempre con l'idea che se poi il picco è a 150 o 200 morti non cambia (dal punto di vista del trattamento dati, non dei poveracci che ci hanno lasciato la pelle), mentre cambia se il picco è tra 3 giorni o tra 30.
Per depressione avevo smesso di aggiornare il file per qualche giorno, e ieri sera che l'ho aggiornato, ho scoperto che in realtà la previsione non era così fallace, per cui ho aggiornato il mio file, e provo a postarlo anche qua, se qualcuno vuole fare dei commenti costruttivi (se è una cagata, ditelo eh!).
gofile.io/d/qtbmw4


Sì la sovrapposizione sembra decisamente buona (qui e in seguito mi rifersco alla curva dei nuovi casi giornalieri, poi le altre sono più o meno ricavabili da questa), il fatto è che sembrava molto buona anche quella vecchia...

[Anche se guardando i grafici, così ad occhio mi pare che le due curve rosse dei dati a consuntivo non si sovrappongano perfettamente nel tratto comune, come invece dovrebbero, ma forse è solo un'impressione mia]

Sono d'accordo che alla fine è prioritario stabilire quando sarà il picco, il problema è sempre quello: c'è da fidarsi?

Se vai a dare un'occhiata qui trovi in fondo al post una previsione a lungo termine del picco della curva dei casi attivi. La previsione era per il 16-17 aprile, il picco ufficiale è stato il 19 aprile. Considerato che il modello era stato fatto il 5 marzo, sembrerebbe una precisione eccezionale, peccato che il numero dei casi è due ordini di grandezza fuori scala, anche perchè:

- il modello non prevedeva il lockdown (e ci mancherebbe: era il 5 marzo!);
- il numero reale dei casi attivi si è scoperto poi essere circa sei volte quello ufficiale;
- la curva reale dei casi attivi ha raggiunto con ogni probabilità il suo picco un paio di settimane prima rispetto a quello ufficiale, che invece ha risentito di un notevole ritardo nel dichiarare guarita molta gente.

Per cui riassumendo la precisione eccezionale di cui sopra è solo una coincidenza e la curva di quel modello ha funzionato in modo accettabile solo per 10-15 giorni. Tutto questo per dire che sì, può darsi che il tuo modello si riveli molto preciso MA adesso come adesso non ci metterei un'unghia sul fuoco, anche perchè credo che in questa seconda ondata ci sia una notevole componente artificiale che nessun modello può precedere.

*********************************

A proposito di ritardo nel riportare le guarigioni, segnalo che attualmente passano 25-26 giorni perchè un asintomatico finisca nella statistica dei guariti, contro i 10-14 giorni teorici, per cui anche adesso il numero di casi attivi è molto gonfiato da questa circostanza, visto che solo in questi giorni stanno iniziando ad arrivare le prime guarigioni relative all'esplosione di questa seconda ondata.

FranZη

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41129 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O

Pandroid ha scritto: Purtroppo questo si ricollega a:

Per la terapie intensive e gli ospedalizzati ho guardato la derivata seconda della curva, mentre devo guardare la derivata prima. Correggerò.
A questo punto non siamo al picco neanche delle terapie intensive, ma abbiamo superato il flesso. Quindi probabilmente anche il picco dei morti salirà ulteriormente, rispetto a quello che sembra adesso.

Il picco salirà ulteriormente perchè c'è effettivamente una seconda ondata in corso, oppure salirà come inevitabilmente sale ogni anno a cavallo tra Dicembre e Gennaio il numero di decessi?


Questa è una domanda da un milione di dollari.

I dati mostrano che i nuovi ricoverati in terapia intensiva stanno calando, cioè siamo oltre al picco dei nuovi ricoverati.
Ma il numero totale dei ricoverati in terapia intensiva salirà ancora, almeno fin quando il numero dei nuovi ricoverati diventerà negativo. A quel punto il numero totale dei ricoverati sarà al picco, e inizierà a scendere. E questo succederà tra qualche giorno, difficile dire quanti però.
Siccome il picco dei morti a logica segue in linea di massima quello dei ricoverati in terapia intensiva, è probabile che vedremo salire ancora il picco dei morti, anche perché si viene facilmente ingannati (io in primis) dal fatto che c'è una variabilità dei numeri all'interno della settimana (probabilmente legata a questioni amministrative).

Detto questo, dai dati ufficiali secondo me è impossibile stabilire se siamo oltre la mortalità normale di questo periodo dell'anno o meno, bisogna confrontare con gli anni scorsi (qualcuno ha postato qualcosa sui commenti liberi).
Va anche considerato che come tu dici il picco influenzale di solito è più avanti, quindi per lo meno quest'anno siamo in anticipo.O più probabilmente questa è come una ondata influenzale "parallela".
Per questo io credo che effettivamente ci sia una "seconda ondata" in corso, che però viene esagerata dal fatto che chiunque è positivo diventa un malato di covid. Quindi penso che ci sia da preoccuparsi esattamente come per le ondate influenzali del passato, o poco di più. Ma non penso siano numeri inventati di sana pianta. Ovviamente la narrazione ufficiale mostra solo le terapie intensive piene e non quelle vuote, e via dicendo.

Dopodiché dai dati che danno loro è un casino tirare fuori informazioni sensate. Mettono solo dati molto generici, non dividono i dati neanche provincia per provincia, salvo il numero dei casi. Tutto il resto al massimo è regione per regione.
In effetti sono assai sconfortato. :(

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41132 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O

FranZeta ha scritto: Per intenderci, sei mesi fa guardavamo [....] lo storico della mortalità in 19 città campione che usavano per valutare l'andamento delle ondate influenzali (quando l'influenza c'era ancora...). La linea nera, che rappresenta la mortalità attesa statisticamente, presenta ogni anno in questo periodo un andamento di tipo esponenziale, che poi ovviamente dopo qualche mese regredisce nuovamente fino ai minimi estivi. Questi sono i morti, immagino che anche per le TI ci sia una curva analoga che però non si trova e non si può confrontare con la situazione attuale.


mi chiedevo se avevate interpretato il fatto che tra dicembre e marzo la curva reale sta sotto quella teorica, come se già nel 19/20 l'influenza fosse stata sotto le aspettative.

Qui i casi sono segnati per data di prelievo e di inizio sintomi (per chi li ha), quindi non abbiamo il ritardo dovuto alla raccolta e divulgazione dei dati. Ebbene, come prevedibile alla domenica (sono le barrette segnate con la "D") c'è un minimo dei test, contestualmente risulta anche minima la differenza fra la barretta blu dei sintomatici e quella verde dei test, cioè alla domenica testano in proporzione più sintomatici che negli altri giorni, da cui si deduce una maggiore percentuale di positivi.


mi chiedo quale sia il perverso meccanismo che fa sì che al lunedì vengano dichiarati meno tamponi e quindi meno positivi. Forse meglio non saperlo ^^; mi chiedo però perché non possano fornire i dati effettivi, visto che li hanno...

Sì la sovrapposizione sembra decisamente buona (qui e in seguito mi rifersco alla curva dei nuovi casi giornalieri, poi le altre sono più o meno ricavabili da questa), il fatto è che sembrava molto buona anche quella vecchia...
Sono d'accordo che alla fine è prioritario stabilire quando sarà il picco, il problema è sempre quello: c'è da fidarsi?


è esattamente il dubbio che mi preoccupa. Oltretutto i dati degli ultimi giorni sono sempre gravati dal fatto che la media mobile viene fatta solo sugli ultimi 4,5,6 giorni, e quindi oscillano a seconda del giorno della settimana in qui vengono presi (grazie ai mitici dati con il picco in negativo del lunedì).
Però vedi dopo :)

Se vai a dare un'occhiata qui trovi in fondo al post una previsione a lungo termine del picco della curva dei casi attivi. La previsione era per il 16-17 aprile, il picco ufficiale è stato il 19 aprile. Considerato che il modello era stato fatto il 5 marzo, sembrerebbe una precisione eccezionale, peccato che il numero dei casi è due ordini di grandezza fuori scala, anche perchè:

- il modello non prevedeva il lockdown (e ci mancherebbe: era il 5 marzo!);
- il numero reale dei casi attivi si è scoperto poi essere circa sei volte quello ufficiale;
- la curva reale dei casi attivi ha raggiunto con ogni probabilità il suo picco un paio di settimane prima rispetto a quello ufficiale, che invece ha risentito di un notevole ritardo nel dichiarare guarita molta gente.

Per cui riassumendo la precisione eccezionale di cui sopra è solo una coincidenza e la curva di quel modello ha funzionato in modo accettabile solo per 10-15 giorni. Tutto questo per dire che sì, può darsi che il tuo modello si riveli molto preciso MA adesso come adesso non ci metterei un'unghia sul fuoco, anche perchè credo che in questa seconda ondata ci sia una notevole componente artificiale che nessun modello può precedere.


sono d'accordo con quello che dici, ma considera che lì eri ben prima del flesso, nella fase di crescita esponenziale, e un piccolo errore va a sballare completamente il risultato finale. Nel momento in cui superi il flesso della curva a campana, allora la previsione è sicuramente più azzeccata, perché hai mezza curva già fatta, e da quella puoi ricostruire il resto con un minimo in più di sicurezza.
Per di più, i parametri del modello li ho ricavati usando le curve di marzo/aprile, immaginando che la forma delle curve potesse essere simile, per cui l'unico parametro che ho variato (salvo qualche eccezione) a ottobre è stato l'altezza del picco.

Avevo studiato un po' in passato le curve a campana dei modelli di esaurimento delle risorse (picco di Hubbert), e anche lì si vedeva chiaramente che se non hai almeno mezza curva tiri un po' a caso. Appena ho tempo vado a ristudiarmi quei modelli che erano anche interessanti e provo ad applicarli qua.

[Anche se guardando i grafici, così ad occhio mi pare che le due curve rosse dei dati a consuntivo non si sovrappongano perfettamente nel tratto comune, come invece dovrebbero, ma forse è solo un'impressione mia]


scusa ma non ho capito benissimo, puoi per favore spiegare meglio cosa intendi?
Ultima Modifica 4 Anni 2 Settimane fa da ma.pa.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41138 da Pandroid

mi chiedevo se avevate interpretato il fatto che tra dicembre e marzo la curva reale sta sotto quella teorica, come se già nel 19/20 l'influenza fosse stata sotto le aspettative.


Leva il "come se fosse". Il bimestre Dicembre-Gennaio 2019-2020 è quello che presenta il picco in assoluto più piccolo da anni (in termini di decessi per tutte le cause). In particolare:

DICEMBRE-GENNAIO 2019-2020
115.722 decessi
DICEMBRE-GENNAIO 2018-2019
124.088 decessi
DICEMBRE-GENNAIO 2017-2018
128.288 decessi
DICEMBRE-GENNAIO 2016-2017
140.089 decessi
DICEMBRE-GENNAIO 2015-2016
114.644 decessi

Non ho a disposizione il Dicembre 2014, ma il gennaio 2015 presenta 7359 decessi in più rispetto al Gennaio 2020, quindi è lecito attendersi solo il 2015-2016 come anno paragonabile.
Ora, non so se questo è dovuto al fatto che il picco influenzale è stato debolissimo, o se semplicemente il picco influenzale è stato pesantissimo, e si è verificato a Marzo-Aprile invece che nei mesi usuali, cioè Dicembre e Gennaio.
Da questo grafico è possibile ipotizzare che non è rarissimo che un picco influenzale si verifichi anche in mesi diversi da Dicembre-Gennaio:

Ok. La maggior parte dei picchi rappresentati sono in Gennaio. Ma ne abbiamo uno anche a fine Febbraio, l'altro sinistra cos'è, Ottobre/Novembre?


Per quanto riguarda il resto (t.i., correlazione tra tamponi e tutti gli altri parametri etc) ci devo pensare. Intanto ho richiesto il solito storico al Ministero della Salute, che sicuramente non lo avrà a disposizione.

mi chiedo quale sia il perverso meccanismo che fa sì che al lunedì vengano dichiarati meno tamponi e quindi meno positivi. Forse meglio non saperlo ^^; mi chiedo però perché non possano fornire i dati effettivi, visto che li hanno...


Franzeta ipotizza che, poichè la domenica hanno meno capacità di analisi, limitino i tamponi ai soggetti sintomatici (e da lì il picco, essendo il soggetto sintomatico più probabilmente positivo rispetto ad un asintomatico). E' un'ipotesi solida, ma va comunque verificata perchè da quello che so ad esempio gli insegnanti possono essere convocati anche di domenica per il famoso tampone che permette il rientro a scuola.

Aggiungo questo video, che analizza la situazione seguendo questo punto di vista:
Ultima Modifica 4 Anni 2 Settimane fa da Pandroid.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41167 da FranZeta

ma.pa ha scritto:
mi chiedevo se avevate interpretato il fatto che tra dicembre e marzo la curva reale sta sotto quella teorica, come se già nel 19/20 l'influenza fosse stata sotto le aspettative.

Sì e infatti molti (non io) sostenevano che la prima ondata covid fosse la solita ondata influenzale in ritardo. Fatto è che prima dell'impatto covid di marzo-aprile la mortalità era un 5-10% inferiore al previsto, e così ha continuato ad essere in molte delle zone non colpite.


mi chiedo quale sia il perverso meccanismo che fa sì che al lunedì vengano dichiarati meno tamponi e quindi meno positivi. Forse meglio non saperlo ^^; mi chiedo però perché non possano fornire i dati effettivi, visto che li hanno...

Il meccanismo è che il lunedì è il giorno successivo al minimo dei tamponi, come immaginavo anche in questa fase il grosso dei risultati dichiarati si riferisce ai test del giorno precedente. I numeri definitivi li hanno solo con un ritardo di circa una settimana per quanto riguarda i positivi per data di prelievo e di due per quelli per data inizio sintomi, come evidenziato dai riquadri grigi nel grafico postato sopra.

è esattamente il dubbio che mi preoccupa. Oltretutto i dati degli ultimi giorni sono sempre gravati dal fatto che la media mobile viene fatta solo sugli ultimi 4,5,6 giorni, e quindi oscillano a seconda del giorno della settimana in qui vengono presi (grazie ai mitici dati con il picco in negativo del lunedì).
Però vedi dopo :)


???

La media mobile si fa sugli ultimi 7 giorni a partire dall'ultimo dato disponibile, ecco perchè le due curve rosse non si sovrapponevano alla perfezione nel tratto comune!!!

Se fai, come mi sembra di capire, una media mobile "in avanti" centrata nel punto (ad es il 6/11 fai la media dei dati dal 3/11 al 9/11), la cosa ha senso solo quando si ragiona su una serie di dati già completa, ma qui la situazione è in divenire e la media va fatta a ritroso, se no hai una curva della media mobile che "prevede" tre giorni in avanti già di suo senza bisogno di nessun modello.


sono d'accordo con quello che dici, ma considera che lì eri ben prima del flesso, nella fase di crescita esponenziale, e un piccolo errore va a sballare completamente il risultato finale. Nel momento in cui superi il flesso della curva a campana, allora la previsione è sicuramente più azzeccata, perché hai mezza curva già fatta, e da quella puoi ricostruire il resto con un minimo in più di sicurezza.


Sì ma il problema è proprio capire quando hai passato il flesso senza avere l'altra metà della curva fino al picco. Tu ragioni sulla curva della media mobile, ma è solo un modo per "limare la seghettatura" della curva a consuntivo che alla fine della fiera è l'unica cosa che conta. Per esempio ieri c'è stato il record di nuovi casi (e anche di tamponi se è per quello), per cui a guardare la curva dei dati non si ha nemmeno la certezza di aver superato il flesso dei casi attivi, figuriamoci che certezza possiamo avere su dove stia esattamente questo flesso, nel caso l'avessimo superato:



Queste sono le curve rilevate, non le medie mobili. La curva blu (con scala a destra) dei casi attivi forse presenta un flesso, da qualche parte fra 300 e 400 mila. Ma sembrava averne uno anche fra 200 e 250 mila, che poi invece flesso non era. Ad oggi l'unica curva che si adatta bene al tratto che va da metà agosto a ieri resta ancora un'iperbole*.

Comunque adesso nel discorso si inserisce questo nuovo lockdown per cui salteranno tutti i ragionamenti sui parametri pregressi.

*(edit) Eccone qua una, tratteggiata in azzurro:


FranZη
Ultima Modifica 4 Anni 2 Settimane fa da FranZeta.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa - 4 Anni 2 Settimane fa #41207 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O

La media mobile si fa sugli ultimi 7 giorni a partire dall'ultimo dato disponibile, ecco perchè le due curve rosse non si sovrapponevano alla perfezione nel tratto comune!!!

Se fai, come mi sembra di capire, una media mobile "in avanti" centrata nel punto (ad es il 6/11 fai la media dei dati dal 3/11 al 9/11), la cosa ha senso solo quando si ragiona su una serie di dati già completa, ma qui la situazione è in divenire e la media va fatta a ritroso, se no hai una curva della media mobile che "prevede" tre giorni in avanti già di suo senza bisogno di nessun modello.


Hai ragione, in effetti ho usato la media a 7 giorni non solo per i dati vecchi ma anche per quelli nuovi. L'unica reale differenza, oltre alla traslazione della curva, è che elimini gli 3 ultimi dati, ma è vero che sono quelli che possono dare indicazioni errate rispetto al trend. Grazie, ho corretto, e in effetti va meglio.


Sì ma il problema è proprio capire quando hai passato il flesso senza avere l'altra metà della curva fino al picco. Tu ragioni sulla curva della media mobile, ma è solo un modo per "limare la seghettatura" della curva a consuntivo che alla fine della fiera è l'unica cosa che conta. Per esempio ieri c'è stato il record di nuovi casi (e anche di tamponi se è per quello), per cui a guardare la curva dei dati non si ha nemmeno la certezza di aver superato il flesso dei casi attivi, figuriamoci che certezza possiamo avere su dove stia esattamente questo flesso, nel caso l'avessimo superato:

Queste sono le curve rilevate, non le medie mobili. La curva blu (con scala a destra) dei casi attivi forse presenta un flesso, da qualche parte fra 300 e 400 mila. Ma sembrava averne uno anche fra 200 e 250 mila, che poi invece flesso non era. Ad oggi l'unica curva che si adatta bene al tratto che va da metà agosto a ieri resta ancora un'iperbole*.

Comunque adesso nel discorso si inserisce questo nuovo lockdown per cui salteranno tutti i ragionamenti sui parametri pregressi.


Purtroppo concordo che alla fine tutta questa analisi non serve. Sia perché cambiano le condizioni, sia perché se indichiamo come morti, ospedalizzati, terapia intensive le persone "positive" e non le persone effettivamente con sintomatologia prevalente Covid, allora con la diffusione -anche senza sintomi- del virus aumentano tutti i numeri. E non ci si capisce più niente.

Però, se fai la derivata della curva, ad un certo punto trovi un massimo, che è il flesso. Il massimo della derivata è stato raggiunto per i nuovi casi, per la percentuale di positivi, per le terapie intensive e per gli ospedalizzati. Anzi, per queste due ultime categorie la derivata è intorno a 0. Vero che sembrava essere stato raggiunto anche per i morti e così non è stato (ma d'altronde avrei dovuto pensarci, la curva dei morti segue le altre, non aveva senso non la seguisse). Ed è anche vero che per ospedali e terapie intensive potrebbe venir raggiunto per il sopravvenire (almeno in certi luoghi) del limite fisico dei posti.
Le curve sono fatte smussando con un'ulteriore media a tre giorni la derivata fatta sui dati con media mobile (ho come la sensazione che non troverai il metodo molto corretto :D)




Il fit delle curve a campana conferma questo trend, anche se vale il discorso che facevi sulla poca affidabilità in generale delle previsioni. Tuttavia, confrontando le vecchie previsioni con le nuove (anche se le prime previsioni che ho su file separati sono del 27/10, quindi non molti giorni fa) mi pare che non ci siano stati grandi cambiamenti. Sto un po' a guardare e vediamo. Con il lockdown in corso è difficile che i numeri si impennino di nuovo, e ho avuto un po' il timore che loro sappiano che stiamo arrivando al picco e che abbiano fatto il lockdown anche per poter poi dire "come siamo stati bravi!".
Ultima Modifica 4 Anni 2 Settimane fa da ma.pa.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 2 Settimane fa #41212 da Pandroid
Se masticate l'inglese qua un video interessante:


Inoltre il link al portale descritto:
app.powerbi.com/view?r=eyJrIjoiMGVjYjhkM...LWRhOGRiZTc5MGVmNyJ9

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 1 Settimana fa #41225 da FranZeta
@ma.pa

Come forse avrai notato io in questa seconda fase ho rinunciato del tutto ai modelli astratti e sono passato alle tabelle excel. I motivi sarebbero tanti ma su tutti prevale probabilmente l'istinto, che mi viene anche dall'ambito lavorativo, che mi dice che quando i dati sembrano troppo aleatori e forse anche contraddittori, la cosa migliore da fare per capirci qualcosa è raccoglierne quanti più possibile in tempo reale e incrociarli finchè - se va bene - non saltano fuori delle regolarità. Per questo approccio è molto più pratico excel di matlab, e può essere più rivelatore un grafico a barre di un sistema dinamico risolto numericamente.

Comunque, visto che questo è un thread di matematica, posso approfondire quelli che per me sono i problemi maggiori che si presentano se si vuol fare delle previsioni sull'evoluzione dell'epidemia, al netto di quanto gli attuali numeri possano essere attendibili.

Però, se fai la derivata della curva, ad un certo punto trovi un massimo, che è il flesso. Il massimo della derivata è stato raggiunto per i nuovi casi, per la percentuale di positivi, per le terapie intensive e per gli ospedalizzati.

Certo, se abbiamo a disposizione una curva derivabile due volte, basta vedere quando la derivata seconda cambia segno. Ma le uniche curve su cui potresti fare questa operazione sono le curve interpolanti dei modelli. La tua curva esponenziale ha il suo flesso, la mia iperbole no, e devi ammettere che l'iperbole si adatta ai dati per un periodo molto più lungo (ovviamente questa è una provocazione, non sostengo certo che l'andamento sarà iperbolico per sempre).

Quindi la curva interpolante non vale, bisogna usare le curve stesse dei dati che però sono curve discrete e quindi non derivabili. Bisogna ricorrere allora alle differenze finite, e già qui diventa molto più complicato capire quando la derivata seconda (nel senso delle differenze finite chiaramente) cambia segno. Si può usare una media mobile, ma anche qui i risultati non si possono ritenere univoci.

Per cominciare ragioniamo sulla curva dei casi attivi, o attualmente positivi che dir si voglia, dato che:

1 è già abbastanza regolare di suo e non richiede di essere interpolata da medie mobili;
2 è la più indicativa;
3 risente poco dei cicli settimanali;
4 da questa si possono ricavare facilmente altre curve rilevanti come quella dei ricoveri in TI o dei deceduti.

Come dicevo nell'ultimo commento questa curva sembrava avere un flesso fra i valori 300k-400k dell'asse delle ordinate. Ora se prendiamo le derivate (differenze finite...) la situazione è questa:



Innanzitutto la derivata seconda (curva E'' arancione trasparente) è piuttosto inutilizzabile e bisogna prendere una sua media mobile, io l'ho presa a 5 giorni per motivi che adesso non sto qui a spiegare. In corrispondenza di questo presunto flesso in effetti la media mobile di E'' cambia segno (zona verde), solo che poi torna positiva e come proseguirà lo scopriremo solo vivendo.

Vediamo come erano andate le cose durante la prima ondata, a mio avviso molto più attendibile a livello di dati disponibili:



Quello evidenziato è il flesso reale della curva, in data 29.03, ma lo possiamo dire adesso che vediamo tutta la curva, perchè se avessimo seguito l'evoluzione in quel periodo senza sapere cosa succedeva dopo, avremmo visto la media mobile di E'' tornare altre due volte in territorio positivo, prima di capire che il flesso l'avevamo passato per forza dato che ormai eravamo in zona picco.

Non solo, prima del flesso del 29.03 c'erano stati altri candidati:



che avrebbero originato curve epidemiche completamente differenti. Notare anche che la curva blu della derivata prima E' non ha il massimo in corrispondenza del flesso vero, ma in corrispondenza dell'ultimo flesso "finto". Per cui, ad oggi, non si può sapere se abbiamo superato o no il flesso dei casi attivi, serviranno ancora molti giorni di trend costante della derivata seconda, e magari quando avremo questo trend costante ci accorgeremo che siamo in prossimità del picco, e in definitiva a livello previsionale tutto il discorso sarebbe servito a ben poco.

FranZη

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 1 Settimana fa #41267 da Pandroid
Naturalmente è ancora presto per dirlo, ma sembra esserci un piccolo arresto nell'andamento del rapporto positivi/tamponi.
Italia:

Toscana:

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 1 Settimana fa - 4 Anni 1 Settimana fa #41272 da ma.pa
Risposta da ma.pa al topic La formula del latte è Vacca2O
ciao Franzeta,

scusa se rispondo un po' con calma ma ho avuto poco tempo.
Concordo con te che bisogna usare i dati reali per la questione della derivata. Al mio modellino con equazione "epidemica" ho un po' rinunciato, sta curva cambia forma troppo spesso per poterci fare affidamento. Inoltre la curva a campana sembra essere più larga che in primavera, quindi anche l'idea di usare gli stessi parametri (salvo l'altezza) non funziona tanto.
Concordo anche che sia impossibile individuare con solo un pezzo di curva la posizione dello zero della derivata seconda, però non sono sicuro che usare il numero di casi sia corretto.
Nessuno dei dati a nostra disposizione è corretto, a dire il vero:
- i casi dipendono dal numero di tamponi
- la percentuale dalle disposizioni su a chi fare il tampone (hanno appena cambiato)
- gli ospedalizzati e i terapia intensiva dipendono dalla possibile saturazione degli ospedali
- i morti dal fatto che arrivano in ritardo rispetto alle altre curve.
Però osservandole tutte assieme, queste curve, secondo me ci si può fare un'idea. Per deformazione personale non guardo mai il singolo punto ma guardo sempre il trend, "immaginandolo" a partire dai dati reali. Trovo che la mente umana sia ottima nello smoothing "a occhio". :)
Io vedo ospedalizzati e terapia intensiva che hanno più o meno raggiunto il picco. I morti che salgono ancora assai. I casi oramai oltre il flesso. La percentuale di positivi verso il picco (vedi anche i dati di Pandroid qui sopra).
Dopodiché questi dati lasciano il tempo che trovano (mi piacerebbe sapere tanto conoscere i numeri dei morti, TI e ospedalizzati con specifica causa covid e non semplilcemente positivi, ma non li avremo mai). Tuttavia non mi sembra impossibile fare qualche considerazione di massima. Non possiamo prevedere il picco in maniera precisa, né come numero né come data, ma un'indicazione che stiamo oltre la metà del picco, quella mi sentirei di darla per buona.



Però sono curioso: perché la media mobile su 5 giorni? :)
Ultima Modifica 4 Anni 1 Settimana fa da ma.pa.

Si prega Accesso a partecipare alla conversazione.

Di più
4 Anni 1 Settimana fa #41284 da FranZeta

Pandroid ha scritto: Naturalmente è ancora presto per dirlo, ma sembra esserci un piccolo arresto nell'andamento del rapporto positivi/tamponi.
Italia:

Sì, sembrerebbe così, anche l'altro indicatore Nuovi Casi Attivi / Nuovi Casi Testati che uso io dà l'impressione di aver scollinato:



************

ma.pa ha scritto: non sono sicuro che usare il numero di casi sia corretto.


Mah, non è tanto questione di correttezza, la curva dei casi attivi è quella che misura la dimensione dell'epidemia, le altre sono misure parziali (per esempio la curva dei nuovi casi giornalieri non tiene conto delle guarigioni). L'ondata epidemica si potrà dire chiusa quando la curva dei casi attivi si stabilizzerà su un livello più o meno costante, come quest'estate. Tra l'altro nella prima ondata il picco dei casi attivi è arrivato un mese dopo il picco dei nuovi casi giornalieri, e i casi attivi hanno iniziato a scendere solo quando hanno ridotto drasticamente la frazione di nuovi casi testati (nel grafico è il rapporto giornaliero O/P fra i nuovi casi testati e i casi già testati):



Però sono curioso: perché la media mobile su 5 giorni? :)


Perchè le serie dei dati hanno una regolarità settimanale, perciò se parti da una serie di dati x=(x1,...,x7), la serie delle differenze finite è:

x'=(x2-x1,...,x7-x6)=(x'1,...,x'6)

e analogamente la serie delle differenze finite seconde è:

x''=(x'2-x'1,...,x'6-x'5)=(x''1,...,x''5)

per cui a partire da n valori della serie originale x ottieni n-2 valori della serie x''. Dato che x ha regolarità su 7 giorni, per la x'' la media mobile che massimizza la regolarità dovrebbe essere a 5 giorni (o multipli), mentre una media a 7 giorni, che va a "pescare" nove valori della serie x, dovrebbe essere meno regolare.

FranZη

Si prega Accesso a partecipare alla conversazione.

Di più
3 Anni 11 Mesi fa - 3 Anni 11 Mesi fa #41635 da neveragainhc
Ciao Franzeta.
Ho seguito con interesse le tue argomentazioni sul numero di morti in altri topic e vorrei avvalermi della tua capacità critica e di analisi.

Questo è un grafico riportato dall'ATS milanese e riguarda la mortalità di soggetti di età inferiore a 70 anni:



Questo grafico lo interpreto così (e ti chiedo aiuto proprio su questa mia riflessione): l'eccesso di mortalità si è realizzato perché a morire sono stati principalmente soggetti positivi al coronavirus.

Ora, se il virus fosse presente nel 100% della popolazione, è abbastanza evidente che tutti i morti sarebbero positivi al coronavirus.
Ma se il virus è presente, ad esempio, nel 5-7% della popolazione, ipotizzando che il virus NON abbia alcun ruolo come causa di morte, io mi aspetterei che solo il 5-7% dei morti sia positivo al virus, il 93-95% invece morti virus-negativi la cui dipartita può essere stata conseguenza di sovraccarico del sistema sanitario ed altro.
Questo grafico invece mi sembra indicare che la positività al virus costituisce un importante fattore di rischio per morte, più della negatività al virus, per intenderci.
Una cosa simile la si legge nel documento da cui è tratta l'immagine ( www.ats-milano.it/portale/Epidemiologia/...ellepidemia-COVID-19 ).

"[...] mentre nella popolazione al di sotto dei 70 anni sembra che gli eccessi evidenziati siano tutti attribuibili al COVID".

Non c'ho capito niente?
Ultima Modifica 3 Anni 11 Mesi fa da neveragainhc.

Si prega Accesso a partecipare alla conversazione.

Di più
3 Anni 11 Mesi fa #41661 da FranZeta
Ciao neveragainhc, condivido il tuo ragionamento: se il Covid non c'entrasse nulla con l'eccesso di mortalità la quota di deceduti positivi al Covid dovrebbe essere all'incirca uguale alla percentuale di positivi tra la popolazione. Si potrebbe obiettare che se uno sta in ospedale ha più probabilità di infettarsi, però per quanto riguarda la Lombardia sappiamo da uno studio Istat che la sieroprevalenza del Covid nella popolazione si è attestata intorno al 7%, per cui ce ne vuole ad arrivare al 100% che spiegherebbe l'eccesso di mortalità.

Aggiungo però che per quanto riguarda la prima ondata abbiamo più serie di valori indipendenti e complementari che possiamo incrociare: i dati sui tamponi dell'ISS, indagini di sieroprevalenza, eccesso di mortalità. Tutte e tre convergono allo stesso risultato: fra marzo e aprile, in Lombardia e zone limitrofe, c'è stato un evidentissimo aumento della mortalità associato alla presenza del Covid, per cui a mio avviso la discussione sulla prima ondata è chiusa da mesi, chi vuole negare che ci siano stati i morti o che ci sia stato il Covid nega la pura e semplice realtà.

In questa seconda ondata invece abbiamo per ora solo i dati ISS, e francamente mi sembrano molto più innaturali di quelli che fornivano questa primavera, per cui voglio aspettare i dati della mortalità di ottobre e soprattutto novembre, disponibili presumibilmente fra un paio di mesi, per capire cosa effettivamente sia successo e stia tuttora succedendo in questo periodo.

FranZη
I seguenti utenti hanno detto grazie : neveragainhc

Si prega Accesso a partecipare alla conversazione.

Di più
3 Anni 11 Mesi fa #41662 da neveragainhc

FranZeta ha scritto: In questa seconda ondata invece abbiamo per ora solo i dati ISS, e francamente mi sembrano molto più innaturali di quelli che fornivano questa primavera, per cui voglio aspettare i dati della mortalità di ottobre e soprattutto novembre, disponibili presumibilmente fra un paio di mesi, per capire cosa effettivamente sia successo e stia tuttora succedendo in questo periodo.


I grafici di EuroMomo un picco lo mostrano, ma non so quanto i dati siano attendibili.
Fosse confermato, posso anche dire con relativa certezza che non si tratta di influenza.

www.euromomo.eu/graphs-and-maps

Si prega Accesso a partecipare alla conversazione.

Tempo creazione pagina: 0.475 secondi
Powered by Forum Kunena