Parole (meno) Sante: E tre!

martedì 12 maggio 2020

E tre!

Oleg mi ha ricontattato e stavolta è stato lui a confondermi le idee!

Mi ha detto di aver ripensato al problema che gli avevo dato e poi mi ha portato fuori strada. Il suo ragionamento è stato il seguente: sia M una funzione che ci dà il numero di possibili risultati per ogni insieme di eventi di cui vogliamo poi valutare la fortuna. Ovviamente M dipende da N, ovvero dal numero di singoli eventi. Nel nostro caso dove i risultati di un singolo evento possono essere solo 2 (colpito o mancato) avremo M(1)=2, M(2)=4, M(3)=8 etc…
Poi mi ha chiesto, per M(1), quali valori mi aspettassi potesse assumere la fortuna: ingenuamente gli ho risposto 100% colpito, cioè fortuna massima e 0% mancato, fortuna minima (o sfortuna massima). “Benissimo” mi ha risposto: “e per M(100500) cosa avresti per tutti centri?”.
Qui ho capito dove voleva andare a parare ma gli ho comunque risposto: “di nuovo 100%”. Ma è ovvio che così la fortuna espressa dal 100% di M(1) non è confrontabile col 100% di M(100500).

Sul momento mi ha convinto e così sono ritornato a propugnare l’approccio del calcolo della probabilità della distanza dalla media: non ho ripensato al fatto, come spiegato in Aggiornamento matematico, che c’è una sorta di equivalenza fra calcolo della distanza dalla media e probabilità dei singoli eventi.
Anzi mi è tornata in mente un’idea che avevo avuto prima di decidermi a contattare Oleg che mi era venuta in mente vedendo i video sul covid-19 dove la bontà delle ricerche è misurata col “p-value”: se il p-value è minore di un certo valore allora la probabilità che la ricerca sia significativa è maggiore del 95% o del 99% e così via. Mi sembrava logico che si potesse usare un meccanismo analogo per calcolare la fortuna. All’epoca però avevo provato brevemente a vedere la teoria che vi era dietro ma mi ero subito impaurito preferendo lasciar perdere…

Prima però avevo fatto un passo indietro: tornando a propugnare il calcolo della distanza della probabilità di un risultato dalla media. Nel mio “broken English” (più che a scrivere bene cercavo di essere rapido):
«but I initially wanted to measure the probability of difference from the mean
...
but what it is is for M(1)
and for M(100500)?
...
I think that for M(1) should be something around 50% and for M(100550) should be 0,000-many zeros-0001% then luckness could be 1-this percentage
luckness would not be linear but I don't care..».
Ma qui Oleg mi ha detto che c’era un’altra strada e io ho lascito perdere dimenticandomi di questo preciso esempio.

E invece avevo ragione! Era stato fuorviante pensare alla fortuna astrattamente come un valore da 0 a 100 (o da 0 a 1) e dire che “volevo” per il singolo centro di M(1) un valore di fortuna massima di 100. Ciò non ha senso per fare un singolo centro con, ad esempio, una probabilità del 60% non occorre la “massima” fortuna, anzi: si è leggermente sfortunati se si manca il bersaglio!
Invece la probabilità di tutti centri per M(100500), supponendo una probabilità uguale per tutti gli eventi del 50%, sarebbe prossima allo zero (cioè (1/2)^100500).
Con la mia formula la fortuna nel primo caso sarebbe 1-0.6=.4 mentre nel secondo 1-0,000-molti zero-0001% = 0,999-molti nove-9999. Nel primo caso neppure si dovrebbe parlare di fortuna mentre nel secondo sarebbe altissima, quasi 1 (valore che sarebbe sempre irraggiungibile).
Insomma tutto comparabile e nessun problema.

Invece Oleg ha cercato di convincermi con numerosi esempi che non si può parlare di misura della fortuna perché essa è incalcolabile e indistinguibile. Poi Oleg mi ha di nuovo parlandomi dei problemi di “affidabilità” matematica delle valutazioni con le “stelline” che spesso si vedono in rete. Lui vi vedeva un collegamento col calcolo della fortuna ma a me sembravano più attinenti alla valutazione della casualità…
Non sto a entrare nei dettagli ma alla fine gli ho detto che “casualità” e “fortuna” sono concetti diversi: mentre sul primo sono d’accordo che non ci sia un modo per individuarla e riconoscerla sulla seconda dipende solo dalla definizione, cosa che mi sembrava fattibile.

Anche a lui era venuto in mente il p-value e mi ha presentato un video molto bellino che spiega bene un apparente paradosso statistico/matematico: ma ne scriverò a parte (credo!) per non appesantire troppo questo pezzo.

Alla fine ci siamo salutati e io mi sono ripromesso di investigare nuovamente sul p-value…

Conclusione: dopo qualche tempo però (questo scambio di idee è stato sabato) mi sono reso conto che l’idea originale (1 – probabilità insieme di risultati) continuava ad andare bene e che quindi aveva poco senso complicarsi la vita. Però nel frattempo ho capito che il p-value è strettamente legato alla varianza che, in generale, è molto più facile da calcolare che la funzione di distribuzione di un evento. Nelle ricerche mediche infatti non si preoccupano della funzione di distribuzione (che probabilmente non sarebbe neppure calcolabile mancando troppi elementi) ma adoperano tranquillamente il p-value: insomma potrebbe valere la pena verificare come funziona perché potrebbe essere un metodo molto più semplice e generale per misurare la fortuna...

martedì 12 maggio 2020

E tre!

Nessun commento:

Posta un commento

I miei blog + o - attivi

Cerca nel blog

Epitome - V1150 "Mezza estate"

Archivio blog

Ghiribizzi che mi piacciono

Label Cloud

Eroici Lettori Indefessi

Visualizzazioni totali

Commenti recenti

Post più popolari (ultimi 7 gg)