domenica 12 aprile 2020

La data del compleanno, ovvero una simmetria complessa in un sistema di eventi probabili.



#Matematica, #Compleanni, #Probabilità, #ErroreAssoluto, #ErroreRelativo


Il giorno del mio compleanno è il 21 aprile e fatto sorprendente per alcuni è che condivido questa data con un mio cugino, seppur più giovane di me. Coincidenze di questo tipo appaiono sorprendenti, perché si pensa, forse per qualche retaggio culturale, che la struttura profonda della realtà sia in fondo un ordine regolato e che la meccanica che la presiede, quello che si registra quotidianamente con i sensi, abbia una sua direzione che non prevede simmetrie di questo tipo: rapporti di causalità e di successione, non di intersezione. Ora, un evento così piccolo come la coincidenza della propria data di compleanno è in effetti, motivo di preoccupante (o di meraviglioso) sconvolgimento di questo tipo di determinismo, perché suggerisce un tipo di struttura su cui non è possibile affermare alcuna previsione perché non può formularla e a causa della quale non può ravvisarsi nel comportamento degli eventi uno scopo che informi su un eventuale progetto di vita, perché questa finalità, qualora esistesse, è diventata nel frattempo una direzione di indirizzo generica, un’ipotesi di lavoro tutt’al più.

Ecco che le certezze meccanicistiche e deterministiche di un tempo vengono sostituite da ipotesi e congetture, ma soprattutto da valori probabilistici che negano ciò che l’intuizione ordinaria sembra suggerire e confermare o che privano la stessa dinamica esistenziale di quel poco di fantasia o di quella poesia che si è in dovere di riconoscerle– ma alla fine, si è veramente sicuri che sia necessario farlo?

La storia del calcolo probabilistico inizia da un fatto occasionale e senza pretesa di sconvolgere i massimi sistemi metafisici che governano da sempre il pensiero filosofico europeo; in particolare nasce da un’esigenza molto meno nobile di quel che si potrebbe pensare, cioè dall’avidità, in particolare di quella del giocatore d’azzardo intento nel cercare e trovare la strategia di gioco migliore per capitalizzare al massimo le proprie vincite. Ora, la filosofia europea si è sempre interrogata sul concetto di possibilità, ma ovviamente lo ha fatto tenendo ben presente che il significato di questo concetto andava sempre correlato al determinismo ontologico e gnoseologico dell’attività intellettuale del soggetto: a riguardo, decisiva è la formulazione del filosofo tedesco Immanuel Kant del termine di “possibile” (Möglichkeit) come una specifica condizione dialettica dell’esistenza che permette di estendere a quest’ultima molti dei concetti tradizionali della filosofia formulati e collocati sul piano delle idealità astratte (cfr. Guido Zingari, Speculum possibilitatis. La filosofia e l’idea di possibile, 2000 Editoriali Jaca Book, Milano). Ecco, la probabilità matematica che si sta considerando è in una certa misura una condizione strutturale di un certo modo di rappresentare le dinamiche degli eventi, tanto che questa è espressa da un valore ottenuto dal rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili. Insomma, un valore con il quale indicare quelle condizioni per cui un certo evento possa accadere realmente.

Ovviamente, il dato probabilistico non è una certezza, ma quantifica quanto possa realisticamente accadere un certo evento rappresentato da quel valore. In tal senso, la certezza – tra l’altro opinabile – per cui la probabilità sia un dato certo la si ottiene quando il rapporto in questione si risolve in una unità, cioè quando dà 1. In tutti gli altri casi, il valore esprime la tendenza dell’evento ad approssimarsi ad 1, cioè la tendenza dell’evento a verificarsi realmente. Pertanto, in linea di principio si può dire che la probabilità sia qui sotto descritta:

P(E) = P/n (1), dove con P(E) si indica il valore probabilistico di un evento, mentre la frazione è composta da “p” che sono gli eventi favorevoli e “n” tutti i casi relativi all’evento in questione. L’esempio più semplice è dato dal calcolo probabilistico che si ottenga un numero dal lancio di un dado: supponiamo di ottenere l’asso, la probabilità è pari a 1/6.

Una semplice descrizione dello argomento, senza entrare in eccessivi tecnicismi, è l’introduzione che Martin Gardner in un capitolo dedicato del suo libro del 1975, pubblicato in Italia con il titolo Ah! Ci sono! Paradossi stimolanti e divertenti, di cui è possibile trovare una edizione del 2008 della RBA Italia, ma volendo per avere un prospetto storico-concettuale si può consultare la breve appendice storica di Elementi di algebra per i licei, vol.2 del La Monnier (1990) di Cateni-Bernardi-Maracchia. Quando si ragiona di probabilità bisogna fare una distinzione degli eventi valutati in tre diversi tipi di situazioni probabilistiche:
  • Probabilità classica: indica la stima valutata in modo aprioristico dell’accadimento degli eventi. Un esempio tipico è la stima della probabilità che si ottenga un certo numero dal lancio di un dado. La struttura di questa probabilità è data dal rapporto k/n (2), dove con n si indicano tutti gli eventi possibili, mentre con k un suo sottoinsieme. Esempio, dato che un dado ha sei facce, quindi 6 è la possibilità che il dado mostri una delle sue facce, mentre se si punta sull’uscita almeno di un numero pari (2, 4, 6), sapendo che i numeri pari in un dado sono 3, il rapporto (2) è 3/6 = 1/2. Ovviamente, se si vuole la stima di un numero qualsiasi la probabilità è 1/6.
  • Probabilità statistica: indica la stima della frequenza con cui accade un certo evento. Supponiamo la uscita del numero 6 da un lancio di dadi. Fissiamo un intervallo di 100 lanci, la probabilità è stimata 7/10.
  • Probabilità induttiva: indica la stima che lo scienziato formula in relazione alla validità di una legge generale o di un principio teorico.

Ciò detto, l’argomento che ho introdotto parlando delle date dei compleanni consiste nel rilevare come un evento di questo tipo, ritenuto sorprendente, sia più consueto di quel che si creda, anzi il caso opposto, cioè, della non coincidenza delle date è meno ricorrente. Una lettura di questo tipo è quanto proposto dal libro di Rob Eastaway e Jeremy Windham, i quali affermano che se certe coincidenze attirano più di altre è soprattutto per motivi psicologici, che non per vere ragioni matematiche, «gli eventi noiosi – dicono gli autori – vengono dimenticati in fretta, ma le coincidenze attirano l’attenzione e restano impresse nella memoria» (ib., Probabilità, numeri e code, 2017 Milano, p.84). Un argomento che rivela con spietatezza, anche se in una certa misura non completamente risolutivo, i limiti di un certo determinismo e della sua ontologia di riferimento, fosse anche un’ontologia storicistica.

Ciò detto, l’esempio della coincidenza delle date dei compleanni è molto diffuso nei manuali di divulgazione matematica, perché è un facile modo per spiegare l’andamento probabilistico e soprattutto il valore probabilistico relativo alle coincidenze. Infatti, quando si valuta il valore di una coincidenza si deve tenere in considerazione il fatto che si vuole instaurare una qualche relazione tra due eventi presi come eterogenei certamente, ma anche come equiprobabili, cioè come eventi che hanno la stessa probabilità di accadere singolarmente, ma anche simultaneamente. Spiegare le coincidenze delle date di compleanno significa immaginare che ci sia una simultaneità tra due eventi diversi. Ed è quanto si andrà a valutare.

Immaginiamo la seguente situazione. Ci si trova in una classe scolastica ancora vuota tranne per la presenza di due soli bambini. Ci si chieda infatti, quale sia la probabilità che i due bambini attualmente presente in aula abbiano la stessa data di compleanno. In base al breve prospetto sopra, la probabilità in generale che due bambini qualsiasi abbiano la stessa data è fissata dalla Probabilità classica, cioè pari a 1/365, ma qui si sta chiedendo una probabilità diversa, vale a dire quanto sia probabile che questi due bambini abbiano la stessa data. In questo caso, il ragionamento insiste sull’accadere simultaneo degli eventi, per cui la stima che si chiede è pari al prodotto dei due eventi, cioè ad AxB.

Per meglio comprendere questo meccanismo calcoliamo la probabilità con un sistema elementare, cioè con il lancio di una moneta. Una moneta ha due facce e quindi, la possibilità che in un lancio dia o testa o croce è pari a 1/2. Poiché ci interessa la frequenza probabilistica, la valutazione deve compiersi su un certo intervallo di lanci. Per ora, ci si limita a considerare un intervallo di due lanci. La stima che si ottiene è pari a:

½ x ½ = ¼.

La possibilità che nel lancio di una moneta possa uscire “testa” (o altrenativamente “croce”) è pari alla stima di 1 su 4, vale a dire che su due turni di lancio la possibilità che si ottenga la faccia della moneta desiderata, supponiamo “Testa”, è una su quattro, perché le combinazioni che si ottengono sono TC, CT, CC, TT: solo una combinazione è vincente, le altre hanno un valore o frazionario o nullo. Ora, torniamo all’esempio delle date dei compleanni.

Si supponga che i due bambini abbiano date diverse, il calcolo della loro probabilità indica nel valore pari a 364/365 la stima per cui ciò si realizzi: rispetto a quell’unico giorno in cui la data coincide, vi sono 364 giorni “liberi” e quindi, una di queste date libere è il giorno di compleanno diverso da quello dell’altro bambino in esame. Bene, a questo punto si osservi cosa accade se iniziano a giungere in classe, uno per volta, gli altri studenti, si avrà quanto segue:

la probabilità che il bambino successivo abbia una data diversa è pari stavolta a 363/365. Quella del bambino appresso è di 362/365 e quella dell’altro bambino appresso è di 361/365 e così di seguito fino a completare l’intera classe, qui nell’esempio supposto raggiunto a 23 bambini. La probabilità che tutti i bambini abbiano una data di compleanno diversa pertanto, è stimata a 343/365, che è il valore dell’ultimo bambino entrato in classe e quindi, è quello che assegna a tutta la classe il valore complessivo di probabilità.
La probabilità, cioè la frequenza che questi 23 bambini festeggino in una data diversa l’uno dall’altro il proprio compleanno è data dalla seguente serie

364/365 x 363/365 x 362/365 x 361/365 x … x 343/365 = 0,49, cioè al 49%.

Di riflesso, la percentuale di coloro che non sono compresi in questo 49% compongono l’insieme dei bambini che festeggiano il loro compleanno in una data comune ad altri loro compagni. Ciò significa che la stima probabilistica di osservare che due o più bambini festeggino il loro compleanno nella stessa data è leggermente superiore a quella dei bambini che festeggiano il compleanno in date diverse. Pertanto, lo stupore che si prova dinanzi a questo tipo di coincidenze è meno sorprendente di quel che sembrerebbe a prima intuizione.


Tramite la teoria della probabilità si comprende perché ciò accade. Nel determinare la simultaneità di due eventi, si mettono in correlazione alcune quantità, ma nel fare ciò deve distinguersi quanto segue:
  1. La possibilità che un evento specifico accada, pur ritenendolo improbabile;
  2. La possibilità che un evento qualsiasi accada, pur ritenendolo improbabile.

Questa distinzione rivela due diverse condizioni che sono riferite alla percezione che si ha di una medesima situazione. Nel valutare la probabilità di un evento deve considerarsi il contesto entro cui si colloca l’evento in questione, cioè se è un caso generalizzabile, oppure se sia un fatto specifico. L’avevo premesso sopra con l’esempio della moneta. La stima per cui si possa festeggiare il compleanno nella stessa data è infatti, pari a 1/365 (probabilità specifica) oppure nel caso del lancio di una moneta semplicemente a 1/2 (probabilità generica).

Eastaway e Windham in tal senso, per dimostrare l’esistenza di una certa correlazione probabilistica, propongono un gioco collettivo derivato da questo tipo di ragionamenti, che consiste nel prendere dei foglietti e far scrivere su di essi dal proprio gruppo di amici o di intervenuti un numero a scelta libera compreso tra 1 e 100. Si osserverà la seguente situazione:
  1. La scelta prevalente dei giocatori si muoverà verso numeri molto alti, per cui la stima probabilistica si baserà sulla frequenza di scelta che si colloca verosimilmente dopo il numero 50; in tal senso, la stima può configurarsi nel semplice 50-50.
  2. Più alto è il numero dei partecipanti al gioco, più evidente è la coincidenza dei numeri scritti dai giocatori. In merito, si è calcolato che per un gruppo di 20 persone, la stima probabilistica è di circa 7 a 1: ciò significa che almeno 7 persone scriveranno lo stesso numero, il che rapportato a 20 persone è una stima molto alta.

Fin qui il ragionamento si è indirizzato verso il calcolo della probabilità che hanno gli eventi di accadere, ma qual è, anzi come si fa a stabilire la possibilità nel caso in cui non accadano?

Anche in questo caso ci si sta riferendo alla frequenza probabilistica. Torniamo ad un esempio semplice come il lancio di un dado. Supponiamo di giocare a dadi, di utilizzare due dadi, anziché uno e di puntare di volta in volta sull’uscita di un certo numero: stabiliamo il numero 12, cioè la somma di «6+6». La stima della probabilità che da un lancio si abbiano due dadi che mostrino la faccia con il numero 6 è pari a 1/3 (3).

Detto questo, la percentuale probabilistica che esca “12” e quindi, il valore probabilistico atteso è pari al rapporto (3) moltiplicato per tante volte che si lanciano i dadi, per cui

1/3 x 1/3 x 1/3 x 1/3 x … cento volte, oppure venti volte, oppure cinquanta volte e così via.

In sintesi, l’incremento del periodo su cui si effettua la stima «serve solamente ad aumentare la probabilità di coincidenza» (cfr. Peter M. Higgins, Divertirsi con la matematica, ed.it. 2017, p.193) e non ad invalidare o a confermare l’argomento in questione. La fattorizzazione delle frazioni rivela che per quanto lungo possa essere l’intervallo su cui si osserva il comportamento probabilistico, il valore di probabilità rimane lo stesso, semmai la probabilità di non ottenere un “12” dal lancio di due dai è pari a 10/12, che un valore più alto dell’altra stima.

La logica che è alla base di questo ragionamenti è quella di comporre una struttura in cui le quantità stanno tra loro in un rapporto costante e ricorrente, nonostante si esplichi in sequenze numeriche lunghe e questa particolarità permette l’estensione del calcolo probabilistico non solo alle scommesse d’azzardo, da cui storicamente deriva, ma anche nella determinazione degli errori di misura, in base ai quali si determina il grado di incertezza dell’operazione che si sta svolgendo.

In fisica è noto che compiere una misura vuol dire essenzialmente realizzare un confronto con un’unità di misura, quest’ultime di diverso tipo a seconda dello stato fisico in cui si trova il campione da misurare. Nell’effettuare queste misurazioni si può incorrere in qualche errore di misura, cioè in una stima sbagliata dell’operazione che si sta effettuando. In genere, le incongruenze a cui si incorre sono di due tipi, anzitutto di tipo metodico, vale a dire errori causati dall’uso di strumenti con una sensibilità di misura eccessiva e che si riflette nel computo della misurazione: per “sensibilità” si intende la capacità di uno strumento di misurare unità di grandezza piccolissime e ciò descrive il suo grado di sensibilità. A questa tipologia deve aggiungersi quella degli errori accidentali, composta per lo più da non corretti posizionamenti dello strumento di misura e comunque legati all’attività dell’operatore: a loro volta questo tipo di errori si dividono in diretti e indiretti. Ciò che qui interessa è come calcolare una stima dell’errore o del grado di incertezza di una misura.
In linea generale, un indice generico di errore è dato dalla raccolta di un certo numero di misurazioni in una griglia di valutazione. Dal computo dei valori riportati in griglie di questo tipo si ottiene il valore medio di una misura, cioè il valore intorno al quale si attesta la stessa misurazione. Il valore medio ovviamente, non contempla in sé l’eventuale errore di misurazione, cioè legato alla sensibilità dello strumento di misura. Pertanto, l’errore può e deve determinarsi nei seguenti modi:
  1. Il grado di incertezza o di errore di misurazione che si sta cercando definisce in effetti ciò che in fisica si chiama «errore assoluto». L’errore assoluto è direttamente correlato alla sensibilità dello strumento di misura e descrive l’intervallo o il margine di tolleranza ammesso dallo stesso strumento. Esempio, data una misura che oscilla tra gli 80 mm e gli 81 mm, l’errore assoluto si calcola anzitutto, misurando il valore medio dell’errore, che si ottiene come la somma delle due misure più prossime diviso due: 80+81/2 = 80,5 mm. In seguito, si determina il grado di sensibilità dello strumento o errore assoluto, che si ottiene come la differenza delle due misure effettuate diviso due, 81-80 / 2 = 0,5 mm. Avuti questi dati l’errore assoluto si compone nel modo seguente 80,5 ± 0,5 mm.
  2. Tuttavia, in molti casi ciò che è di grande interesse, soprattutto in corso d’opera, è l’«errore relativo», che è quello con il quale si determina il grado d’incertezza effettivo di una misura. Il valore dello errore relativo è dato dal rapporto tra l’errore assoluto ed il valore medio della misura. Esempio, la frazione 0,5 / 80,5 = 0,0062 mm.

Questo discorso sull’errore in fisica si compone in questo ragionamento sulla probabilità in questo modo. Peter M. Higgins riporta un aneddoto che riguarda lo scienziato inglese Isaac Newton, a cui era stato chiesto da parte dello scrittore inglese Samuel Pepys, appassionato giocatore, di determinare la probablità di uscita dell’asso in un lancio di dadi. La situazione proposta da Pepys prevede due diverse modalità, una in cui un giocatore lanci due dadi, l’altra in cui un altro giocatore lanci invece dodici dadi. Il quesito posto è di determinare quale dei due si trovi in una posizione avvantaggiata per ottenere l’asso. L’impressione, la stessa avuta da Newton, ci spinge a pensare che la situazione così posta non pone alcun vantaggio specifico, ma Pepys in base alla sua esperienza proponeva tutt’altra valutazione.

Riprendiamo quanto finora detto sul calcolo delle probabilità, ma stavolta proviamo a determinare il valore di errore dell’evento probabilistico. In base a quanto detto prima, la Probabilità classica che un numero qualsiasi si ottenga dal lancio di un dado è pari a 1/6, ma la probabilità che ciò non avvenga è però 5/6; ebbene, questa frazione compone l’errore assoluto su cui si fonda la previsione relativa al lancio di un solo dado. Ma poiché il lancio riguarda i due dadi dell’aneddoto, il valore per cui l’evento atteso non si realizzi è pari alla stessa frazione elevata a sei, (5/6)6. L’errore è dunque, 1 - 0,335 = 0,665. Ora, l’intuizione sembra suggerire che il secondo giocatore, tirando dodici dadi, ha più opportunità di prendere l’asso richiesto dalla scommessa. Nel suo caso, la possibilità che non ottenga l’asso è pari al valore di (5/6)12, ma diversamente per il primo giocatore la determinazione del valore per l’evento non realizzato deve essere processato in una sequenza di dodici frazioni, così scritte
1/6 x 5/6 x 5/6 x … x 5/6         (4).

Dando una scrittura più sintetica, la (4) può scriversi nel modo seguente:

12 x 1/6 x (5/6)11, da cui si sottrae 1 per ogni quantità e si ha 1 – (5/6)12 – 12 x 1/6 x (5/6)11 = 0,619.

Dal risultato ottenuto si evince chiaramente che il suggerimento dell’intuizione è fuorviante, perché il valore della probabilità di prendere l’asso è più alto nel primo giocatore che non nel secondo giocatore che lancia dodici dadi: il margine di errore, cioè di non prendere l’asso, è più piccolo che non nella situazione a dodici dadi. A tal riguardo, la supposizione dello scrittore inglese risulta corretta.

Da questi esempi si evince un fatto comune, cioè che il rapporto che viene istituito tra le varie quantità per determinare la probabilità descrive una sorta di simmetria numerica che vale sia nel caso in cui si ragiona sulla verificabilità degli eventi, sia nel caso in cui si ragiona sulla loro non verificabilità. Questo modo di comporre le quantità ha anche il vantaggio di descriversi in termini grafici sotto forma di lunghezze. Infatti, si può ricorrere ad un sistema cartesiano ad assi ortogonali per ottenere un grafico con il quale descrivere l’andamento e/o prevedere l’esito finale di un evento. A titolo di esempio, la situazione che si descriverà è quella standard esemplificata di uno scrutinio elettorale relativo ai voti di preferenza raccolti da due candidati, il candidato A ed il candidato B.

Ora, è noto che per disegnare un punto su un sistema cartesiano occorra una coppia di valori (x, y), in questo caso però apportiamo una leggera variazione allo schema e la descrizione grafica tiene considera il numero totali di voti espressi e la collocazione in una regione del sistema in base al presunto vantaggio che si ammette di un candidato rispetto ad un altro: in figura vengono proposti due schemi diversi, ma impostati su un presunto vantaggio del candidato B. In questo tipo di situazioni, il grafico costruisce il valore della probabilità in base al seguente rapporto

p = n / n + 2           (5).

Per semplificare la spiegazione dell’argomento si è immaginato un numero totale di 12 voti, distribuiti lungo lo schema in due strisce di processo diverse. L’esito finale dello scrutinio è sempre il medesimo, la vittoria del candidato B, ma come si osserva dal grafico la probabilità che può evincersi è da un lato collegata alla distribuzione degli stessi voti durante il processo, dall’altro lato dal differente margine di vittoria che viene a delinearsi appunto in relazione all’andamento della probabilità.

Ciò detto, in conclusione, la struttura matematica che presiede alla costruzione di rapporti con i quali descrivere e rappresentare le coincidenze rivela con una certa evidenza che la circostanza per cui due eventi possano essere correlati ed essere altrettanto probabili, nel senso di verificabili, è una situazione più diffusa di quel che si creda. Il fatto che quest'evidenza non appaia tale è determinato da ambiguità linguistiche o da interpretazioni testuali e via dicendo, queste correlazioni tra gli eventi possono essere oggetto di giudizi che vengono formulati in base ad un registro qualitativo, in base ad una logica dell’interesse che può essere individuale o tutt’al più collettivo che assegnano un certo colore piuttosto che un altro, rendendole di volta in volta o di straordinario rilievo, o di indifferente irrilevanza. La citazione all’inizio relativa alla coincidenza di data tra quella mia e quella di un mio cugino ha questa doppia funzione, quella di mettere in chiaro fin da subito che questo tipo di situazione è più diffusa di quel che si creda e che, a suo modo e nel suo piccolo, è un evento di grande interesse sia personale, sia intellettuale o matematico che dir si voglia.




Post Scriptum. Inizialmente avevo pensato diversamente questo p.s., ancora adesso non sono neanche tanto convinto di cosa lasciare scritto su queste righe, di certo rimane la voglia di evitare di pensare alla data del compleanno come l’annuale conta del tempo passato e pensarla invece, come la formula con la quale riprendere se stessi, riprendere in particolare e forse con una certa consapevolezza quel momento in cui ho iniziato ad esistere; e quindi, dicendo la data del mio compleanno è come dire «eccomi qui!», con tutte le ovvie conseguenze che ciò comporti. Insomma, avendo la voglia di ragionare in termini di in-sistenza, boicottando la classica contrapposizione epistemica tra essere e nulla, ammettendo in fondo, che l’essere è un certo retaggio culturale primitivistico, se non un altro sinonimo del nulla e non per il gusto di cavillare sulle contraddizioni: pensare alla data di nascita come il momento in cui si inizia a vivere nella complessità, senza credere che ciò significhi crogiolarsi nelle contraddizione del tutto insanabili della realtà; ma iniziare a pensare allo stesso modo che vivere queste contraddizioni non significhi non poterle risolvere definitivamente in modo complesso. Se poi, si aggiunge che la mia data di compleanno cade nello stesso periodo quaresimale e pasquale, l’intera situazione si carica di tutti quei significati legati alla resurrezione e alla morte, alla rinascita cristiana dell’uomo nuovo e la vittoria contro il peccato originario e ad una diversa sensibilità nei confronti del tempo che non ha più la valenza ciclica della cultura pagana. A questo punto, la simmetria che viene allusa nella struttura probabilistica che permette di spiegare come l’incidenza per molti sorprendente delle coincidenze delle date dei compleanni rivela un diverso motivo deterministico e forse anche un’inattesa formula lontana dagli antichi saperi, bah forse sto rimuginando pensieri a vuoto tanto per giustificare queste ultime righe.

Nessun commento:

Posta un commento