Poi non ho resistito e ho rimesso le mani sul programma che associa epigrafi a capitoli/sottocapitoli secondo le mie particolari regole (spiegai dettagliatamente l’algoritmo in un pezzo precedente).
Il problema è che mi ero ritrovato con 25 epigrafi di Hobsbawm, 13 di Aristotele, 10 di Hobbes e 6 di Sartori con piccole oscillazioni di numero per le successive approssimazioni…
La mia sensazione era che non si esploravano abbastanza combinazioni (uso un algoritmo genetico e non la forza bruta) e allora mi era venuta l’idea di non basare la popolazione iniziale sulla sola Associazione migliore (con “associazione” scritto maiuscolo intendo l’oggetto che contiene tutte le associazioni epigrafi capitoli/sottocapitoli e non una sola di queste) ma anche sulle migliori trovate a ogni sessione in cui non batto il precedente primato di punteggio.
Per fare questo ho aggiunto un nuovo archivio JSON con l’elenco delle varie Associazione migliori.
Ci ho perso un sacco di tempo (ero arrugginito) con risultati (ovvero miglioramenti) modesti.
Poi ho provato a cambiare le regole di “riproduzione” che basano il numero di figli di ogni Associazione con la distanza in varianze dalla media: meno figli a quelli nella media e di più per quelli più distanti.
Ma niente, sempre poca differenza…
In pratica sono passato da un primato di 537,12 a 540,12: un aumento di appena lo 0,56%…
Poi ho deciso di provare a ritoccare il calcolo del punteggio di ciascuna Associazione. Fra i vari fattori è considerato, per ciascuna epigrafe, il numero di epigrafi dello stesso autore: più sono e meno valgono. Ma non usavo una formula specifica, semplicemente avevo definito alcuni intervalli, arrivando al massimo a dividere il bonus valore per 12.
Evidentemente sempre troppo…
Così ho deciso di tagliare la testa al toro e di cambiare completamente approccio: invece di modificare il valore di ogni singola associazione epigrafe a capitolo/sottocapitolo ho deciso di modificare il valore dell’Associazione dividendolo per la varianza del numero di epigrafi per autore.
Ovvero più il numero di epigrafi per autore è simile fra loro e meglio è. Ma soprattutto vengono pesantemente penalizzati i picchi causati da autori con molte più epigrafi della media: ovvero Hobsbawm, Aristotele e Hobbes…
Il vecchio primato nel nuovo sistema di calcolo è passato da 540,12 a 3,46.
Già alla prima esecuzione del programma il primato è passato a 9,08 con: ARI → 7; BSB → 6; MAC → 5; MAL → 5; FRE → 5 e a seguire tutti gli altri con un numero di epigrafi minore o uguale a 4.
La progressione a ogni esecuzione è stata: 16.15, 18.13 (+1), 18.65, 18.81 (+1), 19.31 (+1), 19.83 (+3), 19.89 (+1). Da qui ho iniziato a farmi stampare 4 decimali. 19.8931 (+4), 18.8931 (un miglioramento dal 5 decimale evidentemente), 19.893147 (+1) (passato a 6 decimali), 19.907358.
Adesso il numero di epigrafi per autore era divenuto: Hobsbawm → 7; Aristotele → 6; Machiavelli → 5, poi altri 7 autori con 4 epigrafi ciascuno e, a seguire, tutti gli altri con 3 o meno.
A questo punto ho aggiunto anche due epigrafi dal “Malleus maleficarum” di Sprenger e Kramer che sono state prontamente inserite nell’Associazione migliore.
Il nuovo punteggio è passato a 20.728691: il numero di epigrafi per gli autori più usati non è cambiato. Immagino che due autori che avevano 3 epigrafi a testa siano passati a 2 a testa…
Nel corso della sera (mentre facevo altre cose ovviamente) il punteggio è progressivamente arrivato a 22.045805…
Col senno di poi l’idea di dividere il valore complessivo della Associazione per la varianza del numero di epigrafi per autore sembra banale: inizialmente mi sembrava avesse senso penalizzare il solo valore dell’associazione epigrafe a capitolo/sottocapitoli ma, in effetti, ne ha ancora di più penalizzare l’intera Associazione…
Avrei da inserire delle epigrafi per Rawls (al momento nell’Associazione migliore ve ne sono 4) ma a parte che le devo ancora copiare manualmente dal libro (e mi fa MOLTA fatica) è però evidente che non potrei migliorare di troppo: se per esempio togliesse un epigrafe a Hobsbawm (passerebbe da 7 a 6) allora Rawls andrebbe da 4 a 5… poca roba insomma… comunque anche solo per curiosità…
Conclusione: mi sa che ho annoiato i miei lettori con discorsi incomprensibili ai più! Vabbè, metterò al pezzo il marcatore “Peso” per non sentirmi in colpa!
Sonetti d’amore. Giacomo da Lentini
1 ora fa
Nessun commento:
Posta un commento