Elaboazione Archivio BetFair
Inviato: 03/04/2010 - 03:33
Da un po' di tempo sto lavorando sui file(s) d'archivio che bf mette a disposizione di tutti http://data.betfair.com/
L'elaborazione di queste informazioni non è semlicissima, se si vuole ricavare un dato statistico utile bisogna considerare un arco temporale sufficientemente ampio, di un anno o più, e la mole di dati è ampia.
Una volta importati i dati li ho analizzati, interpretati e infine testati con un bot automatico. Putroppo in quest'ultimo step si è verificata un'incongruenza tra la proiezione che speravo si realizzasse e la realtà (c'era da spettarselo altrimenti non starei a scrivere eh, eh, eh...)
Perchè si è verificata questa inconguenza non riesco a capirlo di preciso, faccio un esempio con una corsa di levrieri UK:
ESEMPIO 1
EVENT_ID | SETTLED_DATE | FULL_DESCRIPTION | EVENT | SELECTION | VOLUME_MATCHED | WIN_FLAG | ODDS
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 5. Lagganmore Dazl | 444,26 | 0 | 6,2
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 4. Lady Avenger | 214,12 | 0 | 8
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 2. Lainies Diva | 97,5 | 0 | 10,5
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 6. He Isa Delight | 1639,46 | 1 | 3
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 3. Beccas Boy | 589,58 | 0 | 6
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 1. Drumena Magic | 198,16 | 0 | 7
Questo è un esempio di una possibile interpretazione dei dati che all'origine si presentano così (stralcio):
ESEMPIO 2
EVENT_ID | EVENT | SELECTION | ODDS | VOLUME_MATCHED | LATEST_TAKEN | FIRST_TAKEN | WIN_FLAG
100296195 | A5 480m | 6. He Isa Delight | 3,00 | 1639,46 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,00 | 35,06 | 05/01/2009 11:15 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,76 | 72,2 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,78 | 336,36 | 05/01/2009 11:17 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,80 | 674,32 | 05/01/2009 11:17 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,82 | 952,48 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,84 | 575,92 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,86 | 447,78 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,88 | 370,98 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,90 | 99,04 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,92 | 280,12 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,94 | 379,36 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,96 | 1394,7 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,98 | 919,52 | 05/01/2009 11:18 | 05/01/2009 11:18 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,05 | 204,26 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,10 | 290,68 | 05/01/2009 11:18 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,15 | 723,34 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,20 | 366,48 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,25 | 58,58 | 05/01/2009 11:18 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,30 | 114,56 | 05/01/2009 11:18 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,35 | 38,3 | 05/01/2009 11:16 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,40 | 43,8 | 05/01/2009 11:16 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,45 | 186,76 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,50 | 76,04 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,55 | 113,3 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,65 | 51,66 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,70 | 1,68 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,90 | 10,28 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,95 | 107,96 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,10 | 22,02 | 05/01/2009 11:14 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,20 | 3,82 | 05/01/2009 11:12 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,30 | 36,04 | 05/01/2009 11:14 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,40 | 6 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,50 | 11,34 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,60 | 4,66 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,80 | 20,62 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 5,40 | 2 | 05/01/2009 11:12 | 05/01/2009 11:12 | 1
...
In pratica BF ci dice che sulla sola selezione "He Isa Delight" dall'apertura del mercato fino alla chiusura ci sono state una serie di scambi da una quota minima di 2,76 fino a una quota massima d 5,4. Vale a dire un divario enorme. Come faccio a capire quale è stata la quota più rappresentativa di "He Isa Delight"? Ad esempio dal voume più elevato di scambi, in questo caso 1639£ @3. Allo stesso modo per le altre selezioni ricavo il mio ESEMPIO 1. Quindi su "He Isa Delight"la quota più rappresentativa non sarà la più bassa, nè la più alta e nemmeno la media, ma la quota dove si verifiacano la maggior quantità di scambi (che in genere coincide col maggior numero di scambi).
Quello che ne ricavo su base annuale è che a quota @3 le puntate sono più convenienti delle bancate perchè dall'analisi dei dati ho rilevato che nel lungo periodo la percentuale di vittorie a quota 3 riesce a coprire le sconfitte fino al punto di ricavarne un utile (NB è un esempio farlocco).
A questo punto tramite un bot incomincio a fare una serie di puntate @3 sugli eventi che mi interressano per verificare che concretamente riesco a ricavare qualcosa di buono ma purtroppo non è così. Perchè? Dove sbaglio? Immagino che l'interpretazione della quota più rappresentativa possa essere soggetta a una percentuale di margine d'errore. Quindi sottraggo la pecentuale d'errore (stimata 5%) dall'utile prospettato però ancora non ci siamo. Se faccio una serie di puntate @3 nel lungo periodo non vado in attivo.
Premetto che non so nulla di statistica quindi grazie in anticipo a tutti quanti siano interessati e disposti a mettersi in gioco su questo argomento. Sarò fuori per qualche gg, Buona Pasqua.
hth
didacus
L'elaborazione di queste informazioni non è semlicissima, se si vuole ricavare un dato statistico utile bisogna considerare un arco temporale sufficientemente ampio, di un anno o più, e la mole di dati è ampia.
Una volta importati i dati li ho analizzati, interpretati e infine testati con un bot automatico. Putroppo in quest'ultimo step si è verificata un'incongruenza tra la proiezione che speravo si realizzasse e la realtà (c'era da spettarselo altrimenti non starei a scrivere eh, eh, eh...)
Perchè si è verificata questa inconguenza non riesco a capirlo di preciso, faccio un esempio con una corsa di levrieri UK:
ESEMPIO 1
EVENT_ID | SETTLED_DATE | FULL_DESCRIPTION | EVENT | SELECTION | VOLUME_MATCHED | WIN_FLAG | ODDS
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 5. Lagganmore Dazl | 444,26 | 0 | 6,2
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 4. Lady Avenger | 214,12 | 0 | 8
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 2. Lainies Diva | 97,5 | 0 | 10,5
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 6. He Isa Delight | 1639,46 | 1 | 3
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 3. Beccas Boy | 589,58 | 0 | 6
100296195 | 05-01-2009 11:21:01 | BAGS cards / HGrn 5th Jan | A5 480m | 1. Drumena Magic | 198,16 | 0 | 7
Questo è un esempio di una possibile interpretazione dei dati che all'origine si presentano così (stralcio):
ESEMPIO 2
EVENT_ID | EVENT | SELECTION | ODDS | VOLUME_MATCHED | LATEST_TAKEN | FIRST_TAKEN | WIN_FLAG
100296195 | A5 480m | 6. He Isa Delight | 3,00 | 1639,46 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,00 | 35,06 | 05/01/2009 11:15 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,76 | 72,2 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,78 | 336,36 | 05/01/2009 11:17 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,80 | 674,32 | 05/01/2009 11:17 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,82 | 952,48 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,84 | 575,92 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,86 | 447,78 | 05/01/2009 11:17 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,88 | 370,98 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,90 | 99,04 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,92 | 280,12 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,94 | 379,36 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,96 | 1394,7 | 05/01/2009 11:19 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 2,98 | 919,52 | 05/01/2009 11:18 | 05/01/2009 11:18 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,05 | 204,26 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,10 | 290,68 | 05/01/2009 11:18 | 05/01/2009 11:17 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,15 | 723,34 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,20 | 366,48 | 05/01/2009 11:18 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,25 | 58,58 | 05/01/2009 11:18 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,30 | 114,56 | 05/01/2009 11:18 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,35 | 38,3 | 05/01/2009 11:16 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,40 | 43,8 | 05/01/2009 11:16 | 05/01/2009 11:16 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,45 | 186,76 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,50 | 76,04 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,55 | 113,3 | 05/01/2009 11:16 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,65 | 51,66 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,70 | 1,68 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,90 | 10,28 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 3,95 | 107,96 | 05/01/2009 11:15 | 05/01/2009 11:15 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,10 | 22,02 | 05/01/2009 11:14 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,20 | 3,82 | 05/01/2009 11:12 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,30 | 36,04 | 05/01/2009 11:14 | 05/01/2009 11:12 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,40 | 6 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,50 | 11,34 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,60 | 4,66 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 4,80 | 20,62 | 05/01/2009 11:14 | 05/01/2009 11:14 | 1
100296195 | A5 480m | 6. He Isa Delight | 5,40 | 2 | 05/01/2009 11:12 | 05/01/2009 11:12 | 1
...
In pratica BF ci dice che sulla sola selezione "He Isa Delight" dall'apertura del mercato fino alla chiusura ci sono state una serie di scambi da una quota minima di 2,76 fino a una quota massima d 5,4. Vale a dire un divario enorme. Come faccio a capire quale è stata la quota più rappresentativa di "He Isa Delight"? Ad esempio dal voume più elevato di scambi, in questo caso 1639£ @3. Allo stesso modo per le altre selezioni ricavo il mio ESEMPIO 1. Quindi su "He Isa Delight"la quota più rappresentativa non sarà la più bassa, nè la più alta e nemmeno la media, ma la quota dove si verifiacano la maggior quantità di scambi (che in genere coincide col maggior numero di scambi).
Quello che ne ricavo su base annuale è che a quota @3 le puntate sono più convenienti delle bancate perchè dall'analisi dei dati ho rilevato che nel lungo periodo la percentuale di vittorie a quota 3 riesce a coprire le sconfitte fino al punto di ricavarne un utile (NB è un esempio farlocco).
A questo punto tramite un bot incomincio a fare una serie di puntate @3 sugli eventi che mi interressano per verificare che concretamente riesco a ricavare qualcosa di buono ma purtroppo non è così. Perchè? Dove sbaglio? Immagino che l'interpretazione della quota più rappresentativa possa essere soggetta a una percentuale di margine d'errore. Quindi sottraggo la pecentuale d'errore (stimata 5%) dall'utile prospettato però ancora non ci siamo. Se faccio una serie di puntate @3 nel lungo periodo non vado in attivo.
Premetto che non so nulla di statistica quindi grazie in anticipo a tutti quanti siano interessati e disposti a mettersi in gioco su questo argomento. Sarò fuori per qualche gg, Buona Pasqua.
hth
didacus