Ubi: Esistono secondo te delle statistiche chiave per vincere i match? Su Twitter, un dottorando in fisica che si occupa di tennis e statistiche, @Vestige_du_jour, è un convinto sostenitore della scarsa importanza della percentuale di prime in campo – tu pensi che ci siano dei dati ‘overlooked’ o viceversa sovrastimati?
ES: Vi faccio i complimenti, seguo anche io @Vestige_du_jour e la maggior parte dei suoi tweet sono in giapponese… oltre a contenere analisi estremamente tecniche, che però evidenziano come sia possibile produrre informazione di sostanza nell’incontro di discipline sulla carta tra loro distanti. Almeno nel tennis, una statistica è chiave nel momento in cui aiuta all’individuazione di tendenze di gioco e quando possiede un potere predittivo. Per questo le famose Chiavi del Match di IBM negli Slam di qualche anno fa spesso non funzionavano: statistiche inusuali non necessariamente danno indicazione sulla probabilità di vittoria di un giocatore. Inoltre, è sempre fondamentale raffinare il contesto di riferimento per evitare di assegnare eccessiva importanza al dato singolo, ad esempio prendendo in considerazione le medie del circuito o il rendimento di un giocatore nelle ultime partite giocate con caratteristiche simili.
In passato sembrava che il rapporto tra vincenti ed errori non forzati fosse un indicatore imprescindibile della bontà di una prestazione, cioè se superiore a 1 avrebbe garantito, salvo in casi eccezionali, la vittoria. In realtà è un numero che nasconde un difetto di fondo, vale a dire l’impossibilità di un arrivare a una definizione non arbitraria della forzatura o non forzatura di un errore. Come detto, avessimo a disposizione più dati, si potrebbe pensare di provare a generare algoritmi in grado di operare una classificazione più specifica e affidabile, così da calcolare la probabilità di esiti diversi del punto e assegnare un valore in termini di incidenza sulla vittoria. In altre parole, inserire il giudizio sulla difficoltà di un determinato colpo all’interno di uno scenario nel quale assuma un significato anche per l’elaborazione di strategie vincenti.
Sull’importanza della percentuale di prime in campo, un amico ha calcolato che su circa 86 mila partite maschili del circuito maggiore, solo nel 57% dei casi il vincitore ha avuto una percentuale di prime superiore a quella dello sconfitto. In effetti, come sostiene @Vestige_Du_Jour, non sembra un indicatore su cui impostare ciecamente una tattica di gioco. Merita degna attenzione se la si legge però in ottica predittiva, e mi rifaccio a un’analisi di Sackmann sull’individuazione di statistiche generiche in cui uno o due punti percentuali addizionali possono fare la differenza nella probabilità di vittoria. Tra queste, c’era la percentuale di punti vinti sulla prima, quella di punti vinti sulla seconda, e appunto la percentuale di prime in campo. Nel precedente campione di 86 mila partite, si è trovato che il giocatore con la percentuale più alta di punti vinti sulla prima ha poi vinto nell’83% dei casi. Pur non essendoci un’evidente correlazione tra le prime in campo e i punti vinti (un giocatore può avere un’alta percentuale di prime di servizio ma una bassa frequenza di punti vinti con la prima o con la seconda, e viceversa), generalmente più prime di servizio rimangono dentro, maggiore è la probabilità di vittoria. Anche qui, la sottostima o sovrastima di un indicatore va esaminata in funzione del contesto. Una determinata percentuale di punti vinti sulla prima può essere il numero che guida i grandi servitori per battere la maggior parte degli avversari. Altri giocatori invece possono ritenere cruciale una frequenza più alta di prime di servizio.
Ubi: Come credi che i numeri abbiano impattato lo stile di gioco fino a questo momento, e come credi che lo faranno in futuro in entrambi i tour?
ES: In realtà credo che, ad oggi, tecnologia e preparazione abbiano inciso sullo stile di gioco molto più dei numeri. La rivoluzione dei materiali, fra tutti le corde, e l’applicazione di tecniche di allenamento e programmi nutrizionali estremamente sofisticati hanno permesso di raggiungere livelli prestazionali mai visti in precedenza. Velocità e potenza dei colpi sono diventate sbalorditive, come sono assolutamente incredibili mobilità e resistenza di strutture fisiche imponenti che sopportano il carico di una stagione di quasi 11 mesi ininterrotti. Per il Match Charting Project mi capita spesso di rivedere partite integrali degli anni ’80 o ’90: rispetto all’intensità odierna, sono immagini quasi alla moviola, in cui una prima a 190 km/h merita un’inquadratura del contatore a bordo campo e lo stupore sugli spalti, mentre ora è una velocità frequente anche per alcune giocatrici. In confronto, la finale dell’Australian Open 2012 tra Djokovic e Nadal, quasi sei ore di scambi feroci, appartiene a un altro sport (senza dimenticare che un giorno e mezzo prima Djokovic aveva battuto Murray in un’altra partita infinita di poco meno di cinque ore).
Purtroppo, questo si è tradotto nella scomparsa di alcune specializzazioni come il servizio e volée e in una generale diminuzione della varietà, almeno in media. È evidente che in questo contesto anche l’analisi di numeri e statistiche ha contribuito alla ricerca di un vantaggio competitivo. Prendiamo l’evoluzione nel gioco offensivo di Federer, culminata nella vittoria in finale contro Nadal all’Australian Open 2017. Anticipo e aggressività con il rovescio hanno rappresentato una rottura nella tipica diagonale sul dritto di Nadal, permettendo a un livello di efficienza con quel colpo mai raggiunto prima nei loro scontri diretti. Certamente il rovescio di Federer è stato oggetto di attento esame dei suoi allenatori in preparazione a quella partita (qui la traduzione dell’analisi del colpo dello svizzero in quella finale). Allo stesso modo, la collaborazione di Serena Williams con Patrick Mouratoglou sembra essere indirizzata anche su piani tattici, oltre che di tecnica, analizzati grazie all’aiuto della statistica. O ancora, la volontà di Djokovic di rivolgersi a Craig O’Shannessy per trovare possibili margini di miglioramento. C’è però un aspetto che deve far riflettere in tutto questo: analisi sofisticate sono a disposizione solo dei giocatori più ricchi e quindi il divario in termini di rendimento tra chi ha più mezzi e chi non può circondarsi di figure di questo tipo è destinato ad aumentare. Se anche il tennis si aprisse alla ricerca indipendente con la condivisione dei dati, potremmo assistere a una diffusione più capillare di consulenza statistica anche tra i meno facoltosi.
Ubi: L’analisi statistica nel tennis è ancora confinata ad un pubblico ristretto? Come si potrebbe migliorare l’offerta di contenuti?
ES: È un ventaglio di spunti decisamente ampio. Un pubblico generalista sarà sempre più numeroso dei seguaci dell’analisi statistica, è inevitabile, ma l’obiettivo non è quello di invertire le proporzioni. Sarebbe molto più importante invece che si diffondessero modalità di ragionamento strutturate secondo logica, così da superare le troppo frequenti argomentazioni da bar tipiche del confronto sportivo, soprattutto in Italia. Che si diffondesse l’uso di una terminologia adeguata come riflesso di un lavoro di approfondimento specifico. Che si diffondesse un interesse vero per capire il tennis con strumenti nuovi e più potenti tramite i quali, nelle parole dell’astrofisico Neil deGrasse Tyson, trasformare i dati in informazioni, le informazioni in conoscenza e la conoscenza in saggezza. A questo riguardo, il giornalismo ha l’obbligo morale di porsi come una bussola. Vedo però ancora eccessiva impreparazione, eccessiva ricerca del click o del follower, della notizia sparata e non verificata o malamente riportata.
Per fare un paio di esempi nel tennis, ricordo qualche anno fa un’intervista a Djokovic del Financial Times, ripresa dal più importante quotidiano finanziario italiano con una traduzione infarcita di errori. O la versione italiana del libro Borg McEnroe, in cui l’assenza di una revisione tecnica rendeva la lettura in alcuni passaggi quasi comica. Se si vuole che l’offerta indirizzi la domanda, non ci si può più permettere questo tipo di approssimazione. Ancor più grave a mio avviso, è ora di smettere di nascondersi dietro l’assunto che l’offerta è piatta perché non c’è richiesta di contenuti di spessore. Se si continua a proporre contenuti scadenti, la domanda non avrà alcun incentivo a evolvere. Eppure, quando poi la qualità si manifesta, l’entusiasmo del pubblico è in grado di andare ben oltre le aspettative, come nel caso del libro Open di Agassi. Un mio modello d’ispirazione è il settimanale The Economist, che fa magistrale uso dei numeri e di una narrazione rigorosa e spiegata sempre con chiarezza. Nel suo piccolo, settesei.it cerca di replicare quel tipo di impostazione, grazie anche alla natura dei lavori tradotti sul sito.
Ubi: Nel calcio, per esempio, metriche come gli expected goals (xG) stanno cominciando a prendere piede – si potrebbe fare lo stesso nel tennis?
ES: Una maggiore popolarità di metriche come xG nel calcio è un segnale nella giusta direzione, anche se in un intervento dello scorso anno su Rivista Undici, peraltro ottimamente scritto, Leonardo Piccione invitava alla parsimonia nell’utilizzo per evitare di assegnare un potere predittivo che nella pratica non sembrano possedere. Da questo punto di vista, il tennis è già più avanti. A nessuno verrebbe in mente di classificare come “big data” le semplici percentuali di riepilogo al termine di una partita, come ho sentito fare per l’equivalente nel calcio. Le occasioni ci sono, il materiale è disponibile, manca la massa critica. Per poterla raggiungere, è essenziale il contributo di ogni interlocutore sensibile al tema.