Intervista

Dai dati al campo e dal campo ai dati: intervista ad Aldo Comi di Soccerment

Se della match analysis (piano piano) sta cominciando ad occuparsi anche il mondo dei media mainstream, ancora poco si sa della data analysis. Eppure molti club, a vario livello, stanno impostando le loro strategie di mercato sull’analisi quantitativa di dati precisi riguardanti i giocatori. Dall’utilizzo combinato di analisi tattiche e di raccolta dei dati nasce la prospettiva presentata dal libro The Clustering Project – Un nuovo approccio allo scouting moderno, scritto da Soccerment (azienda che vuole implementare la data analysis nel calcio italiano) e Antonio Gagliardi (prefazione di Fabio Paratici).

  Abbiamo quindi colto l’occasione di intervistare Aldo Comi (co-founder di Soccerment) per parlare del progetto e dello stato dell’arte della data analisi in Italia.

Con SICS avete dato vita ad un corso di Football Data Intelligence…come è andato?

Direi molto bene, nonostante fosse il primo corso in assoluto per noi e il primo corso sulla data analytics per SICS. Credo che il connubio tra le conoscenze in data science di Soccerment e quelle in match analysis di SICS sia veramente vincente e ha consentito ai corsisti di imparare a manipolare e analizzare i dati, calandoli in un contesto tattico. In tal senso, la presenza di Antonio Gagliardi quale “collante” tra i due mondi (analisi dati – analisi tattica) apporta un valore aggiunto importantissimo alla nostra proposta. Abbiamo avuto feedback molto positivo dai corsisti, ma anche molti spunti interessanti per migliorare in futuro. Stiamo lavorando per includere i loro suggerimenti nel secondo corso, che partirà all’inizio di settembre. A breve apriremo le iscrizioni.

A che punto è la situazione della Data Analysis nel calcio italiano?

Negli ultimi due anni, abbiamo assistito a un’importante accelerazione nell’adozione della data analytics nel calcio, da parte di tutti i principali stakeholders: i club, innanzitutto, ma anche da parte dei media e dei tifosi stessi. La missione di Soccerment è quella di dare un ulteriore impulso a questo trend positivo: il nostro obiettivo è quello di portare la data analytics lungo tutta la piramide calcistica, soprattutto nel calcio giovanile e non professionistico. 

All’estero molti club (Liverpool, Brentford, AZ Alkmaar, Midtjylland) utilizzano da anni e con successo un approccio data-driven. Com’è la situazione in Italia? Qualcosa di nuovo mi sembra che lo stiano introducendo le proprietà straniere (Venezia, Spezia, Genoa).

L’Italia è rimasta indietro rispetto a paesi nordici e anglosassoni ma, come dicevo, recentemente si è assistito a un’accelerata importante. In tal senso, l’arrivo di proprietà straniere, soprattutto americane, ha dato un contributo fondamentale. Credo che, nel prossimo futuro, i club di Serie A inizieranno ad assumere molti data analyst, in modo da efficientare l’utilizzo dell’ormai elevato numero di dati a loro disposizione. Il nostro corso in collaborazione con SICS risponde proprio a questa esigenza.

Il calcio, rispetto agli sport americani, presenta una maggiore difficoltà nella raccolta e nella catalogazione dei dati, soprattutto perché è meno statico e ripetitivo nei gesti tecnici e nelle azioni e anche perché è uno sport a basso punteggio, cioè uno nel quale gli eventi che decidono le partite (i gol) accadono più raramente che negli sport d’oltreoceano. Come si può ovviare a questa difficoltà e come creare un database oggettivo che quantifichi le prestazioni di squadra e dei singoli?

Non è un caso che la data analytics nel calcio sia arrivata più tardi rispetto agli sport di squadra americani: è molto più complesso capire le performance sottostanti guardando alle statistiche tradizionali. Per questo motivo, ritengo sia fondamentale l’utilizzo delle metriche avanzate, quali expected goals, expected assists, expected threats, etc. Queste metriche consentono di trasformare eventi di tipo binario (goal/non goal) in situazioni probabilistiche e sui grandi numeri queste rappresentano meglio la performance sottostante.

Recentemente avete lanciato la versione 1.3 della piattaforma Soccerment. Cosa c’è di nuovo e verso quali nuove direzioni andrete in futuro?

L’upgrade di Soccerment Analytics si è focalizzato sulla creazione e visualizzazione delle metriche avanzate. Inoltre, abbiamo messo a terra il modello di clustering sviluppato in collaborazione con Antonio Gagliardi: tutti i giocatori dei cinque campionati principali europei sono clusterizzati per le loro funzioni in campo e vengono comparati a giocatori dello stesso cluster. Crediamo che questo approccio possa rivoluzionare il modo di fare scouting.

Il sito di soccerment.

Dal punto di vista calcistico siamo ancora agli esordi per quanto riguarda la misurazione dell’efficacia della fase difensiva. Un primo passo avanti è stato fatto qualche anno fa con l’introduzione dell’indice PPDA (Pass Allowed Per Defensive Actions), che misura il rapporto tra il numero di passaggi effettuati dalla squadra in possesso e il numero di azioni difensive compiute dalla squadra difendente in una determinata zona di campo (solitamente i primi 60m). Soccerment ha apportato una evoluzione ulteriore alle metriche difensive introducendo il BDP (Buildup Disruption Percentage). Qual è stata la risposta all’introduzione di questo indice e quali passi restano ancora da fare per quantificare appunto l’efficacia difensiva di una squadra?

Abbiamo sviluppato il BDP in collaborazione con Antonio Gagliardi. È stato accolto molto bene sia dalla community di football analytics, sia dai media che da alcuni club, che l’hanno trovato un valido argomento di analisi interna. Il prossimo passo su cui stiamo lavorando è la creazione di modelli di metriche avanzate difensive. Prima dell’inizio della prossima stagione, mostreremo sulla nostra piattaforma di analytics delle novità davvero molto interessanti.

Insieme ad Antonio Gagliardi (collaboratore di Andrea Pirlo alla Juventus e capo del dipartimento di match analysis della nazionale italiana) avete recentemente pubblicato il libro The Clustering Project – Un nuovo approccio allo scouting moderno (anche in cartaceo). Rispetto all’analisi ‘classica’ questa versione 2.0 porta con sé l’innovazione di non limitarsi a catalogare i dati dei giocatori ma a definirli tatticamente (in virtù di questi dati) in base alla funzione che svolgono in campo (seguendo il noto aforisma di Gagliardi per il quale ‹‹nel calcio moderno il ruolo non è più una posizione ma una funzione››). Ci puoi spiegare nel dettaglio come nasce e come si è sviluppata questa idea?

Dopo aver letto il nostro libro sui Wonderkids, Antonio mi ha contattato, ormai quasi un anno fa, con l’idea di pubblicare assieme un libro che trattasse la clusterizzazione dei giocatori in base alle loro funzioni. In quei giorni, io e Roberto (Roberto Angioni, Head of Data Science a Soccerment) stavamo già pianificando il lavoro di clusterizzazione dal punto di vista matematico, per cui eravamo assolutamente già allineati con l’idea di Antonio (nonostante noi, all’epoca, non pensassimo di pubblicarci un libro). L’intuizione di Antonio di legare il modello statistico al suo aforisma ‹‹nel calcio moderno il ruolo non è più una posizione ma una funzione›› l’ho trovata molto interessante, così come quella di pubblicare un libro che descrivesse la metodologia mettendola nel contesto tecnico-tattico. In modo molto naturale, abbiamo quindi iniziato con entusiasmo quella che si è poi rivelata una fruttuosa collaborazione.      

Come pensi che questo nuovo approccio possa incidere in sede di campagna acquisti da parte di una squadra? Cosa cambia definendo un giocatore a partire dal dato?

Credo che il vantaggio principale di questo approccio sia quello di dare un valido riferimento che leghi le caratteristiche di un calciatore, individuate dalle sue statistiche, a quelle del sistema di gioco prescelto da un allenatore. Ovviamente, sono considerazioni che vengono fatte da sempre, ma ancora adesso sono fatte con il cosiddetto “occhiometro”. L’approccio più scientifico porta a un doppio vantaggio: in primis, aumenta l’oggettività del giudizio e questo offre maggior sicurezza nella valutazione; in secondo luogo,  permette di andare a considerare giocatori che non sono mai stati nemmeno visionati dai propri scout. Attenzione, non dico che ci si possa basare solo sui dati, nel fare scouting, ma che i dati e le metodologie legate a questi possono rappresentare un importante filtro iniziale nel processo di selezione dei giocatori.

Introducendo 13 funzioni al posto dei tradizionali ruoli si riesce ad avere anche un’idea più precisa del tipo di calcio praticato da una determinata squadra e, di conseguenza, da un allenatore, magari sconfessando la vulgata comune intorno al medesimo. Puoi dirci un esempio interessante che è venuto fuori dalla vostra ricerca e come credi che questo potrebbe influenzare anche la ricerca di un nuovo tecnico da parte di un club?

Credo che anche questo aspetto sia molto interessante. Una volta individuati i cluster, ci siamo effettivamente chiesti quali venissero più o meno utilizzati dalle squadre di vertice e dalle squadre che lottano per non retrocedere. Ovviamente, molti pre-concetti vengono confermati dall’analisi: le squadre con minor qualità devono, ad esempio, massimizzare con quello che hanno a disposizione e quindi schierano molti più difensori dedicati alla marcatura, che noi chiamiamo ball stopper e, in avanti, le cosiddette boe offensive, che noi chiamiamo target man. In altri casi, invece, i risultati sono più controintuitivi. Personalmente, ho trovato controintuitivo la mancanza di “buildup director” al Manchester City, nonché di “chance creator” al Liverpool. Una cosa interessante è stata notare come le squadre di vertice avessero molti “one-to-one explorer”, di cui l’Atalanta era completamente sprovvista fino a gennaio 2022, quando ha sentito il bisogno, secondo me giustamente, di aggiungerne uno, acquistando Boga.

Spesso si ‘accusano’ gli analisti di complicare le cose con troppi dati…ora, se è vero il principio occamiano di non moltiplicare gli enti è altrettanto vero che ad uno sport (così come ad un gioco o ad un’opera d’arte quale un film o un libro) ci si possa approcciare in modo più esaustivo e tanto più profondo quanto più si voglia andare oltre l’apparenza, per comprenderne appieno il significato. In conseguenza di questa premessa ti chiedo se in un futuro ritieni possibile, nei media mainstream, che accanto ad una narrazione più popolare si possa affiancarne una più articolata (come già fanno alcuni come il podcast Il Terzo Uomo) per quella parte di pubblico più esigente.

Sono molto ottimista riguardo il futuro. Penso che, seppure in maniera graduale, ci sarà un approccio sempre meno superficiale, da parte del pubblico, dei media e anche degli addetti ai lavori. Il calcio non è semplice, è lo sport di squadra più complicato che ci sia e questo spiega perché la data analytics sia arrivata dopo, rispetto ad altri sport che richiedono meno complessità statistica per essere ben descritti. Credo che gli investimenti in data analytics nel calcio stiano già portando a ottimi risultati, ma quello visto fino a ora non è nulla, rispetto all’impatto che la data analytics avrà nei prossimi 10 anni. A mio avviso, è e rimarrà fondamentale evitare di trasferire agli utenti finali la complessità dei modelli, facendoli “giocare” con strumenti che siano, al tempo stesso, profondi ma intuitivi e facili da utilizzare. Del resto, la risorsa più scarsa nel calcio è il tempo. I nostri tools analitici puntano a tutto ciò, facendo uso estensivo di metriche avanzate, indicatori di performance e data visualisation

a_small_cup_of_coffee-4

Sostieni la Gabbia

Sostieni la Gabbia offrendo un caffè

2,00 €

Rispondi

Inserisci i tuoi dati qui sotto o clicca su un'icona per effettuare l'accesso:

Logo di WordPress.com

Stai commentando usando il tuo account WordPress.com. Chiudi sessione /  Modifica )

Foto Twitter

Stai commentando usando il tuo account Twitter. Chiudi sessione /  Modifica )

Foto di Facebook

Stai commentando usando il tuo account Facebook. Chiudi sessione /  Modifica )

Connessione a %s...

%d blogger hanno fatto clic su Mi Piace per questo: