La final de la Liga de Campeones no fue solo un juego emocionante, sino también un potencial cambio de juego: el Liverpool Striker Mo Salah, Jugador del Año, receptor de la Bota de Oro y el mejor jugador conocido de Egipto, de repente tuvo su boleto para la Copa Mundial. En duda después de un agresivo desafío de Sergio Ramos lo dejó lesionado..

Las implicaciones de este tackle podrían haber sido enormes: si Salah no pudo jugar para su país (resulta que ha hecho lo casi imposible y está en forma), esto podría haber afectado las posibilidades de Egipto en la Copa del Mundo, y aunque Egipto Es poco probable que los problemas de las últimas rondas de la competencia sean perturbadores, como una mariposa que agita sus alas en el otro lado del mundo, el desempeño de Egipto podría a su vez impactar en cómo lo hacen los otros equipos de su grupo y, en última instancia, afectar a qué país puede levantar el equipo. trofeo.

Dicho esto, la caída potencial de Salah es solo una de literalmente millones de puntos de datos. Uno de los millones de factores que podrían afectar el resultado de la competencia..

¿Cómo podemos saber qué esperar, entonces? ¿Hay alguna forma de predecir cómo se desempeñarán los equipos? ¿Podría Big Data, que ya ha transformado muchas otras industrias, también desbloquear una comprensión más profunda del hermoso juego? ¿Podría predecir quién ganará la Copa del Mundo??

Puntos de datos

Opta Sports y STATS son dos compañías que intentan responder preguntas como esta. Como compañías de datos deportivos, sus misiones son recopilar datos y darles sentido a sus clientes, lo que incluye equipos deportivos y federaciones, así como medios que están ansiosos por obtener información sobre los datos (ej.).

“Es muy fácil pensar que más datos son buenos, pero hasta que sepa cómo los va a usar y qué puede aprender de ellos, a veces pueden ser datos por el bien de los datos.”

Paul Power, STATS.com

¿Qué recogen realmente, entonces? El gerente de marketing de Opta, Peter Deeley, explicó que para cada partido de fútbol, ​​su compañía recopila alrededor de 2000 puntos de datos individuales, principalmente centrados en “en la pelota” comportamiento. Un equipo de tres analistas, uno para cada lado y alguien para volver a revisar los momentos difíciles, se sentará en el centro de datos de la compañía en Leeds, y registrará esencialmente todo lo que sucede en el campo: cada pase, cruzado y tiro, así como Las posiciones en el campo donde cada interacción ha tenido lugar..

Los datos se entregan a los clientes en vivo, por lo que, por ejemplo, el experto del Reino Unido (y ex jugador de Inglaterra) Gary Lineker puede informar a los espectadores sobre estadísticas como la posesión y los tiros a puerta en el medio tiempo..

Stats.com hace el mismo tipo de cosas, y Paul Power, un científico de datos de la compañía, estaba dispuesto a contarme que no solo los humanos se utilizan para la recopilación de datos, sino las nuevas tecnologías de visión artificial..

Cuando se trata de registrar con precisión la posición de cada jugador en el campo, su compañía usa cámaras ubicadas alrededor del borde para descifrarlo, lo que evita la necesidad de que los jugadores usen balizas de seguimiento debajo de sus camisas, como sucedió en deportes como Rugby Union..

Pero ¿por qué quedarse con los humanos? No se pudo utilizar la visión artificial para registrar todos de este tipo de datos? “Las personas siguen siendo las mejores debido a los matices que las computadoras no van a poder entender.,” argumenta paul.

Da el ejemplo de qué sucede si un jugador está acorralado y patea la pelota para alejarse de la desesperación, pero afortunadamente la pelota es recibida por un jugador del mismo equipo. Para una máquina, esto puede parecer simplemente un pase largo, ya que las máquinas no pueden resolver el contexto de lo que está sucediendo, o el aspecto de pánico en la cara del jugador: registraría un pase largo, mientras que técnicamente el evento es técnicamente algo otra cosa: una liquidación. Lo que significa que sin un humano para hacer estas llamadas, los datos registrados podrían ser menos precisos.

El enfoque de Opta

Sabemos que ambas compañías tienen muchos datos, pero ¿quién creen que ganará la Copa del Mundo? Aunque ambas compañías generan una gran cantidad de datos detallados para sus clientes, curiosamente, STATS y Opta divergieron cuando se trata de modelar el torneo de este verano..

En el caso de Opta, Peter me explicó que su modelo de Copa del Mundo no tiene en cuenta la gran cantidad de datos de jugadores individuales. En su lugar, Opta ha elegido solo mirar el desempeño de los equipos nacionales específicos a nivel de equipo. Por ejemplo, evaluar las posibilidades de Egipto según el desempeño del equipo egipcio en el pasado y sin tener en cuenta la situación de las lesiones de Mo Salah.

“"Los científicos de datos de la Copa del Mundo analizaron el desempeño histórico de diferentes países, qué diferencia hace si juegas como país anfitrión, qué diferencia hace que juegues en tu continente".

Peter Deeley, Opta

“Los científicos de datos de la Copa del Mundo analizaron el rendimiento histórico de diferentes países, qué diferencia hace si juegas como país anfitrión, qué diferencia hace que juegues en tu continente local y qué diferencia hace Hazlo si has ganado las últimas Copas del Mundo.,” Pedro explica.

Los científicos de datos pudieron luego ajustar el modelo ejecutándolo cientos de miles de veces para realizar mejoras iterativas, ajustando el peso relativo de cada factor en el algoritmo.

Esto es una sorpresa, ya que supondría que cuanta más información mejor, pero Peter cree que este modelo aún puede ofrecer buenas predicciones..

“La Copa del Mundo solo se realiza cada cuatro años, por lo que a menudo encontrarás que un jugador de calidad decente, que juega en un país que juega a menudo en las Copas del Mundo, solo jugará en dos torneos de la Copa del Mundo, no tendrás tanta información sobre Que los jugadores impacten en el equipo más amplio, dentro de la organización internacional..” él dice.

Y cree que estos datos a nivel de equipo son suficientes: “Italia ganó en 2006: no eran favoritos y la calidad de su equipo era buena, no era un equipo que tuviera una superestrella de nivel Cristiano Ronaldo..”

Él va a explicar: “Es realmente interesante, con las Copas Mundiales es cierto que a los equipos que históricamente les va bien lo siguen haciendo bien. Alemania, en las últimas tres Copas del Mundo, al menos ha llegado a las semifinales..

"Aunque puede argumentar que su equipo esta vez no es tan bueno como el de la última vez, todavía tienen el historial de ser campeones mundiales actuales, de ser un equipo que generalmente se desempeña bien, y está en su continente natal. Eso significa que tienen una buena oportunidad en general, sin importar su escuadra, pero tienen un historial de buen desempeño en los torneos.”

“Es muy fácil pensar que más datos son buenos, pero hasta que sepa cómo los va a usar y qué puede aprender de ellos, a veces pueden ser datos por el bien de los datos.”, él dice.

El modelo STATS

STATS ha modelado la Copa del Mundo de manera diferente. A diferencia de su rival, tiene en cuenta los datos de los jugadores individuales por lo que llama “Y si?” Analítica.

Según Paul, esto significa que STATS puede usar efectivamente los datos de los jugadores individuales para determinar no solo cómo se desempeñará un equipo, sino también cuantificar el impacto de intercambiar jugadores dentro y fuera del equipo. En el caso de Mo Salah, STATS afirma que su sistema podría resolver el impacto en Egipto de si está en condiciones de jugar o no..

“"Puedes conectar estas diferentes situaciones y eso podría generar un resultado y esa medida sería la cantidad de goles marcados o concedidos, o simplemente ganar la probabilidad: ¿cómo aumenta o disminuye las posibilidades ese jugador?", Explica Paul..

“Podemos ver esto, ejecutar las simulaciones y esto realmente nos dirá: Mo Salah podría valer 0.3 de un gol, o si no está jugando y entra otro jugador, eso reduce la probabilidad de ganar en un 3% o 10%. o en realidad podría aumentarlo dependiendo del equipo con el que estén jugando..”

(Imagen: © Getty Images)

¿Por qué STATS cree que el enfoque individual funciona mejor que mirar a los equipos??

“Todo el mundo sabe que si extrañas a tus jugadores estrella, tendrá un impacto en el rendimiento, no necesitas una red neuronal compleja para decirte eso.,” dice paul. “Si te falta eso en tu conjunto de datos, eso realmente va a sesgar tus probabilidades y tus predicciones.”.

“Sabemos que al agregar estas características adicionales a los jugadores, tenemos mejores impactos porque lo que podemos hacer mejor es modelar las relaciones directas entre individuos, y si bien es un deporte de equipo, sabemos que ciertos individuos tienen una mayor influencia. en el resultado que otros determinados.

"Si le falta un fullback, por ejemplo, es posible que sea un problema menor que el de un centrocampista central, por lo que debe tenerlo en cuenta, y como resultado de ello, estamos realmente seguros del modelo. que hemos generado.”

Dime quién va a ganar, maldita sea.

Ahora llegamos a la pregunta más importante: ¿Qué país predicen los dos modelos que ganará? En ambos casos, como nerds de estadísticas adecuadas, han emitido pronósticos probabilísticos que contienen bastante más matices que tu compañero Dave, quien jura ciegamente que Alemania volverá a ganar porque tiene un buen presentimiento sobre ellos..

Le pedí a STATS sus predicciones y, lamentablemente, a pesar de que la compañía está dispuesta a contarme todos los datos a los que tiene acceso y cómo haría En realidad, hacer una predicción, me dijeron que no publicarán sus predicciones este año. ¿Por qué? ¿Por miedo a equivocarse? No, la respuesta es mucho más sencilla: esta información es valiosa y solo quieren compartir información con los clientes que pagan..

Tenemos, sin embargo, una predicción de Opta. Califica a los ganadores perennes de la Copa del Mundo Brasil (no mencione 2014) como los campeones más probables una vez más, lo que les da un 14.2% de posibilidades de ganar. Esto significa que si corrió la Copa del Mundo con los mismos equipos exactamente 20 veces, solo esperaría que Brasil gane alrededor de tres veces. Al igual que tu compañero Dave, Opta también se siente atraído por Alemania, lo que les da un 11.4% de posibilidades de llevarse el trofeo a casa una vez más..

Otra empresa a la que le gusta predecir y tiene una precisión aterradora en sus resultados es EA Sports. Para las últimas tres Copas del Mundo, ha pronosticado acertadamente el eventual ganador de la Copa del Mundo.

Utilizando los datos detallados que tiene sobre los jugadores y las clasificaciones de los equipos en FIFA 2018 y su complemento de la Copa del Mundo, realizó una simulación del torneo y Francia fueron los ganadores finales, derrotando a Alemania en la final. Dado que predijo Alemania y España para las Copas Mundiales de 2014 y 2010 respectivamente, esto podría ser un buen grito.

Luego está Blue Yonder, una compañía famosa por usar AI para predecir el flujo y reflujo de la gestión de existencias en algunos de los supermercados más grandes del mundo. Recientemente se volvió a predecir la Copa del Mundo. Campo izquierdo sí, pero su tecnología ha analizado todos los partidos de fútbol internacionales jugados desde 1872, ejecutando más de 1 millón de simulaciones de la Copa del Mundo y cree que Brasil es el favorito para ganar a Rusia, con un 22,5% de posibilidades de ganar..

¿Y qué hay de Inglaterra? La mala noticia para Gareth Southgate es que Opta le da a su escuadrón una baja probabilidad de 1.9%, mientras que Blue Yonder aumenta esto un poco al 5.7%..

Si Opta y Blue Yonder tienen razón, es muy probable que podamos esperar perder otro tiroteo de penal. Suspiro.

La cobertura de la Copa Mundial de TechRadar se presenta en asociación con Honor.