¿Por qué la tecnología no podía predecir los resultados de las elecciones en Estados Unidos?
NoticiasLo entendieron mal - otra vez. A pesar de la mayoría de las encuestas de opinión y pronósticos que indican que Hilary Clinton vencería a Donald Trump en las elecciones presidenciales de Estados Unidos, sucedió lo contrario. Por supuesto, se podría argumentar que los encuestadores estaban en lo cierto: las encuestas llamaron una carrera cerrada con Clinton, y eso es exactamente lo que sucedió: después de todo, Clinton ganó el voto popular, pero Trump la condujo en términos de votos electorales..
Pero las encuestas en profundidad también se realizaron estado por estado, entre otras cosas por el gurú encuestador Nate Silver en FiveTirtyEight, quien calculó que Trump tenía solo un 29% de posibilidades de ganar. Los votantes conservadores fueron enormemente subestimados, pero cómo?
Entonces, ¿los votantes 'tímidos' de Trump mienten a los encuestadores? ¿Las previsiones se basan en datos erróneos? Y las nuevas tecnologías, algunas de ellas provenientes de un Silicon Valley conmocionado, pueden ayudar a dar nueva vida a una industria que ahora está en grave peligro de ser desacreditada.?
Los encuestadores utilizan cuestionarios, datos demográficos y algoritmos (Crédito de la imagen: Wikimedia)¿Cómo funcionan las encuestas de opinión??
Las encuestas de opinión se basan en extrapolar tendencias a partir de una muestra de datos relativamente pequeña. El encuestador pregunta a las personas cómo pretenden votar o cómo votaron, y se aplican algoritmos para crear una imagen nacional demográficamente equilibrada..
En un país de 231 millones de votantes potenciales, aunque alrededor de 100 millones en realidad no votan, siempre se basará tanto en suposiciones como en datos reales. La clave para esto es la participación de los votantes, que es muy difícil de predecir; simplemente no hay datos hasta después del día de las elecciones.
"El desafío de hacer cualquier predicción a partir de los datos es asegurarse de que los datos sean representativos", dice Matt Jones, estratega de análisis de la consultora de ciencia de datos Tessella. "El análisis estadístico tradicional de los datos de sondeo y las encuestas solo será representativo de aquellos que se molestaron en participar, y esa sección de la población votante no es representativa".
Los medios de comunicación les dan a los encuestados enormes gravitas en la medida en que pueden ser decisivos en cuanto a si las personas se molestan en votar o no, para poder elegir..
¿Los encuestadores necesitan usar las redes sociales??Datos limitados
El aprendizaje automático ya se utiliza cuando se ejecutan predicciones electorales. Es parte del análisis estadístico estándar. "En cuanto a cualquier análisis estadístico, el factor más crítico es la cantidad de datos disponibles para ejecutar sus algoritmos, basar sus predicciones", dice Claus Jepson, Arquitecto Jefe de Unit4. "A partir de hoy, el conjunto de datos disponible es simplemente demasiado limitado para ofrecer predicciones precisas, por lo que es necesario incluir interpretaciones humanas, por lo que las predicciones están sesgadas..”
Por ejemplo, los encuestadores deciden cuánto peso estadístico dar a cuántos resultados electorales históricos. “"En algún momento, los datos disponibles serán lo suficientemente grandes para que los algoritmos puedan predecir de manera efectiva, con menos sesgos, los resultados basados en encuestas", piensa Jepson..
Análisis de redes sociales y sentimientos.
Algunos de esos datos 'nuevos' provienen de las redes sociales, que parecen convertirse en una herramienta nueva para los encuestadores que buscan hacer un seguimiento de las opiniones cambiantes. "El uso de la 'escucha social' de las conversaciones y el comportamiento de las redes sociales puede haber sido una advertencia temprana de posibles contradicciones de las encuestas oficiales", dice Mark Skilton, profesor de práctica en el grupo de sistemas y gestión de la información en Warwick Business School..
Esta es la ciencia del análisis de sentimientos: cuando las personas escriben cosas en las publicaciones de Twitter y Facebook, es posible extraer actitudes positivas, negativas o neutrales. Nadie está sugiriendo que los encuestadores solo usan Twitter para predecir las elecciones, pero se puede usar para mejorar un modelo puramente estadístico agregando una dimensión dinámica vital.
Por ejemplo, BJSS SPARCK analizó 14 millones de tweets antes de la elección y predijo correctamente el resultado, descubriendo que siete de cada diez tweets enviados en las últimas cuatro semanas de la campaña fueron a favor de Trump.
"Cuando usan las redes sociales, las personas se vuelven menos cautelosas sobre sus verdaderas afiliaciones sociales y políticas", dice Simon Sear, Líder de Práctica de BJSS SPARCK. "Su lenguaje se queda sin filtrar, les gusta el contenido que les atrae y sigue a las personas y organizaciones que representan sus valores (...) lo contrasta con tener que admitir sentimientos e intenciones embarazosas ante un encuestador humano potencialmente crítico".