Las felicitaciones están en orden. Tú, sí, querido lector, has sido parte de algo increíble. Gracias a su arduo trabajo, millones de libros que contienen prácticamente la suma total del conocimiento humano se han digitalizado con éxito, guardando sus textos para las generaciones futuras. Todo por ti.

No en serio.

Usted sabe cómo ocasionalmente se le pedirá con una “Captcha” ¿Al completar un formulario en Internet, para probar que eres completamente humano? Entre bastidores de uno de los sistemas Captcha más populares, el Recaptcha de Google, sus clics humanoides han ayudado a descubrir cosas que la informática tradicional simplemente no puede administrar, y en el proceso ha estado ayudando a capacitar a la inteligencia artificial de Google para que sea aún más inteligente.

Y pensaste que simplemente estabas iniciando sesión en algún sitio web u otro.

Orígenes

Recaptcha (o “reCATCHA” si lo prefiere, comenzó como una colaboración de varios científicos informáticos de la Carnegie Mellon University en Pittsburgh, se lanzó por primera vez en 2007, y Google la secuestró rápidamente en 2009. La premisa era la descrita anteriormente: casarse con usuarios que es necesario demostrar que son humanos para los datos que necesitan transcripción, ambas partes obtienen algo de eso.

Entonces, en lugar de digitalizar libros haciendo que una persona lleve a cabo la muy aburrida tarea de escribir o revisar todo un libro manualmente, en cambio, millones de personas pueden colaborar sin saberlo para lograr el mismo objetivo. ¿Recuerdas que siempre solías ser dos palabras que tenías que ingresar? Posiblemente, solo uno fue el “real” prueba, y la otra era una palabra nueva que aún no se había transcrito, pero como el usuario no sabría cuál era cuál, entonces tendría que intentar hacer ambas cosas con precisión.

La aplicación Google Books en Android.

Recaptcha puede incluso comprobar su propio trabajo. Al mostrar las mismas palabras a múltiples usuarios, puede verificar automáticamente que una palabra se haya transcrito correctamente comparando múltiples intentos de múltiples usuarios en todo el mundo.

Sorprendentemente, gracias a las cajas de Recaptcha que aparecían en miles de sitios web importantes y que recibían decenas de millones de actualizaciones al día, para el 2011, Recaptcha había terminado de digitalizar todo el archivo de Google Books, así como 13 millones de artículos del catálogo del New York Times que se remonta a 1851.

Entonces, ¿qué hizo Google a continuación, sin libros para digitalizar? En lo que quizás fue una feliz coincidencia, esto coincidió con el crecimiento de la inteligencia artificial y el aprendizaje automático..

Montaje de entrenamiento

En 2012, Google comenzó a incluir no solo palabras, sino también fragmentos de fotos de Google Street View, lo que hace que los usuarios transcriban los números de las puertas y otros carteles. Y en 2014, el sistema se convirtió en todo sobre entrenamiento de IA..

Esencialmente, la forma en que funciona el aprendizaje automático es que le das a la máquina un montón de datos que ya están ordenados; por ejemplo, un montón de imágenes de gatos que has etiquetado como gatos, y luego usa esta información para construir una red neuronal que permite Es para recoger a los gatos de otras imágenes. Cuantas más imágenes de gatos lo alimentes, más precisa será la IA para seleccionar gatos de otras imágenes..

Un gato. Por si acaso no estabas seguro.

Google tiene innumerables razones para querer entrenar a AI para que reconozca objetos en imágenes: mejores resultados de Búsqueda de imágenes de Google, resultados más precisos de Google Maps y que le permite buscar en la biblioteca de Google Photos todas las fotos que tomó de un objeto o lugar específico . Ah, y la pequeña cuestión de asegurarse de que su auto sin conductor no golpee nada. ¿Sabes cuando Recaptcha te pide que identifiques las señales de tráfico? Esencialmente, estás jugando un papel muy pequeño en pilotar un coche sin conductor en algún lugar, en algún momento en el futuro.

Entonces, es sumamente conveniente que Google tenga a su disposición a cientos de millones de usuarios de Internet para que trabajen para ello: al usar Recaptcha para abordar estos problemas, Google puede usar nuestra necesidad de demostrar que somos humanos para obligarnos a usar nuestro muy humano intuiciones para construir su base de datos.

Sistema de coche sin conductor de Google Waymo.

Esta es la razón por la que actualmente, en lugar de simplemente tirar un poco de texto, Recaptcha está dando a los usuarios más tareas relacionadas con la imagen: “Haga clic en todas las imágenes de los gatos.”, “Haga clic en todas las casillas de la cuadrícula que superponen una imagen que contiene un gato”, y así. Para miles de objetos diferentes..

Este es un activo particularmente útil para Google, ya que compite con otros gigantes de Internet para aumentar sus conjuntos de datos y algoritmos de aprendizaje automático: cuantos más datos pueda analizar, mejores serán los resultados, lo que otorgará a sus productos actuales y futuros una ventaja competitiva..

Usando la IA para vencer a la IA

Curiosamente, solo hay un problema con el uso de captchas para entrenar algoritmos de aprendizaje automático. ¿Qué hay que detener, por ejemplo, las personas que quieren evitar que los captchas utilicen el aprendizaje automático frente a los captchas??

El año pasado, el desarrollador Francis Kim construyó una prueba de concepto para vencer a Recaptcha utilizando las habilidades de aprendizaje automático de Google en su contra. Con solo 40 líneas de Javascript, fue capaz de construir un sistema que utiliza la API de reconocimiento de imagen Clarifai rival para ver las imágenes de Recaptcha de Google, e identificar los objetos que requiere el captcha. Entonces, si Recaptcha exige al usuario que seleccione imágenes de tiendas para demostrar su humanidad, Clarifai puede elegirlas en su lugar..

Posiblemente también, este tipo de cosas también sería posible utilizando la propia tecnología de Google. Debido a que Google quiere vender su tecnología inteligente a otras compañías, abre TensorFlow a los desarrolladores a través de una API en sí. Esto significa que posiblemente podrías usar TensorFlow para engañar al Captcha que entrena a TensorFlow. Esto no funcionaría el 100% del tiempo, pero una vez que una IA está suficientemente bien entrenada, debería poder hacer el truco en una gran cantidad de casos.

Lo que queda claro de Recaptcha no es solo que es una idea ingeniosa, sino también que, gracias a nuestro arduo trabajo, cada vez es más difícil separarnos a los humanos de las máquinas..

  • De TechRadar Semana AI es traído a usted en asociación con Honor.