El científico líder de Digg habla sobre el filtrado colaborativo.
NoticiasDetrás de las escenas de muchos sitios web, los filtros colaborativos están tocando las preferencias de personas similares a usted para ayudar a recomendar otros productos, historias o enlaces que pueda disfrutar..
Habrá visto estos filtros en acción en la función "Los clientes que compraron este artículo también compró" de Amazon, en las "Recomendaciones para el futuro" de Digg y en muchos otros lugares..
En South By South West Interactive, un panel formado por representantes de Digg, The Filter, Baynote, Netflix y Last.fm se reunieron para hablar sobre la importancia de estos motores de recomendación..
Anton Kast, científico líder de Digg, explicó cómo estos filtros comenzaron con el filtrado de correo electrónico y Usenet según las calificaciones de las personas, antes de salir de la esfera de investigación y pasar a la red diaria..
"La idea del filtrado colaborativo es simplemente combinar la entrada de muchas personas diferentes para filtrar la información mejor de lo que sería posible. En particular, usa la información de muchos juicios independientes de muchas personas para hacer algo que no podría haber hecho simplemente. con informática, metadatos y datos que no provienen de humanos reales ".
Kast continúa: "Esta técnica está en todas partes. Puede sonar oscura, puede parecer especializada, pero en realidad es tan simple que es casi universal".
Los ejemplos comunes incluyen los filtros de correo no deseado de Gmail, el PageRank, el etiquetado de los videos de YouTube, la votación de comentarios en foros y sistemas de ayuda..
Así que eso es filtrado colaborativo, pero ¿qué es recomendación??
"Cualquier filtro colaborativo en el que la salida sea personalizada", dice Kast, señalando las recomendaciones en Amazon, la música en Last.fm y las películas en Netflis como ejemplos..
Y, por supuesto, el filtrado colaborativo aparece en Digg. "En Digg, cualquiera puede enviar una historia", dice Kast. "Y cualquiera puede votar sobre cualquier historia: esa es la parte de filtrado, y lo que sea más popular es el ganador. Es un filtro colaborativo gigante en el sentido más simple y clásico. Pero si inicia sesión veremos su historial de votaciones, lo relacionaremos con otros el historial de votaciones de las personas, y encuentre las historias que les gustaron a estas otras personas y muestre esas, para que obtenga un filtro colaborativo personalizado ".
Pero hay cuatro problemas básicos con este enfoque, dice Kast.
La primera es la escasez: "las personas que realizan el filtrado son escasas en comparación con la cantidad de contenido que necesita filtrado", explica Kast. "Si hay muchas más historias de Digg que personas que votan allí, obviamente no estamos obteniendo una buena cobertura..
"En segundo lugar está el problema de los evaluadores tempranos, donde se acaba de enviar algo y no tiene mucha información de votación para fines de filtrado".
Tercero, a lo que Kast se refiere como "el problema de las ovejas grises", donde lo que sea más popular va a la página de inicio, "y lo que no es particularmente popular pero que un pequeño grupo de personas está loco", ¿cómo lo hace? pequeño grupo de personas? "
Y finalmente, dice Kast, hay oposición del usuario. "Digg tiene esta historia fascinante donde de vez en cuando una gran cantidad de personas se entusiasman increíblemente con una cosa y termina en nuestra página de inicio y lucha contra los objetivos que tenemos para representar grupos pequeños o tener contenido diverso, pero eso es solo un problema fundamental. - Cuando confías en la gente, hay voluntad popular ".