Matrix factorization models for cross-domain recommendationAddressing the cold start in collaborative filtering
- Fernández Tobías, Ignacio
- Iván Cantador Director/a
Universitat de defensa: Universidad Autónoma de Madrid
Fecha de defensa: 13 de de gener de 2017
- José Ramón Dorronsoro Ibero President/a
- Pablo Castells Azpilicueta Secretari/ària
- Julio Gonzalo Arroyo Vocal
- Francesco Ricci Vocal
Tipus: Tesi
Resum
RE SUMEN Los sistemas de recomendación son herramientas software diseñadas para ayudar a los usuarios en tareas de acceso y recuperación de información. Mediante el análisis de interacciones pasadas de usuarios con ciertos ítems de información, estos sistemas estiman las preferencias de los usuarios por otros ítems, con el fin de predecir y sugerir aquellos de mayor relevancia. En investigación activa desde mediados de los noventa, los sistemas de recomendación han ido ganando en popularidad y sofisticación hasta convertirse en parte esencial de numerosos servicios de negocio, educación, cultura y entretenimiento, entre los que se incluyen sitios de comercio electrónico como Amazon. com y eBay, proveedores de contenido multimedia por internet como Netflix, YouTube y Spotify, y redes sociales en línea como Facebook y Twitter. Múltiples son los métodos de recomendación, y destacables aquellos basadas en filtrado colaborativo, que se han propuesto e implementado con éxito a lo largo de los últimos años. Sin embargo, aún tienen limitaciones y retos particulares, que a su vez suponen oportunidades de investigación. Una de las más notorias de estas oportunidades es la del problema de arranque en frío, o cold start en inglés, que se produce cuando un usuario se ha registrado en un sistema recientemente, y para el cual no hay preferencias suficientes con las que poder proporcionar recomendaciones personalizadas relevantes. Dos tipos de aproximaciones se han explorado para tratar el arranque en frío. El primero está representado por técnicas que solicitan preferencias al usuario de manera inteligente, mientras que el segundo incluye métodos que hacen uso de información adicional para inferir tales preferencias. Dentro de este último tipo de soluciones, la recomendación sobre dominios cruzados ha surgido recientemente como una potencial solución, utilizando preferencias de usuario y atributos de ítem en dominios distintos, pero relacionados con el de destino. Los sistemas de recomendación sobre dominios cruzados son objeto de investigación en varias áreas, con objetivos y tareas diferentes. En Modelado de Usuario se han propuesto como mecanismos de agregación y mediación de perfiles de usuario como estrategia de personalización entre sistemas, en Aprendizaje Automático se han planteado como una aplicación práctica de las técnicas de transferencia de conocimiento, y en Sistemas de Recomendación se han sugerido para mitigar la escasez de preferencias de usuario. Esta tesis se centra en el estudio las sistemas de recomendación sobre dominios cruzados como solución al problema de arranque en frío. En primer lugar, proporciona una revisión exhaustiva de los tra- bajos relacionados en las áreas arriba citadas, proponiendo una visión que unifica las existentes formalizaciones del problema, y una categorización tanto de los modelos de recomendación como de las metodologías de evaluación empleadas. Posteriormente presenta una serie de novedosas adaptaciones de la técnica de factorización matricial en filtrado colaborativo para la recomendación sobre dominios cruzados. En particular, propone modelos diseñados para explotar distintas fuentes de datos, a saber, etiquetado social, rasgos de personalidad de los usuarios, y anotaciones semánticas de los ítems. El trabajo experimental llevado a cabo comprende la evaluación empírica de los modelos propuestos sobre grandes colecciones de datos que abarcan múltiples dominios, en particular los de recomendación de películas, música y libros. Los resultados alcanzados muestran la efectividad de los modelos propuestos en situaciones de arranque en frío, en términos no sólo de precisión sino también de novedad y diversidad de las recomendaciones, y de cobertura de los dominios.