Saiyine
Punto Com

Tirando querys, y más

2009-08-30 04:25:41

Me alegro de que me hagais esa pregunta, a la que tengo que responder, con sinceridad, que si, que intenté participar en el concurso de NetFlix.

La idea era bastante sencilla. Netflix está en el negocio de alquilar, si no lo entendí­ mal, peliculas por correo. Tu vas a la tienda-e, eliges la peli que quieres ver, te la mandan al correo en un paquete de cartón tipo los de las Ubuntu, y cuando terminas de verla, la vuelves a echar al cualquier buzón, que ya lo tienen ellos montados para que les llegue de vuelta. Ni idea de como va lo del correo fí­sico en las Americas, pero supongo que es fundamental que sea baratico, baratico para que esto funcione.

Tambien tienen su rollo tipo imdb (y dado que los datos del imdb te los puedes bajar cuando quieras, seguro que son MUY parecidos) con las peliculas y sus notas... Y aquí­ entramos nosotros: ¿quien es el guapo que, dado una tabla con personas, peliculas, y las calificaciones que esas personas han dado a esas peliculas, es capaz de decir que nota le daria un usuario a una pelicula, sin que esa relación aparezca en los datos dados? Es más, si lo dices con un 85% de acierto, te damos 1 millón de dolares para que te los fundas en calippos de fresa.

Pues allí­ fui yo, y para tener algo que hacer estas vacaciones tempraneras (que por una larga y triste historia me tuve que pillar en Junio), me descargué los txt con las relaciones. 4 Gigas de datos, que convertidos en tablas de mysql, se convertian en unos 8 o 9 gigas de tablas MyISAM. Ya, ya se que no es un problema adecuado para bases de datos, sino para matrices "sparse", pero por probar.

Mi idea, por supuesto, no era ganar, sino poder mandar por lo menos un resultado: además de los datos de informacion, te daban una tabla de datos contra los que cruzar tu algoritmo. Yo me conformaba con montar un algoritmo y poder mandar una respuesta, por ratera que fuera. En realidad no me parecia tan mala, ya que habia pensando que dado un usuario, podriamos buscar personas con gustos similares, y ver que habian votado.

Es decir, para una persona P1, buscar todas las Pn que hubieran votado lo mismo que P1 en, yo que sé, 10 o 15 peliculas, y luego mirar que habian votado esas personas en la pelicula a consultar.

A este algoritmo tan sencillo le surgieron dos inconvenientes. El primero, hacer busquedas en mysql en una tabla de 9 gigas. El segundo, tener un portatil trabajando 4 dias seguidos en Murcia en verano.

Resumiendo, mi querido portatil murió, especificamente, el disco duro: ahora dispongo de un estupendo pendrive de cincuenta y pico gigas, ya que los otros cuarenta y pico están hechos polvo, llenos de sectores dañados, etecé.

Y encima el premio ya se lo han dado a unos, maldita sea su estampa.

Rollos antiguos

2009-08-30 03:40:37 - Configuración simple de un servidor Samba.

2009-08-26 03:38:12 - Magia.

2009-08-22 16:44:12 - Voy a hacer un curso.

2009-08-18 03:22:02 - Rellenar formularios en la web usando Curl.

2009-08-14 15:50:10 - Augmented reality Burger King detector.

Saiyine

Selfie of meHi! Welcome to Saiyine Punto Com where I talk about anything that goes through my mind!

Puedo prometer y prometo que a la mayor brevedad aquí irá un menú o algo asín.