reCAPTCHA – Una idea por su simplicidad .. simplemente de genios
De siempre he admirado las ideas simples, esas ideas que me dan por pensar como algo tan obvio no se le habia ocurrido antes a alguien.
Hace poco me entere que una herrameinta que muchos webmasters usamos y yo mismo desde hace varios años , a parte de desempeñar la labor para la q se ofrece, de segundas hace una labor simplemente fantastica y con ideado de una forma simple y brillante.
reCAPTCHA es una herramienta q se utiliza en formularios para q los robots que producen spam no puedan empezar a insertar registros invalidos, habreis visto miles de ellas y de diversos tipos ( consiste en poner ciertos numeros, letras) despues de un formulario para saber q eres un humano.
reCAPTCHA es un sistema mas de esos, pero con una diferencia que lo hace sumamente inteligente por su doble funcion.
1. por un lado hace la misma funcion que todos los demas captchas
2. y aqui viene la genialidad, en lugar de tener una palabra como muchos otros tiene 2 palabras
la primera es el captcha normal pero la segunda palabra esta sacada del escaneo de libros antiguos que por el tipo de palabras q tienen no pueden ser detectados por los OCR ( sistema q despues de escaneado te dice que palabra es) y por lo tanto no pueden ser digitalizados.
reCAPTCHA escanea los libros y con un sistema propio convierte las palabras en imagenes metidas en bases de datos y nos muestra dicha palabra en el CATCHA.
Cualquier usuario al registrarse en una de las millones de webs que utilizan dicho sistema van escribiendo las palabras y con un sistema de filtros la empresa determina que cada vez q X personas escriban la misma palabra para dicha imagen la dan por valida.
y dicha palabra se introduce en la base de datos . Una vez completado todas el libro ya esta escaneado..
dado el volumen de millones de busquedas diarias, mucho me temo que el nivel de escaneo de libros debe ser altamente elevado gracias a la colaboracion de los usuarios y la maravillosa tecnologia
solo pensar que muchisimos libros antiguos no podian ser digitalizados o su coste es elevadamente alto, este sistema pondra dichos libros al alcance de las manos con universidades y demas entidades
una magnifica idea.. me encantan las buenas y simples ideas
Si te gusta este post, puedes subscribirte a nuestro RSS!No related posts.








This post has 10 comments
November 3rd, 2009
He de comentar que aunque muy curioso lo que comentas… reCaptcha es un pésimo antispammer.
En las votaciones para elegir a la persona del año de Time… que usaba este sistema… La gente de 4chan consiguió no sólo quedar los primeros… sino que colocaron a 21 bots en las 21 primeras posiciones para formar una frase.
(y eso que durante el proceso Time estuvo “atenta” para que no hubiera trampas)
http://musicmachinery.com/2009/04/27/moot-wins-time-inc-loses/
November 4th, 2009
yo lo he utilizado y la verdad q me ha ido siempre se maravilla… por lo menos hasta la fecha
November 4th, 2009
Hombre, he de reconocer que es una idea fantástica, pero la verdad es que simple, simple (lo que se dice simple
), no es.
Pero efectivamente, los creadores se merecen un 10.
Un saludo,
Alberto
November 4th, 2009
Lo que está claro es que hoy en dÃa cualquier barrera de seguridad es posible romperla siempre y cuando se dediquen los recursos necesarios. Para la mayorÃa de los casos, reCaptacha funciona bien.
Sin embargo, lo que más me gusta del artÃculo no es el hecho de que funcione como antispam, sino el hecho de que se utilice para traducir libros antiguos. Es una idea simple pero genial. Me recuerda mucho a la saga “Hyperion” en donde las inteligencias artificiales entregan al hombre una “puerta” capaz de teletransportarles a cualquier sitio del universo. A cambio… hay un coste oculto para la humanidad (que no desvelo para que leáis una tetralogÃa increÃblemente buena)
November 4th, 2009
¿Y qué pasa si el usuario introduce mal la segunda palabra? ¿El texto a escanear queda erroneo?
Yo no darÃa por buena esa digitalización hasta haber sido introducida n veces igual por distintos usuarios.
November 5th, 2009
Si te lees el articulo, entero, veras que la segunda palabra no llega con que lo que responda UNA persona, si no que es lo que respondan cientos o miles de ellas, y si una de las respuestas llega a un porcentaje muy alto, es probablemente por que es la valida.
November 4th, 2009
Y hace algo más de un mes Google lo compró
http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html
November 4th, 2009
Bueno, lo de “simple” es bastante subjetivo. El sistema tiene su complejidad para otros mortales legos en la websfera…
November 4th, 2009
Realmente ingenioso!!
November 4th, 2009
Javi Moya, si te hubieses leÃdo completamente el enlace que publicas (como acabo de hacer), reCaptcha no tuvo la culpa del ataque. Hackear reCaptcha fue lo primero que intentaron los de 4chan, pero hubieran tardado semanas en conseguir descifrar los captchas (no lo digo yo, lo dice el artÃculo que enlazas). El ataque se produjo por fuerza bruta, con “cross site scripting”. Por lo tanto reCaptcha funciona, y funciona muy bien frente a ataques. Mejor de lo que yo realmente pensaba.
Trackbacks