recaptcha - Una idea per la seva simplicitat .. simplement de genis
De sempre he admirat les idees simples, aquelles idees que em donen per pensar com una cosa tan obvi no se li havia passat abans algú.
Fa poc em sàpiga que una herrameinta que molts administradors web fem servir i jo mateix des de fa diversos anys, a part d'exercir la tasca per a la q s'ofereix, de segones fa una tasca simplement fantastica i amb ideat d'una forma simple i brillant.
recaptcha és una eina q s'utilitza en formularis per q els robots que produeixen spam no puguin començar a inserir registres invàlids, haureu vist milers d'elles i de diversos tipus (consisteix a posar certs nombres, lletres) després d'un formulari per saber q ets un humà.
recaptcha és un sistema més d'aquests, però amb una diferència que el fa summament intel ligent per la seva doble funció.
1. d'una banda fa la mateixa funcio que tots els altres captchas
2. i aquí ve la genialitat, en lloc de tenir una paraula com molts altres té 2 paraules
la primera és el captcha normal però la segona paraula aquesta treta de l'escaneig de llibres antics que pel tipus de paraules q tenen no poden ser detectats pels OCR (sistema q després d'escanejat et diu que paraula es) i per tant no poden ser digitalitzats.
recaptcha escaneja els llibres i amb un sistema propi converteix les paraules en imatges ficades en bases de dades i ens mostra aquesta paraula en el catch.
Qualsevol usuari en registrar en una de les milions de webs que utilitzen aquest sistema van escrivint les paraules i amb un sistema de filtres l'empresa determina que cada vegada q X persones escriguin la mateixa paraula per a aquesta imatge la donen per vàlida.
i aquesta paraula s'introdueix a la base de dades. Un cop completat totes el llibre ja està escanejat ..
donat el volum de milions de consultes diàries, molt em temo que el nivell d'escaneig de llibres ha de ser altament elevat gràcies a la col.laboració dels usuaris i la meravellosa tecnologia
només pensar que moltíssims llibres antics no podien ser digitalitzats o el seu cost és elevada alt, aquest sistema posarà aquests llibres a l'abast de les mans amb universitats i demés entitats
una magnifica idea .. m'encanten les bones i simples idees
Si t'agrada aquest post, pots subscriure't al nostre RSS!No related posts.








This post has 10 comentaris
November 3rd, 2009
He de comentar que encara que molt curiós el que comentes ... recaptcha és un pèssim antispammer.
En les votacions per elegir la persona de l'any de Time ... que feia servir aquest sistema ... La gent de 4chan va aconseguir no només quedar els primers ... sinó que van col.locar a 21 bots a les 21 primeres posicions per formar una frase.
(i això que durant el procés Time va estar "atenta" perquè no hi hagués trampes)
http://musicmachinery.com/2009/04/27/moot-wins-time-inc-loses/
November 4th, 2009
jo l'he utilitzat i la veritat q m'ha anat sempre es meravella ... si més no fins a la data
November 4th, 2009
Home, he de reconèixer que és una idea fantàstica, però la veritat és que simple, simple (el que es diu simple
), No és.
Però efectivament, els creadors es mereixen un 10.
Una salutació,
Alberto
November 4th, 2009
El que està clar és que avui en dia qualsevol barrera de seguretat és possible trencar-la sempre que es dediquin els recursos necessaris. Per a la majoria dels casos, reCaptacha funciona bé.
No obstant això, el que més m'agrada de l'article no és el fet que funcioni com antispam, sinó el fet que s'utilitzi per traduir llibres antics. És una idea simple però genial. Em recorda molt a la saga "Hyperion" on les intel.ligències artificials lliuren a l'home una "porta" capaç de teletransportar a qualsevol lloc de l'univers. A canvi ... hi ha un cost ocult per a la humanitat (que no desvetllament per a que llegiu una tetralogia increïblement bona)
November 4th, 2009
I què passa si l'usuari introdueix malament la segona paraula? El text a escanejar queda erroni?
Jo no donaria per bona aquesta digitalització fins haver estat introduïda n vegades igual per diferents usuaris.
November 5th, 2009
Si et llegeixes l'article, sencer, veuràs que la segona paraula no arriba amb que el que respongui UNA persona, sinó que és el que responguin centenars o milers d'elles, i si una de les respostes arriba a un percentatge molt alt, és probablement per que és la vàlida.
November 4th, 2009
I fa una mica més d'un mes Google el va comprar
http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html
November 4th, 2009
Bé, això de "simple" és bastant subjectiu. El sistema té la seva complexitat per a altres mortals llecs en la websfera ...
November 4th, 2009
Realment enginyós!!
November 4th, 2009
Javi Moya, si et haguessis llegit completament l'enllaç que publiques (com acabo de fer), recaptcha no va tenir la culpa de l'atac. Hackear recaptcha va ser el primer que van intentar els de 4chan, però haguessin trigat setmanes en aconseguir desxifrar els captchas (no ho dic jo, ho diu l'article que enllaça). L'atac es va produir per força bruta, amb "cross site scripting". Per tant recaptcha funciona, i funciona molt bé davant d'atacs. Millor del que jo realment pensava.
Trackbacks