reCAPTCHA - Una idea per la seva simplicitat .. simplement de genis
De sempre he admirat les idees simples, aquestes idees que em donen per pensar com una cosa tan obvi no se li havia ocorregut abans a algú.
Fa poc em sàpiga que una herrameinta que molts webmasters fem servir i jo mateix des de fa diversos anys, a part d'exercir la tasca per a la q s'ofereix, de segones fa una tasca simplement fantàstica i amb ideat d'una manera simple i brillant.
reCAPTCHA és una eina q s'utilitza en formularis per q els robots que produeixen spam no puguin començar a inserir registres invàlids, haureu vist milers d'elles i de diversos tipus (consisteix a posar certs números, lletres) després d'un formulari per saber q ets un humà.
reCAPTCHA és un sistema més d'aquests, però amb una diferència que el fa summament intel ligent per la seva doble funció.
1. per una banda fa la mateixa funció que tots els altres captchas
2. i aquí ve la genialitat, en lloc de tenir una paraula com molts altres té 2 paraules
la primera és el captcha normal però la segona paraula aquesta treta del escaneig de llibres antics que pel tipus de paraules q tenen no poden ser detectats pels OCR (sistema q després d'escanejat et diu que paraula és) i per tant no poden ser digitalitzats.
reCAPTCHA escaneja els llibres i amb un sistema propi converteix les paraules en imatges ficades en bases de dades i ens mostra aquesta paraula en el CATCH.
Qualsevol usuari en registrar en una de les milions de webs que utilitzen aquest sistema van escrivint les paraules i amb un sistema de filtres l'empresa determina que cada vegada q X persones escriguin la mateixa paraula per a aquesta imatge la donen per vàlida.
i aquesta paraula s'introdueix a la base de dades. Un cop completat totes el llibre ja està escanejat ..
donat el volum de milions de cerques diàries, molt em temo que el nivell d'escaneig de llibres ha de ser altament elevat gràcies a la col laboració dels usuaris i la meravellosa tecnologia
només pensar que moltíssims llibres antics no podien ser digitalitzats o el seu cost és elevada alt, aquest sistema posarà aquests llibres a l'abast de les mans amb universitats i demés entitats
una magnifica idea .. m'encanten les bones i simples idees
Si t'agrada aquest post, pots subscriure't al nostre RSS !No related posts.








This post has 7 comments
November 3rd, 2009
He de comentar que encara que molt curiós el que comentes ... reCAPTCHA és un pèssim antispammer.
En les votacions per triar la persona de l'any de Time ... que usava aquest sistema ... La gent de 4chan va aconseguir no només quedar els primers ... sinó que van col.locar a 21 brossa a les 21 primeres posicions per formar una frase.
(I això que durant el procés Time va estar "atenta" perquè no hi hagués trampes)
http://musicmachinery.com/2009/04/27/moot-wins-time-inc-loses/
November 4th, 2009
jo l'he utilitzat i la veritat q m'ha anat sempre es meravella ... si més no fins a la data
November 4th, 2009
Home, he de reconèixer que és una idea fantàstica, però la veritat és que simple, simple (el que es diu simple
), No és.
Però efectivament, els creadors es mereixen un 10.
Una salutació,
Alberto
November 4th, 2009
El que està clar és que avui en dia qualsevol barrera de seguretat és possible trencar sempre que es dediquin els recursos necessaris. Per a la majoria dels casos, reCaptacha funciona bé.
No obstant això, el que més m'agrada de l'article no és el fet que funcioni com antispam, sinó el fet que s'utilitzi per traduir llibres antics. És una idea simple però genial. Em recorda molt a la saga "Hyperion" on les intel.ligències artificials lliuren a l'home una "porta" capaç de teletransport a qualsevol lloc de l'univers. A canvi ... hi ha un cost ocult per a la humanitat (que no desvetlament perquè llegiu una tetralogia increïblement bona)
November 4th, 2009
I què passa si l'usuari introdueix malament la segona paraula? El text a escanejar queda erroni?
Jo no donaria per bona aquesta digitalització fins haver estat introduïda n vegades igual per diferents usuaris.
November 4th, 2009
I fa una mica més d'un mes Google el va comprar
http://googleblog.blogspot.com/2009/09/teaching-computers-to-read-google.html
November 4th, 2009
Bé, això de "simple" és bastant subjectiu. El sistema té la seva complexitat per a altres mortals llecs en la websfera ...
Trackbacks