Jump to content

Users De Computadores Estão Digitalizando Livros Sem Saber Com O Recaptcha


cRaZyzMaN
 Share

Recommended Posts

Milhões de usuários de computadores estão digitalizando o equivalente a 160 livros diariamente com uma precisão superior a 99%, ainda que a maioria deles não saiba que está ajudando nesta tarefa gigantesca.

Captcha útil

O trabalho começou há cerca de um ano, quando pesquisadores da Universidade Carnegie Mellon, nos Estados Unidos, colocaram no ar o reCAPTCHA. CAPTCHA é o nome daquele monte de letras e números embaralhados que se deve digitar para se cadastrar em um site ou para confirmar o envio de um correio eletrônico.

Em vez de ser uma mera medida de segurança que os sites utilizam para evitar a ação de spammers, o reCAPTCHA mostra palavras de verdade capturadas de livros por meio de scanners e que não puderam ser interpretadas pelas ferramentas de reconhecimento de caracteres, os chamados OCR (Optical Character Recognition).

Reconhecimento de palavras

Mas como o programa sabe que o usuário digitou a palavra correta? O sistema funciona assim: o software do reCAPTCHA pega uma palavra conhecida e outra que não foi reconhecida pelo OCR, e apresenta ambas ao usuário. Se o usuário interpretou corretamente a primeira, o programa assume que a segunda também foi interpretada corretamente. O mesmo conjunto é apresentado seguidamente a vários usuários, até que, estatisticamente, ele tenha certeza de que a palavra foi mesmo reconhecida.

Milhares de sites ao redor do mundo já adotaram o reCAPTCHA, que é gratuito. Durante seu primeiro ano de funcionamento, 1,2 bilhão de captchas foram resolvidos e mais de 440 milhões de palavras foram corretamente decifradas. Isso equivale à digitalização de 17.600 livros.

Link to comment
Share on other sites

Isso acho que está no TL!

Eu bem suspeitava que havia uma das palavras que não dava erro. Lembro-me de uma vez fazer login sem perceber qual era a 2ª palavra, meti uma que se assemelhasse e entrou. Achei estranho mas continuei...

Edited by HERiTAGE
Link to comment
Share on other sites

Isso acho que está no TL!

Eu bem suspeitava que havia uma das palavras que não dava erro. Lembro-me de uma vez fazer login sem perceber qual era a 2ª palavra, meti uma que se assemelhasse e entrou. Achei estranho mas continuei...

Sim o tl e outros sites de torrents usam este sistema

Link to comment
Share on other sites

porra isto é que são ideias!!! sim senhor. . . .

no tl eu tb ja tinha reparado mas pensava k era uma margem de erro do programa...

então quer dizer que a palavra que temos k acertar já é sabida e a outra somos nós a digitalizar !? então e se for mal???

edit: lool já li o resto da notícia.

Edited by wazzuup
Link to comment
Share on other sites

Create an account or sign in to comment

You need to be a member in order to leave a comment

Create an account

Sign up for a new account in our community. It's easy!

Register a new account

Sign in

Already have an account? Sign in here.

Sign In Now
 Share

  • Recently Browsing   0 members

    • No registered users viewing this page.
×
×
  • Create New...

Important Information

We have placed cookies on your device to help make this website better. You can adjust your cookie settings, otherwise we'll assume you're okay to continue.