pt
Moulé à la louche depuis 1999
Les trucs qui m'énervent... et je vais pas prendre de pincettes
Internet, informatique, logiciel libre, économie, politique, vie courante et tout le reste...

Le nouveau projet de l'auteur de reCaptcha

Mercredi 21 decembre 2011

Vous connaissez les captchas ? Ce sont des images contenant du texte qu'il faut retaper pour prouver que vous êtes bien un humain (et non un système automatisé). C'est utilisé par exemple pour réduire le spam. Ça utilise le fait que la reconnaissance de caractères est quelque chose de très difficile pour un ordinateur, mais facile pour un être humain.

L'inventeur des captchas a eu une idée: Utiliser la puissance de calcul de nos cerveaux, utiliser des millions de captchas résolues chaque jour pour numériser des livres. Côté utilisateur, chaque fois que vous résolvez une reCaptcha, vous aidez à numériser des mots. Côté webmaster, cela vous fournit un système de captcha gratuit pour votre site. L'idée est brillante et fonctionne: Grâce à reCaptchas, ils numérisent l'équivalent de 2,5 millions de livres par an.


En dehors de la reconnaissance de caractères, il y a une autre tâche à laquelle l'ordinateur est très mauvais: La traduction de textes. Or une vaste partie d'internet est en anglais, et donc inaccessible à ceux qui ne parlent pas anglais. De même, certains contenus dans des langues spécifiques ne sont pas accessible du reste du monde. Luis von Ahn et son équipe ont donc réfléchi sur la manière de faire travailler collectivement nos cerveaux pour résoudre ce problème. Et ils sont arrivés à une solution.

Il se trouve que des millions de personnes à travers le monde veulent apprendre une nouvelle langue. Il y a donc des gens motivés. Le site duolingo.com (encore en bêta fermée) vous propose d'apprendre une nouvelle langue en vous exerçant à traduire des phrases de difficulté croissante. Histoire que ça soit plus motivant, ce ne sont pas des phrases construites pour l'occasion, mais du vrai contenu: Des phrases tirées de sites d'actualité ou de Wikipedia.

Certes vous allez faire des erreurs, mais ce n'est pas grave. Leur système combine les multiples réponses et parvient à obtenir des traductions aussi bonnes que des traducteurs professionnel. Impressionnant, non ?

Mais il y a un autre avantage: L'auteur estime qu'apprendre une nouvelle langue coûte en moyenne 500 dollars. 95% de la population n'a pas les moyens de débourser cette somme. Duolingo étant gratuit, cela permet d'aider même les gens sans moyens à apprendre une nouvelle langue.

Comment se finance Duolingo ? En traduisant des textes, vous créez de la valeur. C'est cette valeur qui sert à financer Duolingo: En fait vous payez le service avec le temps que vous passez à traduire. Mais le plus beau c'est que le temps que vous passez à créer de la valeur est en fait le temps qui vous sert à apprendre. C'est donc rentable pour eux comme pour vous.

A titre d'exemple, le wikipedia espagnole contient 849 000 articles, soit seulement 20% de la version anglophone. Pour traduire les 80% restant (soit environ 2,9 millions d'articles), cela coûterait - avec des traducteurs professionnels - près de 50 millions de dollars. Et encore, en utilisant la main-d'œuvre la moins chère. Avec Duolingo, cela ne couterai rien.

Est-ce que c'est long ? D'après leurs estimations, avec 100 000 utilisateurs, il leur faudrait 5 semaines pour traduire ces 80% restants. Ou 80 heures avec 1 million d'utilisateurs actifs.


Je trouve l'idée formidable:
  • Elle aide vraiment des gens qui ont un besoin (même ceux qui sont défavorisés).
  • Elle est rentable.
  • Elle contribue au bien de tous.

Si vous souhaitez voir la présentation complète de l'auteur dont mon article est le résumé, c'est . (Elle est en anglais, et les sous-titres français ne sont malheureusement pas disponibles. Toute fois la transcription est disponible en haut à droite de l'écran ("Interactive transcript")).

Vraiment, les conférences TED sont une source d'inspiration.