GoogleがreCAPTCHAを買収

recaptcha-logo

グーグルの公式ブログにて発表がありました。reCAPCHAはGoogleのサービスになったということです。

Official Google Blog: Teaching computers to read: Google acquires reCAPTCHA

reCAPTCHAは、ウェブのユーザーの力を使って、CAPTCHAサービスを提供しつつ、大量の人力でもって読めない活字(印刷物をスキャンしたもの)を解析する、というサービスです。

recaptcha-screenshot

こんな風なフォームで、既にわかっている単語と、読み取れない単語の二つを表示し、ユーザーに入れてもらうことで、読み取れなかった単語を知り、ユーザーが人間であるというチェックも行なうという一石二鳥のアイデア。

前に解説を書いたのでそちらも見てください。

秋元@サイボウズラボ・プログラマー・ブログ: reCAPTCHA – キャプチャを利用した人力高性能OCR

なんでも買いますねー。ウェブサイトで入力された大量のデータを裁くという点や、OCRから読み取った文字の認識制度を上げるという点で、巨大なサーバを持ちGoogle Booksで大量の紙の本をデジタル化しているGoogleにとっては当然の買収といえるかもしれませんが

Googleに期待することは、英語以外でもメニューやヘルプを用意することですね。もちろん日本語にも対応して。そうすれば日本でももっと使うサイトが増えるだろうと思います。それから、Google Bookが日本の本もどんどんスキャンしていくつもりなら、日本語の読み取りも同じようにしたいんじゃないかなと思います。