東雲の気まぐれな創造

絵とITに関する話を中心としたブログ

CAPTCHA(キャプチャ)

f:id:yukisinonome:20171031170113j:plain


さて、そもそもCAPTCHAって何だろうか?って方も多いと思います。CAPTCHAとは上の画像のように歪んでいたり横線が入ってる文字を見て、その文字を入力することで認証するシステムです。上のような画像は割と見たことある方が多いのではないかと思います。最近、画像の文字が汚すぎて読めなかった経験がある方もいるのではないでしょうか。


CAPTCHAがなぜ話題になったかというと、「人間でも読みにくい文字認証人工知能がかなりの精度で解読できるようになった」という情報がネットのニュースで出てきたからです。その結果、「人間でも読めないのに…」とか「人工知能が人間の文字認識を超えた!」とかちょっとした話題になったわけです。

CAPTCHAは何のための認証システムなのか?

応答者がコンピュータではなくて人間であることを確かめるためのシステムです。使用例としては、アカウント登録をする時やメールを送る時などに「あなたはロボットではありませんか?」というメッセージとともに文字を入力させます。


人間ならば文字が多少歪んでいても読めると思いますが、コンピュータは画像が歪んでいると画像認識の精度が大きく落ちます。したがって、簡単に人間とコンピュータを識別できるシステムとして普及しました。

最近どんどん読めなくなってきた理由

上記の通り、人間とコンピュータを識別するためのシステムだったのですが、画像認識技術の進歩でだんだん少しの歪みならコンピュータでも文字を認識できるようになってきたからです。コンピュータに認識されたらCAPTCHAの意味がないので、コンピュータに認識されないように徐々に文字の歪みを大きくしたり邪魔な線を増やしたりしたのです。その結果、人間にも読みにくいレベルで難しくなってきたというのが現状です。これが読みにくい理由です。


少し話がずれるのですが、この画像認識技術というのはかなり身近な技術で普段の生活の中でお世話になっている方もいるかもしれません。文字認識技術に最初に触れたのはゲーム初代DSの頃でしょうか?指やタッチペンを使って手書きで画面に文字を書く機会が出てきました。まだ初代の頃は手書きの文字を違う文字だと認識されたことがよくあったのではないでしょうか。しかし、最近ではささっと書いた文字でもかなり正確に認識してくれるようになったと思います。これが画像認識技術の1つである文字認識技術の進歩の恩恵なのです。

新しいCAPTCHA

最近、増えてきたタイプに画像を選ばせるタイプのCAPTCHAがあります。「私はロボットではありません。」の隣になるチェックボックスをクリックすると、複数枚の画像が表示されて指示された画像だけを選択するというものです。例えば、犬と猫の画像が複数枚ずつあって、猫の画像だけをクリックしろという感じです。背景色との差やパターンだけで認識できる文字と違って、画像に写っているものが何なのかというのはさらに高度な画像認識技術が要求されることになります。人間には簡単でコンピュータには難しいものというのは情報セキュリティでは重要な要素の1つなのです。