보안세상

자동가입방지 문구의 비밀 본문

보안소식

자동가입방지 문구의 비밀

똔민 2017. 1. 8. 11:17
반응형

광학식문자인식(OCR) 기술을 쓰는데 종이 색깔이 노랗게 변하거나 글자 잉크가 날아간 경우 제대로 스캔이 되지 않는걸 이용하게되는데 

50년이 넘은 책을 스캔하면 대략 책의 30%인가는 제대로 인식되지 않는데 리캡차는 OCR가 인식하지 못한 글자를 사람에게 보여줘 고문서 복원 작업에 사용자들을 동차 시킴

리캡차는 OCR가 읽지 못한 글자를 추출하고 캡차와 비슷하게 해당 글자를 띄워 사용자에게 무슨 글자인지 입력해달라고 요청을 하는데

리캡차는 캡차와 다르게 두 단어를 물어보고 앞 단어는 캡차처럼 사용자가 로봇인지 사람인지 구분하고 이 단들을 제대로 입력하면, 리캡차는 사용자를 사람으로 인식, 다른 한 단어는 고문서 복원 작업을 위해 내놓은 단어고 첫 번째 단어를 제대로 입력했기 때문에 리캡차는 두 번째 단어를 올바르게 입력했을 거라고 생각해서 판단하고
이런 과정을 10명의 사람들에게 반복한 다음에 10명 모두가 앞 단어를 똑같이 읽으면 해당 단어의 스캔 작업에 적용함

여러 사람이 참여하는 캡차 특성을 이용해 ‘정답’을 찾아가는 집단지성 시스템을 고문서 복원에 적용하게됌

반응형
Comments