¿Qué hace que resolver CAPTCHA sea tan difícil?

Fuente Wikipedia (CAPTCHA):

Los CAPTCHAS modernos basados ​​en texto están diseñados de tal manera que requieren el uso simultáneo de tres habilidades separadas: reconocimiento, segmentación y análisis invariantes para completar correctamente la tarea con cualquier coherencia.

  1. El reconocimiento invariable se refiere a la capacidad de reconocer la gran cantidad de variación en las formas de las letras. Hay casi un número infinito de versiones para cada personaje que un cerebro humano puede identificar con éxito. Lo mismo no es cierto para una computadora, y enseñarle a reconocer todas esas formaciones diferentes es una tarea extremadamente desafiante.
  2. La segmentación , o la capacidad de separar una letra de otra, también se dificulta en CAPTCHA, ya que los caracteres se apiñan sin espacios en blanco en el medio.
  3. El contexto también es crítico. El CAPTCHA debe entenderse de manera integral para identificar correctamente cada personaje. Por ejemplo, en un segmento de un CAPTCHA, una letra puede verse como una “m”. Solo cuando se toma en contexto toda la palabra se hace evidente que es una “u” y una “n”.

Cada uno de estos problemas plantea un desafío importante para una computadora, incluso de forma aislada. La presencia de los tres al mismo tiempo es lo que hace que los CAPTCHA sean difíciles de resolver.

Prathab proporcionó buenas respuestas. Nunca antes había hecho CAPTCHA, pero según mi experiencia con OCR, creo que la dificultad es la extracción de características. La mayoría de las funciones que funcionan para OCR (dirección de línea, intersección de línea, bucle, …) se romperían cuando se trata de CAPTCHA debido a las líneas artificiales agregadas y las diversas transformaciones. Algunos captchas son tan torcidos que incluso el ser humano no puede reconocerlo. Además, muchas técnicas de OCR (por ejemplo, el Modelo de Markov oculto) se basan en palabras en inglés, pero los captchas son solo caracteres aleatorios.

Puede utilizar servicios automatizados de resolución de captcha como https://www.captchasolutions.com/ para automatizar el proceso y facilitarlo mediante el uso de un servicio web RESTFul API.

🙂