¿Cómo funciona el CAPTCHA ‘No soy un robot’?


Una ventaja que Google tiene sobre otras compañías es la gran cantidad de datos. Esa información también incluye la forma en que mueve el mouse en la pantalla.

La forma en que un humano mueve el mouse antes de marcar la casilla de verificación puede ser distinta de cómo un programa (un bot) marca una casilla de verificación.

Es un juego de predicción. De alguna manera, Google necesita predecir si eres humano o un bot a partir de lo que haces en su sitio.

Primero, un sistema necesita ser entrenado para predecir si el usuario es humano o no. Para esto necesitas datos de entrenamiento (que Google tiene muchos). Esos datos incluyen movimientos de muestra de ratón hechos por humanos, así como robots (programas). Usando estos datos de entrenamiento, se hace un modelo predictivo.

Entonces, cuando mueves el mouse para marcar la casilla de verificación. Ese movimiento es una entrada al modelo y en base a eso se predice si eres humano o no. Si está bien, de lo contrario se utiliza el mismo método antiguo de filtrado de humanos a través de una imagen distorsionada.

Es un secreto muy bien guardado, pero hablan un poco sobre eso en su blog aquí:

¿Eres un robot? Presentamos “No CAPTCHA reCAPTCHA”

Me sorprende que pueda ser efectivo, pero Google contrata a personas inteligentes. Es un problema muy, muy difícil. Es simple para un usuario, pero no tan simple para una máquina. Y estoy seguro de que lo están modificando a medida que los desarrolladores de robots y Google participan en una carrera armamentista.

Sin embargo, los captcha reales están fallando bastante en estos días ya que las computadoras son tan buenas o mejores que los humanos para descifrar texto distorsionado, por lo que tuvieron que hacer algo. Y los usuarios odian los captchas de estilo antiguo, especialmente a medida que se vuelven cada vez más difíciles de hacer.

Curiosamente, hay varios componentes para esto:

El cliente tiene que representar el JavaScript y usar el cursor del mouse para interactuar con él. No todos los spammers tienen las herramientas para hacer esto o molestarán.

La dirección IP se registra. La actividad sospechosa (repetitiva) podría hacer que no sea de confianza, o un enlace a una cuenta real de Google podría ayudar.

Aquí se puede aplicar la misma tecnología para prevenir el fraude de clics en la red publicitaria, incluidas las formas de rastrear y comparar patrones de movimiento del mouse.

Menos ciertos casos pueden ser escalados a un método de respaldo.

PrestaShop NoCaptcha reCaptcha

Con la ayuda de este módulo Captcha, podemos evitar el envío de formularios de spam. Muchos sitios web han comenzado a integrar el nuevo No Captcha reCaptcha de Google. Tiene una mejor protección anti-bot y experiencia de usuario. Según Google, este nuevo modelo proporciona el mayor nivel de protección que el modelo anterior. Este nuevo modelo -No Captcha reCaptcha, tiene una mejor experiencia de usuario que el antiguo recaptcha. Esta característica le pedirá al usuario que haga clic en una casilla de verificación.

caracteristicas:

  • PrestaShop Google No Captcha reCaptcha tiene una mejor protección y experiencia de usuario.
  • En comparación con el captcha tradicional, reCAPTCHA es mucho más fácil de usar con la casilla de verificación “No soy un robot”.
  • Panel de configuración administrativa flexible.
  • Después de realizar cambios en el backend del sitio, la vista previa de reCaptcha se puede ver instantáneamente en el propio backend
  • Al usar la opción “Personalizar” en el backend, el usuario puede personalizar el diseño reCaptcha

CAPTCHA salió de la Universidad Carnegie Mellon y significa “Prueba de Turing pública completamente automatizada para distinguir computadoras y seres humanos”. Las pruebas están diseñadas para ser difíciles para los robots, fáciles para los humanos. Por lo general, consisten en escribir letras y / o dígitos de una imagen distorsionada. Diez años después de usar CAPTCHA para evitar que los robots se involucren en trucos sucios en línea, el “supuesto eliminar los bots” ahora se ha convertido en “apestar completamente a eliminar los bots”. Esto se debe a que los avances en Inteligencia Artificial han dado como resultado creaciones de robots que ahora pueden resolver incluso la variante más difícil de texto distorsionado con una precisión del 99.8%, según una investigación reciente de Google. Google se alejará de pedirles a los usuarios que lean el texto blobby y lo escriban en un cuadro, como ha estado haciendo, así: reCAPTCHA. Y en lugar de eso simplemente nos preguntará, “¿Eres un robot?” Con lo que se llama la API “No CAPTCHA reCAPTCHA”, así: no soy un robot.

Por otro lado, a partir de la experiencia que he tenido con el verificador de respuesta del sitio web basado en anti-automatización, hace uso de una base de datos simple basada en imágenes categorizadas que compara sus selecciones con lo que está en su base de datos. De hecho, hay una interfaz front-end no html para esta base de datos. El lenguaje de programación front-end puede ser JAVA o script JAVA (más que probable). Robotronics LLC | Facebook

Pedirnos que marquemos una casilla que dice “No soy un robot” será una forma efectiva de determinar si somos robots o no porque los humanos mueven sus cursores de una manera humana.

Especialmente, la diferencia entre bot y humano se puede revelar en pistas tan sutiles como cómo un usuario (o un bot) mueve un mouse en los breves momentos antes de hacer clic en el botón “No soy un robot”.

Sin darse cuenta, los humanos también arrojan pistas que pueden establecer si estamos automatizados o no: las direcciones IP y las cookies muestran nuestros movimientos en otras partes de la Web y pueden ayudar a demostrar que no somos un mal actor

Trataré de darte una respuesta más técnica.

Para comprender qué es un CAPTCHA, debe comprender qué es una prueba de Turing: prueba de Turing
Un CAPTCHA se puede definir como una prueba de Turing inversa.

La intención de la prueba es que el juez intente distinguir cuál de estas dos situaciones está ocurriendo realmente. Se presume que un sujeto humano siempre será juzgado como humano, y luego se dice que una computadora “pasa la prueba de Turing” si también se considera humano.

Me gustaría señalar la conexión entre CAPTCHA y la aplicación DUOLINGO. En una charla TED, se presenta este enlace: Aparentemente, los pequeños fragmentos de texto analógico que pueden aparecer como los desafíos que debe resolver el ser humano, a menudo se originan en libros que necesitan digitalización.

Según el TED-talk, ambas tecnologías funcionan en el área general de la inteligencia artificial y la colaboración humana en línea.

Te recomiendo que vayas a escuchar a Luis Ahn:

Colaboración en línea a gran escala

Para omitir y resolver automáticamente el captcha de Google “No soy un robot”, consulte Resolver la versión 2 de NoCaptcha ReCaptcha de Google automáticamente

El botón en la página web es extremadamente difícil de acceder por los programas que raspan la página. Se necesita que una persona mueva un puntero con el mouse sobre el botón para hacer clic.

Google está utilizando movimientos del mouse para autenticar al usuario con re-Captcha y velocidad de carga de página. Notará que si no puede reconocerlo, se remonta a la antigua CAPTCHA perdiendo el tiempo de los usuarios. Una alternativa es http://NoMoreCaptchas.com completamente pasiva que es BioChronometrics para autenticar al usuario.

More Interesting

Mi experiencia con el rendimiento de las capacidades NLP de IBM Watson fue mala. ¿Como estuvo el tuyo?

¿Cuáles son algunos modelos de detección de rostros basados ​​en aprendizaje profundo disponibles gratuitamente?

¿Cuáles son los pros y los contras comparativos de usar Python, MATLAB / Octave y R para el análisis de datos y el aprendizaje automático?

¿Cuál es la relación entre el aprendizaje automático y la minería de datos?

¿Cuáles son algunos marcos de aprendizaje profundo con solo CPU?

¿Tendrán alguna coincidencia los modelos gráficos probabilísticos y el aprendizaje profundo?

¿Es posible engañar a un automóvil autónomo para interpretar una señal de alto (como lo percibe el ojo humano) como una señal de velocidad?

¿Qué sucede si hacemos que cada unidad de filtro o núcleo en una capa CNN dentro de una red neuronal profunda tenga diferentes tamaños de ventana pero el mismo número de parámetros de peso (lo que resulta en granulado grueso)? ¿Podría conducir a un efecto contextual?

¿Qué llamarías técnicas de aprendizaje no automático?

¿Cuáles son las desventajas de tener un tamaño de paso constante para el Descenso de degradado por lotes?

¿Qué debe saber todo programador competitivo (Topcoder) sobre los concursos de Kaggle y ML?

Cómo aprender y construir un chatbot inteligente basado en inteligencia artificial como Google Allo desde cero, con un mayor enfoque en el modelo de dominio cerrado basado en la recuperación y el aprendizaje de ML y NLP

¿Qué son las redes adversas generativas (GAN)?

¿R es tan popular solo por las bibliotecas que pueden manejar varias funciones estadísticas?

¿Cuáles son algunos buenos métodos para el procesamiento previo de datos en el aprendizaje automático?