Una ventaja que Google tiene sobre otras compañías es la gran cantidad de datos. Esa información también incluye la forma en que mueve el mouse en la pantalla.
La forma en que un humano mueve el mouse antes de marcar la casilla de verificación puede ser distinta de cómo un programa (un bot) marca una casilla de verificación.
Es un juego de predicción. De alguna manera, Google necesita predecir si eres humano o un bot a partir de lo que haces en su sitio.
- ¿Qué núcleo (para los métodos de núcleo en el aprendizaje automático) es menos sensible a la alta dimensión: cauchy, gaussiana o laplaciana?
- ¿Cuáles son las probabilidades de ingresar a un programa de posgrado de aprendizaje automático en una escuela superior si mi experiencia en investigación es en bioinformática y algo de experiencia en investigación en PNL?
- ¿Cuáles son los requisitos previos para aprender Machine Learning?
- ¿Le resulta aburrido resolver los problemas de aprendizaje automático tipo kaggle intelectualmente aburrido (en comparación con la programación competitiva, por ejemplo)?
- ¿Qué es la regresión no lineal vs regresión lineal?
Primero, un sistema necesita ser entrenado para predecir si el usuario es humano o no. Para esto necesitas datos de entrenamiento (que Google tiene muchos). Esos datos incluyen movimientos de muestra de ratón hechos por humanos, así como robots (programas). Usando estos datos de entrenamiento, se hace un modelo predictivo.
Entonces, cuando mueves el mouse para marcar la casilla de verificación. Ese movimiento es una entrada al modelo y en base a eso se predice si eres humano o no. Si está bien, de lo contrario se utiliza el mismo método antiguo de filtrado de humanos a través de una imagen distorsionada.