Cómo resolver este problema sin usar ningún algoritmo de aprendizaje automático

El algoritmo de k-vecinos más cercanos puede ser útil aquí.

El número K determinará la suavidad de la clasificación. A mayor K, más generalizados serán los resultados de la clasificación. En cuanto a la clase ‘Desconocido’, no hay una respuesta definitiva. En general, la mayoría simple se usa de los vecinos más cercanos a K, pero se puede establecer cualquier otra condición que determine cuánto debe dominar una clase sobre otra para tener un resultado válido. Si no domina esa cantidad, se puede clasificar como ‘Desconocido’.

Ejemplo:

(Usando 3 vecinos más cercanos por distancia euclidiana y mayoría simple)

primeros datos de la primera entrada de muestra:

Entradas: 95 y 125

a) Distancia desde (infectado) 90 y 120 = sqrt ((95-90) ^ 2 + (125-120) ^ 2) = 7.071

b) Distancia desde (no infectados) 90 y 150 = 25.49

c) Distancia desde (infectado) 100 y 140 = 15.81

d) Distancia desde (no infectados) 80 y 130 = 15.81

De los 3 vecinos más cercanos (a, cyd), 2 de ellos están ‘infectados’ y solo uno está ‘no infectado’. Por lo tanto, clasificamos la muestra como ‘Infectada’.

NB: a menudo se enseña en la introducción. a cursos de aprendizaje automático. Puede autocodificarse muy rápidamente y definitivamente no requiere ninguna API de Machine Learning. Se pueden usar otros métodos de agrupación avanzados o árboles de decisión, pero eso podría implicar un poco más de codificación.

Una posible solución que viene a mi mente, dados los datos de entrada y los resultados, es considerar a cada individuo como un punto en un espacio bidimensional dado por las tuplas (Temperatura, Presión). Denotando Infectado como 1 y No infectado como 0, encuentre la condición ponderada de cada nuevo viajero ponderando todas las condiciones de viajero registradas con sus distancias inversas.

Por ejemplo, en el primer ejemplo, las coordenadas registradas son (90, 120), (90, 150), (100, 140), (80, 130) y las condiciones son 1,0,1,0. Para encontrar la condición del nuevo viajero (95, 125), encuentre las distancias con cada viajero registrado, es decir, 50, 650, 250 y 250, luego encuentre sus inversas (porque una distancia mayor significa menores posibilidades de esa condición) y luego encuentre la ponderada condición media es decir

((1/50) * 1 + (1/650) * 0 + (1/250) * 1 + (1/250) * 0) / ((1/50) + (1/650) + (1 / 250) + (1/250)) = 0.8125

El valor es bastante cercano a 1, por lo tanto, denota Infectado, mientras que para el caso (95, 145) el valor resulta ser 0.49, que es algo neutral, por lo tanto, Desconocido y para el caso (75, 160) el valor es 0.27 que está más cerca de 0, por lo tanto, no infectado.

Se me ocurre una solución. Es un problema básico de estadística.

Como hay tres categorías, podemos tomar una desviación estándar para ello.

En Ej. 1:

90 120 infectados

90 150 no infectados

100 140 infectados

80 130 No infectado

Desviación estándar +/- media:

Temperatura infectada (87-102)

BP infectada (116-144)

Temperatura no infectada (78-92)

BP no infectada (126-154)

Caso 1: 95125 – Ambos números están en el rango infectado

Caso 2: 95145 – Ambos números están dentro de ningún rango

Caso 3: 75160- Ambos números están en el rango No infectado.

Espero eso ayude.