Cómo curvar datos de ajuste con un modelo desconocido

Estás en un mal lugar en este momento. Ok, entonces el modelo es desconocido. Sin embargo, ¿puede usted (a partir de los primeros principios) determinar algunas propiedades elementales del modelo? Calcule las respuestas a la mayor cantidad posible de lo siguiente.

  • ¿Cuál es el dominio de x? ¿Puede x ser negativo?
  • ¿Cuál es el dominio de y? ¿Puedes ser negativo?
  • ¿Qué sucede cuando x se hace más grande? ¿Es ilimitado o acotado? ¿Es x ilimitado o limitado?

Verá, cualquier tipo de regresión ES un modelo. Por lo tanto, su trabajo es elegir un modelo que sea más fiel a su situación.

Permítanme dar un ejemplo: si su situación permitiera valores positivos y negativos de x, entonces un modelo de ley de potencia y = b * x ^ a sería una MALA idea, porque este modelo NO permite valores negativos de x.

Otro ejemplo. Si su situación permite un crecimiento ilimitado de y cuando x se agranda, entonces un modelo logístico y = m / (1 + c * e ^ (- kx)) es una mala idea, porque este modelo conduce a la saturación de y.

Entonces, piense en los casos límite de su situación y elija un modelo con el mismo comportamiento límite.

Me enfrento a un extraño problema.

Tengo datos [X, Y] [matemáticas] [X, Y] [/ matemáticas] sin ruido. Si trazo Y [matemáticas] Y [/ matemáticas] en función de X [matemáticas] X [/ matemáticas], parece una línea recta y el coeficiente de regresión es bastante bueno.

Para el modelo más simple

Y = 1 + aXa = 0.328841508328634 ± 2.36619297413024⋅10−5χ2 / doF = 0.00149066816255509R2 = 0.999325489519206 [math] Y = 1 + aXa = 0.3288415083286342.66242242102 = 2.695 = 2.295 = 1.259.225.56.29.29.29.29.29.29.29.29.29.29.29.29.96.29.96.29.29.96.29.96.29.9.2.2.2.1.2.1.1.1.1.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2.1.2 sobre para sobretater.

El problema es que, si sigo agregando potencias de X, el ajuste es mejor y mejor, todos los parámetros siguen siendo muy significativos.

Sin embargo, cualquiera que sea el grado del polinomio, los residuos mantienen una forma sinusoidal. Esto probablemente revela que estoy usando una función incorrecta. ¿Puede este síntoma en los residuos dar una idea de una mejor función?

Puede probar la regresión polinómica (regresión polinómica) o la regresión de cresta del núcleo. Parece que ajustar una línea recta no haría justicia al modelo subyacente que ha generado los datos.

U puede probar el modelo lineal con términos no lineales como x ^ 2 antes de probar el modelo no lineal como el modelo exponencial. Solo tenga en cuenta que el modelo debe ser lo más simple posible.

More Interesting

¿Tenemos entrenamiento para pruebas de big data en Chennai?

No soy muy bueno con las matemáticas y las estadísticas, pero soy un programador decente. Quiero ser muy bueno con el aprendizaje automático / aprendizaje profundo. ¿Dónde debo comenzar y cómo puedo continuar?

¿Cuál es la más fácil: aprendizaje automático, inteligencia artificial o ciencia de datos?

¿Qué hizo que Palantir fuera tan exitoso?

Como licenciado en Ciencias de la Computación, ¿debería seguir un aprendizaje teórico de aprendizaje automático o un aprendizaje de aprendizaje automático aplicado?

¿Qué cursos PG de tiempo completo o parcial en Big Data recomendarías?

Para algoritmos de bandidos con múltiples brazos, ¿tiene sentido dejar de muestrear un brazo si el límite de confianza superior p% es menor que el límite de confianza inferior p% de un brazo de diferencia?

¿Cómo es ser un científico de datos en Instagram?

¿Existen aplicaciones para el aprendizaje automático / ciencia de datos en el campo de los vuelos espaciales?

Quiero aprender análisis avanzados en 1-2 meses. ¿A qué curso debo unirme para convertirme en un experto en análisis de datos?

En la era de Big Data, ¿cómo elegimos información efectiva?

¿Hay alguna brecha de habilidades en el campo de Big Data también?

¿La ciencia de datos es popular en el riesgo de crédito? ¿Es posible involucrarse en ciencia de datos en riesgo de crédito especializado en programación?

¿Cuáles son las habilidades necesarias para ser un buen analista de datos? ¿Qué cursos se requieren para ser un buen analista de datos? ¿Es bueno entrenar esas tecnologías cuando está más fresco?

¿Qué herramientas usan los científicos de datos en Uber?