A2A.
Estoy confundido acerca de lo que realmente estás preguntando. Por ahora, puedo interpretarlo de dos maneras:
i) Estás hablando de un análisis general de datos
- ¿Qué es el aprendizaje automático? ¿Alguien puede explicar sobre el aprendizaje automático?
- ¿Cómo encontrar un mentor que me ayude a construir una carrera en visión por computadora y aprendizaje profundo como investigador o académico? ¿Cuál es el camino definitivo hacia este objetivo?
- ¿Son los chatbots el comienzo de la verdadera IA?
- ¿Qué significa la implementación del algoritmo de aprendizaje automático distribuido?
- ¿El uso de memoria aumenta a medida que aumentan los datos de entrenamiento en redes neuronales profundas?
En este caso, depende del tipo de análisis que esté haciendo. Lo más importante es que debes saber lo que estás haciendo. Si está utilizando funciones integradas, debe comprender la entrada y el significado de los diferentes números en la salida. Por ejemplo, puede hacer análisis de datos exploratorios muy simples como los siguientes:
datos (iris)
cabeza (iris)
iris [[‘Is.Versicolor’]] <- as.numeric (iris [['Species']] == 'versicolor')
fit.lm <- lm (Is.Versicolor ~ Petal.Length + Sepal.Length, data = iris)
resumen (fit.lm)
iris [[‘Predict.Versicolor.lm’]] 0.5)
tabla (iris [, c (‘Is.Versicolor’, ‘Predict.Versicolor.lm’)])
Este código produce esto:
##
## Llamada:
## lm (fórmula = Is.Versicolor ~ Petal.Length + Sepal.Length, data = iris)
##
## Residuos:
## Mín. 1Q Mediana 3Q Máx.
## -0.6597 -0.3667 -0.1962 0.5520 0.7929
##
## Coeficientes:
## Estd Estd. Error t valor Pr (> | t |)
## (Intercepción) 1.11893 0.40693 2.750 0.006715 **
## Pétalo.Longitud 0.14794 0.04328 3.419 0.000815 ***
## Sepal.Length -0.22959 0.09226 -2.489 0.013940 *
## –
## Signif. códigos: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ” 1
##
## Error estándar residual: 0.4569 en 147 grados de libertad
## R cuadrado múltiple: 0.07949, R cuadrado ajustado: 0.06696
## Estadística F: 6.347 en 2 y 147 DF, valor p: 0.002271
Se intentó la regresión aquí. Y del resultado parece que todas las variables fueron significativas con p <0.05. (Tienes que saber qué es el valor p ). Sin embargo, 92 especies fueron clasificadas con solo 3 verdaderos positivos. Eso lo convierte en un mal modelo. Entonces no funcionará. Solo lo sabrá si tiene una idea clara sobre los conceptos.
ii) Estás hablando de análisis organizacional como SWOT
En ese caso, primero debe transformar eso en un modelo matemático y luego hacer el análisis de datos. Entonces se reducirá al mismo principio.
En general, necesita una idea clara sobre los diferentes conceptos estadísticos y las funciones que está utilizando. No iré al análisis de datos complejos aquí. Tienes la idea.
Recomiendo este libro del profesor Peng, si desea obtener más información sobre el análisis exploratorio de datos en R.