¿Qué antecedentes aparte de estadísticas y programación (R) necesito para poder manipular y analizar datos espaciales?

¿Son esos datos geográficos? Si es así, entonces Geografía sería útil.

Se utilizan muchos datos espaciales en SIG, por lo que familiarizarse con las estructuras de datos utilizadas por ESRI y el resto es un buen paso (especialmente las estructuras ráster vs vector). Aprender las matemáticas detrás de sus funciones comunes puede ayudar. Hay suposiciones interesantes que están permitidas en la teoría del análisis geográfico, y algunos desafíos novedosos en los datos espaciales que pueden sorprender a un extraño con la guardia baja.

Tenga en cuenta que también puede generalizar algunos conocimientos estadísticos a SIG; La ubicación del sitio es un tema interesante, y los buenos algoritmos para eso requieren que controlemos el error y elijamos variables significativas que no estén correlacionadas (al explicarse entre sí o disminuir directamente el poder del otro).

¡Buena suerte!

EDITAR:
Los nuevos temas de interés surgen con respecto a la interpolación, extrapolación, visualización, decidir cuándo usar ciertas estructuras de datos, agrupamiento y conversión en nuevos tipos de modelos de datos, dificultades en el muestreo aleatorio, optimización de rutas y muchos más.

1. Algoritmos de aprendizaje automático (como bosques aleatorios, redes neuronales, refuerzo de gradiente extremo y máquina de vectores de soporte …) y métodos de interpolaciones geoestadísticas (como Kriging).

2. Conceptos de SIG y teledetección (como datos vectoriales y ráster, sistemas de referencia de coordenadas, autocorrelación espacial, análisis de patrones de puntos …)

3. Optimización computacional (H20 y data.table en R …), ya que es un trabajo intensivo en memoria.

Estas son algunas de las otras cosas que deberían funcionar.

El análisis espacial es un conjunto de técnicas para analizar datos espaciales. Los resultados del análisis espacial dependen de la ubicación de los objetos que se analizan. El software que implementa técnicas de análisis espacial requiere acceso tanto a la ubicación de los objetos como a sus atributos.

Entonces, aparte de R y la teoría de la estadística, también debe comprender cómo se almacenan los datos espaciales en una base de datos, cómo consultarlos y procesarlos de manera eficiente desde esa base de datos y, después del análisis, cómo visualizar sus hallazgos.

Debe comprender sus datos, cuáles son los procesos subyacentes, cómo se adquieren los datos, el alcance de sus datos (local, regional, global), qué tipo de errores puede haber en los datos y la parte especial de los datos espaciales, dependencia espacial, también conocida como autocorrelación espacial.

Hay dos fuentes principales de datos espaciales, humanos y físicos, cada una tiene sus tradiciones, métodos preferidos y formas de recopilar datos. La recopilación de datos afecta el alcance de las generalizaciones que puede hacer. Los datos de teledetección están disponibles a nivel mundial, pero su resolución suele ser tosca, especialmente temporal, debido a las nubes, el ciclo día / noche y las estaciones. Los datos satelitales de calidad Goid pueden estar disponibles para ventanas limitadas, con un alto porcentaje de cobertura de nubes como factor limitante en muchos lugares.

Los datos espaciales derivados de humanos son aún peores en la resolución temporal, los cuestionarios son costosos, los censos también. Los datos recopilados automáticamente tienen muchas posibilidades de errores. La verificación de datos es clave para el éxito allí.

Los estudios de geografía son un gran paso adelante en la comprensión de la espacialidad de los fenómenos, cómo las escalas de contexto pueden significar tanto en cómo se interpreta el fenómeno.

More Interesting

¿La física ayuda a entender la ciencia de datos?

¿Cuáles son las rutas de aprendizaje típicas del análisis de datos?

¿Existe algún beneficio de saber que Java debe seguir el camino de ser un científico de datos o puede tomarse como un complemento? (Java-as Map reduce los requisitos previos: análisis de Big Data)

¿Qué son pasantías geniales orientadas a datos que no requieren un fondo intensivo de codificación?

Python (lenguaje de programación): ¿Qué se puede hacer con Python y simplemente no se puede hacer con R en el dominio de la ciencia de datos?

¿Cómo aprendes la programación de Python para la ciencia de datos?

¿Debo seguir escribiendo aplicaciones móviles o ciencia de datos?

¿Cómo utilizan los bancos la minería de datos?

¿Cuál es la mejor manera de encontrar la compañía adecuada para externalizar una tarea de minería de datos en la India?

Cómo convertirme en un "fantasma" en Internet y eliminar todos mis datos en línea

Estoy trabajando actualmente. Quiero convertirme en un científico de datos. ¿Cuáles fueron los conceptos y tecnologías centrales que necesito aprender?

¿Cuál es el objetivo principal de la minería de datos con big data?

¿Vale la pena un Master en Business Analytics para convertirse en un Data Scientist o los bootcamps son tan efectivos para conseguir un trabajo para alguien sin experiencia?

¿Cómo puede un servicio de coincidencia de datos ayudarlo a obtener una ventaja competitiva?

¿Cuánta experiencia en programación necesitaría para tomar el curso de especialización en ciencia de datos de Coursera?