¿Deberían los investigadores de educación adaptar R y alejarse del software estadístico minorista (SAS, Stata, SPSS)?

Eso depende de un par de cosas:

  • ¿Cuál es el tema del curso?
  • ¿Cuál es el trasfondo de los estudiantes?
  • ¿Qué se usa más en las áreas comunes de trabajo / estudio de estos estudiantes?

Tema del curso

La mayoría de los cursos no son sobre un idioma / software. Es mucho más probable que el curso sea sobre técnicas que no tienen relación directa con ninguna pieza de software. (por ejemplo, regresión lineal en el campo de la econometría)

Eso significa que el software seleccionado es solo una herramienta para aplicar algunas de estas técnicas. Ya sea que realice una regresión lineal en R o SPSS, sigue siendo una regresión lineal y las consideraciones, los aprendizajes y, con suerte, los resultados serán los mismos.

Eso significa que no hay una razón a priori para elegir una solución por encima de la otra. En realidad, es probable que desee seleccionar el software que se interponga lo menos posible. Y en mi libro, eso ciertamente no es R. (elegiría SPSS, pero no puedo juzgar sobre Stata, nunca usé eso)

Fondos de estudiantes

Una segunda cosa importante a tener en cuenta es lo que los estudiantes ya saben. Los estudiantes que están familiarizados con la programación probablemente se volverán productivos lo suficientemente rápido en R. Pero, ¿qué pasa si tienen una formación totalmente diferente? Por ejemplo, psicología, algunas ramas de la economía … Escoger R y, en gran medida, en menor medida SAS, con toda probabilidad significa que primero tendrás que pasar varias clases para aprender la herramienta. El tiempo es un recurso escaso, por lo que la pregunta es: ¿vale la pena? A veces lo es, a veces no lo es.

Uso común

Si tiene que elegir una herramienta de todos modos, probablemente sea una buena idea considerar lo que probablemente usarán en el futuro:

  • ¿Hay otras clases que usan R / SAS? Posiblemente sea una buena idea elegir lo mismo, de modo que se gaste menos tiempo explicando el software y más explicando el contenido real del curso.
  • ¿Qué es dominante en los sectores en los que terminarán los estudiantes? Si está dando un curso a personas que estudian finanzas, SAS podría ser una buena idea: (al menos en Bélgica) sigue dominando el sector bancario.

Entonces, no, no necesariamente deben elegir R. Puede ser una buena idea, pero ciertamente no siempre es así. 🙂

Me voy a sentar en la cerca aquí y decir ‘solo si el investigador quiere’. Hay muchas herramientas disponibles para que los investigadores usen Stata, SPPS R, Python, Matlab, RapidMiner, etc. Todos pueden hacer el trabajo, algunos son gratuitos y de código abierto, otros no, pero como Investigadores de Educación generalmente pueden obtener grandes descuentos o incluso copias gratuitas de ediciones comerciales del software. (Enlace de RapidMiner Academia a continuación [1])

Como señaló Muhammad Anees en su respuesta a pesar de que R es más flexible, para la investigación comercial o financiada recomendaría Stata.

¿Por qué los investigadores de la educación y las universidades deberían dejar pasar la oportunidad de obtener estos descuentos de licencia y experiencia con estas herramientas? Además, es bueno considerar las licencias de sitio para la institución, normalmente el departamento de TI solo querría un paquete para cubrir las estadísticas. Aquí hay un buen blog que explica estos. SPSS, SAS, R, Stata, JMP? Elegir un paquete de software estadístico o dos.

Recomendaría a los investigadores que aprendan al menos dos paquetes. Quizás tenga una herramienta comercial como goto para la investigación financiada en una licencia de sitio y luego tenga R como el lenguaje para cualquier flexibilidad adicional y hurgar.

Notas al pie

[1] RapidMiner Academia – RapidMiner

¡Yo diría que sí! R es un lenguaje estadístico muy poderoso. Me gusta usar el ejemplo de encontrar coeficientes de correlación, una de las ecuaciones más aterradoras que he visto desde la clase de Física.

Y esto es tan difícil de programar en un lenguaje como C como lo es mirar ahora. Quiero decir, realmente míralo. Dos sumas, sin la introducción de huellas nos dan O (n ^ 2) <- un tiempo bastante lento si las anidas, no sé por qué lo harías, pero de todos modos ...

En un lenguaje como R, encontrar la correlación entre dos conjuntos de datos es tan fácil como …

x <- mtcars [1: 3]

y <- mtcars [4: 6]

cor (x, y)

Ahora, el lenguaje en sí no es rápido. De hecho, es aproximadamente 100 veces más lento que el de C o Python, pero cuando se trata de estadísticas, es la opción obvia. Hay pocas aplicaciones cuando necesita cosas como correlaciones en tiempo real, pero cuando lo necesita, R probablemente no sea el mejor lugar para buscar.

¡Pero hasta entonces, R recibe un gran aprobado!

Aquí hay un punto adicional a considerar, SAS proporcionará materiales educativos examinados como libros, notas y ejercicios con código y datos de muestra de forma gratuita a los instructores de la universidad.

Programa Académico Global SAS

Esto es muy útil para enseñar y planificar clases.

Haría una recomendación mixta porque yo mismo enseño econometría y estadísticas con Stata y hago mi investigación académica (análisis de datos per se) con Stata. Si tuviera que recomendar R en lugar de Stata, definitivamente habría dicho que sí solo por la utilidad y la disponibilidad gratuita, pero aquellos que también consultan a organizaciones e investigaciones financiadas por el gobierno, les recomiendo Stata.

Respuesta corta SI. Como investigador, utilicé STATA anteriormente, pero después de tomar la programación del curso R, descubrí que es muy flexible y gratuito. No voy a describir los detalles de R debido a que hay muchos sitios web. Si está interesado en R y el análisis de datos, tome el curso en Coursera o en cualquier otro MOOC y tendrá su propia impresión sobre las capacidades de R.

Eso depende. Siempre es una buena idea usar el software que usan sus colegas u otros investigadores en su campo, ya que será más fácil compartir datos y resultados con mayor facilidad. Si te alejas del paquete, eso hace que sea más difícil para ellos examinar tus resultados. Sin embargo, si existe una base de usuarios creíble de usuarios de R en educación, es posible que pueda hacerlo.

More Interesting

¿Qué se necesita para que un antiguo agente de Wall Street consiga un trabajo en ciencia de datos? ¿Es un certificado de aprendizaje automático de Coursera más un proyecto de Kaggle?

¿Los científicos de datos usan programación orientada a objetos?

¿Cómo debe comenzar un principiante con el aprendizaje automático y la ciencia de datos? ¿Qué curso tomar y cómo proceder paso a paso?

¿Qué metodologías populares de aprendizaje automático se usan típicamente con datos que no son iid?

¿Cuál es la mejor especialización de Coursera ML / Big Data?

Cómo calcular la distribución estadística en un gran conjunto de datos

¿Cuál es la diferencia entre estadística computacional y ciencia de datos?

Si cada ciencia usa datos, ¿qué es la ciencia de datos?

¿Cómo es Data Mining and Predictive Analytics, de Chantal d larose?

¿Qué papel deberían jugar los estadísticos en la ciencia de datos?

¿Cuáles son las mejores herramientas de software para trabajar con grandes conjuntos de datos financieros (> 50 gb), por ejemplo, datos de acciones de CRSP?

¿Es manejable tomar el curso de especialización en ciencia de datos de John Hopkins en Coursera sin experiencia en programación?

¿Es bueno aprender que la analítica de datos es más fresca cuando no tengo idea de la analítica de datos?

Como científico de datos, ¿en qué industria trabaja actualmente? ¿Su industria tiene una gran demanda de científicos de datos?

¿Cuál es el caso de uso más importante de la ciencia de datos en telecomunicaciones?