¿Qué tan popular es SPSS entre los científicos de datos?

Ya no soy un gran admirador de SPSS, ya que sus competidores tienen muchas más ventajas. Permítanme señalar algunas ventajas muy importantes de R y Stata sobre SPSS. Estos puntos se han documentado en otros lugares con mucho más detalle, estoy seguro, pero estas son mis principales razones para no gustar de SPSS y favorecer a R y Stata.

1. R vs SPSS.
El entorno R es realmente el mejor paquete para análisis complejos. Gran parte de lo siguiente no se puede hacer con SPSS, o solo con grandes dificultades. Piense en análisis que involucren:

  • Múltiples conjuntos de datos vinculados (por ejemplo, el paquete data.table );
  • Formatos de datos no rectangulares como los requeridos por Social Network Analysis (por ejemplo, los paquetes sna, statnet e igraph )
  • Procesamiento en paralelo (p. Ej., El paquete paralelo , ahora parte del núcleo R).
  • Inferencia bayesiana (por ejemplo, los paquetes R2OpenBUGS o RStan ; concedido, SPSS y sus competidores se están poniendo al día aquí)
  • Estudios que implican visualizaciones extensas y dinámicas.
  • Y muchos más … (Podría seguir por días aquí ;-))

Considere además que R es gratuito, se integra bien con otros lenguajes de programación y funciona a través de plataformas y arquitecturas informáticas sin problemas.

2. Stata vs SPSS.
Mi propia formación académica estaba en SPSS, por lo tanto, siempre había evitado a Stata. Pero hace algunos años tuve que invertir algo de tiempo en aprender Stata: debía enseñar un curso intensivo de posgrado de Stata. Este curso fue paralelo a un curso de SPSS que cubrió temas estadísticos equivalentes. Mi conclusión después de haber dado a este curso dos términos: SPSS supera a Stata en términos de facilidad de uso y preparación para hacer clic y apuntar, pero eso es todo: en todos los demás aspectos relevantes , Stata es superior a SPSS. Para ilustrar esto con algunos ejemplos:

  • Stata tiene un editor de sintaxis simple y un lenguaje de sintaxis uniforme, mientras que SPSS tiene un editor de sintaxis con vida propia y un lenguaje que carece de uniformidad en tipos de análisis similares en un grado que es injustificable.
  • Stata tiene un entorno de análisis macro fácil de usar, mientras que SPSS no. Las tareas sencillas de manejo de datos, como el centrado en grupo, son fáciles con macro / bucles en Stata, pero difíciles en SPSS. Sé que SPSS puede hacer mucho de lo que Stata también puede hacer, pero Stata parece más diseñada para el uso de bucles y macros en tales casos que SPSS. Puedo enseñar fácilmente a los estudiantes cómo hacer estas cosas en Stata; He tenido dificultades para explicar a los estudiantes de SPSS por qué algunas tareas de manejo de datos no eran tan sencillas en su caso.
  • Stata puede hacer pruebas de postestimación. SPSS no puede. El uso de los resultados de análisis previos (p. Ej., Coeficientes de regresión) para la entrada en un análisis de seguimiento es un procedimiento sencillo en Stata, pero esto generalmente no es posible en SPSS. Uno puede probar hipótesis complejas sobre combinaciones (no) lineales de coeficientes de regresión simplemente no es posible en SPSS. Esto, para mí, fue una de las principales razones para cambiar a Stata.
  • Etc …

En pocas palabras: nunca recomendaría SPSS para algo más complejo que una tesis de licenciatura, a menos que hagan un rediseño importante de su producto.

No sé cuánta información adicional aporta esto, pero:

– Mi impresión es que los estudiantes de pregrado e incluso de maestría se capacitan en SPSS primero o exclusivamente, y si estas personas obtienen trabajos haciendo evaluaciones en algún lugar, eso es lo que saben y usarán. Entonces, dependiendo de lo que entiendas por “científicos de datos”, puede ser bastante popular.
– En el nivel de doctorado, te dicen que nadie te toma en serio si estás usando SPSS. (Aparentemente, a algunas revistas no les gusta ver eso, por lo que en realidad puede afectar sus posibilidades de ser publicado).
– SPSS tiene valores predeterminados que son difíciles de cambiar. Para un mayor control, dependiendo del análisis que esté haciendo, es preferible R, Stata y MPLUS.
– Los investigadores de ciencias sociales hardcore no usan SPSS mucho o nada.

SPSS es más popular entre académicos y académicos de investigación para estudios de investigación en el área de ciencias sociales, psicología, finanzas, recursos humanos, etc.

La razón es:

  • Es fácil de aprender y usar.
  • Proporciona más flexibilidad que los complementos de Excel, como megaestado, estadística real, paquete de herramientas de análisis de datos, etc.
  • No es necesario aprender programación.

Para el científico de datos R y Python son mucho más populares. No creo, necesito responder ¿POR QUÉ?

No he oído hablar de nadie que lo use fuera de algunas áreas académicas (psicología, en particular). La mayoría de los científicos e industrias de datos usan R, Python o SAS como herramientas principales. Son más flexibles e incluyen más algoritmos y herramientas de limpieza de datos necesarios en conjuntos de datos reales. También juegan bien con lenguajes y sistemas SQL, que a veces se necesitan en producción.

Si está buscando una alternativa con algún uso en la industria, Weka tiene una interfaz de usuario agradable y una codificación mínima, y ​​es gratuita y utilizada por algunas compañías en estos días.