¿Qué conceptos puedo aprender sobre ciencia de datos en 15-20 minutos?

Bueno, con 15 minutos no vamos a hablar de pensamientos técnicos profundos o incluso de sintaxis CS en absoluto; Así que mencionaré un consejo de visualización rápida ya que a menudo tenemos que mostrar nuestros datos a las personas:

Personalice todos sus trazados en el entorno en el que los va a mostrar. Las opciones de trazado predeterminadas en casi todos los paquetes de visualización son MUY MALAS.

Un gran infractor es Excel, las líneas de la cuadrícula son muy ruidosas y terminan abruptamente sin un borde de gráfico, y las fuentes del eje son demasiado pequeñas. Otros delincuentes incluyen MATLAB, R y matplotlib. Estas son todas herramientas hermosas una vez configuradas correctamente, y pueden hacer gráficos de primer nivel, es una pena que los valores predeterminados sean tan malos.

Debería poder leer las fuentes en cualquier gráfico que vaya a mostrar desde la fila de atrás de cualquier habitación en la que se presente.

Aprender cosas nuevasAprendizaje automáticoCiencia de datosMinería de datos

¿Hay alguna manera de comprimir una gran cantidad de datos a un tamaño muy pequeño como en una bomba zip?

Como más fresco, ¿debería aprender Hadoop o Spark? ¿Cuál es la hoja de ruta para el análisis de Big Data?

Entre la codificación y la minería de datos, ¿qué es un buen trabajo?

Cómo convertirse en un científico de datos en 4-5 meses si no tengo experiencia previa con ningún lenguaje de programación

Cómo obtener una lista de todos los bootcamps de ciencia de datos que se ejecutan en los EE. UU.

¿Qué es una característica de YouTube menos conocida?

El algoritmo de vecinos K más cercanos: ha etiquetado los datos de entrenamiento (muestras que comprenden “características” que pertenecen a una determinada clase). Desea predecir la etiqueta de una nueva muestra sin etiquetar. Usted elige una medida de distancia entre muestras (para características numéricas, esta podría ser la distancia euclidiana, es decir, la raíz cuadrada de la suma de las diferencias al cuadrado entre las características). Luego elige las K muestras en el conjunto de entrenamiento con la distancia más pequeña a su muestra sin etiquetar y le asigna la etiqueta más común entre las K muestras de entrenamiento más cercanas. Acaba de usar K vecinos más cercanos para clasificar una nueva muestra, y el algoritmo seguramente tomó menos de 15 minutos para aprender.

Kevin Sprong

More Interesting

¿Cuál es el equivalente R de los ** kwargs de Python?

¿Dónde puedo obtener un conjunto de datos para hacer predicciones de incendios forestales?

¿Cómo exactamente Andy Hildebrand transformó su experiencia en datos sísmicos en autoajuste?

¿Cuál es la diferencia entre la investigación de mercado y la ciencia de datos, y cómo se pueden integrar juntos?

¿Cuál es la diferencia entre un científico de datos y un ingeniero de aprendizaje automático?

¿Dónde puedo aprender R para ciencia de datos gratis?

¿Existe algún programa de capacitación de big data en línea?

¿Qué tan bueno es el programa de análisis e inteligencia de negocios en IIM Bangalore? ¿Se considera el mejor en la India? ¿Cuáles son las buenas universidades de ciencia de datos en la India?

¿Cuál es el mejor instituto para la formación en ciencia de datos en Jaipur?

Cómo aprender análisis de big data fácilmente desde un entorno que no sea de TI