Cómo dominar el aprendizaje automático en R

Comencé a programar en R después de hacer algunos cursos en línea sobre Learn R, Python & Data Science Online | DataCamp. Los cursos básicos eran gratuitos. La cosa con R es que tiene estructuras de datos muy diferentes, por ejemplo, vectores, marcos de datos. También tiene tipos de datos diferentes de los que encontraría en lenguajes de programación regulares como Java y Python.

p.ej. tipo de datos de número complejo, tipo de datos de fecha, etc.

Entonces, antes de sumergirse en la parte de aprendizaje automático, familiarícese con el entorno R y RStudio.

Después de eso, puede elegir algunos conjuntos de datos de buena variedad del Depósito de aprendizaje automático de UCI y comenzar a practicar algunos algoritmos de aprendizaje automático que conoce, en estas muestras. (Kaggle) Your Home for Data Science también es una excelente fuente para aprender.

Gracias por A2A.

No tengo mucha experiencia en la implementación de R del aprendizaje automático. Es bueno si conoce R y puede encontrar algunos recursos en línea para aprender algoritmos de aprendizaje automático. Para dominar el aprendizaje automático necesita algoritmos, por supuesto, después de aprender esos algoritmos, puede implementarlos en cualquier idioma. Menciono algunos enlaces a continuación que lo ayudarán a comprender el aprendizaje automático básico en R.

  1. Machine Learning en R para principiantes
  2. Tutorial de Kaggle R sobre aprendizaje automático
  3. Aprendizaje automático – Universidad de Stanford | Coursera aunque no en R pero sigue siendo uno de los mejores cursos para principiantes
  4. Introducción al curso de aprendizaje automático | Udacity
  5. Aprendizaje automático práctico – Universidad Johns Hopkins | Coursera
  6. R
  7. Los 20 mejores paquetes de R Machine Learning y Data Science

Mahchine Learning se puede clasificar en tres partes:

  • Aprendizaje supervisado
  • Aprendizaje sin supervisión
  • Aprendizaje reforzado
  1. Aprendizaje supervisado:
    Este algoritmo consiste en una variable objetivo / resultado (o variable dependiente) que debe predecirse a partir de un conjunto dado de predictores (variables independientes). Usando este conjunto de variables, generamos una función que asigna entradas a las salidas deseadas. El proceso de capacitación continúa hasta que el modelo alcanza el nivel deseado de precisión en los datos de capacitación. Ejemplos de aprendizaje supervisado: regresión, árbol de decisión, bosque aleatorio, KNN, regresión logística, etc.
  2. Aprendizaje sin supervisión:
    En este algoritmo, no tenemos ninguna variable objetivo o de resultado para predecir / estimar. Se utiliza para agrupar a la población en diferentes grupos, lo que se usa ampliamente para segmentar clientes en diferentes grupos para una intervención específica. Ejemplos de aprendizaje no supervisado: algoritmo Apriori, K-means.
  3. Aprendizaje reforzado:
    Usando este algoritmo, la máquina está entrenada para tomar decisiones específicas. Funciona de esta manera: la máquina está expuesta a un entorno en el que se entrena continuamente utilizando prueba y error. Esta máquina aprende de la experiencia pasada e intenta capturar el mejor conocimiento posible para tomar decisiones comerciales precisas. Ejemplo de aprendizaje por refuerzo: proceso de decisión de Markov

Aquí está la lista de algoritmos de aprendizaje automático de uso común. Estos algoritmos se pueden aplicar a casi cualquier problema de datos:

  1. Regresión lineal
  2. Regresión logística
  3. Árbol de decisión
  4. SVM
  5. Bayes ingenuos
  6. KNN
  7. K-medias
  8. Bosque al azar
  9. Algoritmos de reducción de dimensionalidad
  10. Algoritmos de aumento de gradiente GBMXGBoostLightGBMCatBoost

Para más referencia:

También estoy aprendiendo R. Se dice que R es una muy buena habilidad para que los científicos de datos y los analistas tengan en su conjunto de habilidades.

La diferencia entre R y python es el objetivo final. Python es genérico, mientras que R es un lenguaje de script específico creado para la computación estadística.

Para una introducción al idioma, hay MOOCS a su propio ritmo en Edx-

1) Programación con R para Data Science (Microsoft)

2) Estadísticas y R (Harvard)

Este es el libro que estoy siguiendo- Learning R – Richard cotton (serie O’Reilly)

Pero hay cursos en Datacamp que pueden encaminarlo .

R es un dialecto de programación libre y una condición de programación para procesamiento y diseño medibles. El dialecto R generalmente se utiliza entre analistas y excavadores de información para crear programación objetiva y examen de información. R es un uso del lenguaje de programación S unido a una semántica de lectura léxica animada por Scheme. S fue realizado por John Chambers en los Laboratorios Bell. Hay algunos contrastes esenciales, sin embargo, una gran parte del código compuesto para S se ejecuta sin modificaciones. R fue realizada por Ross Ihaka y Robert Gentleman en la Universidad de Auckland, Nueva Zelanda, y actualmente es creada por el Equipo de Desarrollo de R, del cual Chambers forma parte. R lleva el nombre de los nombres principales de los dos primeros creadores de entrenamiento de programación de R e incompletamente como una obra de teatro sobre el nombre de S. La empresa fue considerada en 1992, con una forma subyacente dada de alta en 1994 y una forma beta constante en 2000.

Hola amigos, soy Abhijit, un entusiasta de la ciencia de datos y el aprendizaje automático.

Estoy trabajando en una idea, realmente me encanta compartir mi conocimiento, para ayudar a que florezca el nuevo. Por profesión, soy analista de datos.

También tengo un canal de YouTube: ” ANALYTICS MANTRA “, dedicado a todos los aprendizajes y tutoriales sobre ciencia de datos. Por favor, vaya al canal.

Aquí hay un enlace a mis recursos de tutoriales de programación de R.

Además, explore los videos en Python, Advance Excel. Estamos trabajando a un ritmo muy alto para hacer Analytics Mantra, el mejor canal de Youtube para el conocimiento de programación.

Si te gustan los videos, no olvides SUSCRIBIRTE

Recomendaría este libro si está comenzando con ML en R. Awesome book.

Aprendizaje automático de dominio con R escrito por Jason Brownlee

More Interesting

¿Cuáles son las ventajas de ser un científico de datos?

¿Dónde puedo obtener la certificación de Data Science?

¿Cómo hacen las estadísticas clases e intervalos de clase cuando los datos están en decimales?

¿Deberían los investigadores de educación adaptar R y alejarse del software estadístico minorista (SAS, Stata, SPSS)?

Si elimino un archivo, lo sobrescribo con otro archivo en la misma carpeta y destruyo el nuevo archivo, ¿puedo recuperar el archivo original que estaba inicialmente en la carpeta?

¿El aprendizaje automático es más una tarea de ingeniería o un trabajo científico? ¿Y qué piensas de su futura carrera y demanda de toda la industria?

Cómo elegir un modelo ML cuando el objetivo es tanto una predicción razonable como una inferencia

¿Siempre estamos mejor con más datos en Machine Learning en la práctica?

¿Por qué la clasificación funciona mejor para predecir conjuntos de datos con categorías nominales o binarias que los conjuntos de datos con categorías ordinales (como las clases de ingresos)?

¿Puedo ingresar al análisis de datos sin conocimiento de TI?

Cómo comenzar a analizar datos usando R

Si tuviera que configurar un programa de aprendizaje de ciencias de datos de 3 meses para principiantes, ¿cuál sería el mejor programa y la línea de tiempo?

Cómo pasar mi carrera de consultor MDM al análisis de datos

¿Cuáles son algunos de los desafíos que enfrentan las personas cuando pasan de la academia a la ciencia de datos?

¿Cuáles son las tendencias en análisis de big data?