Cómo crear un algoritmo de clasificación eficiente y preciso tan rápido como pueda

Bueno, aquí hay uno que es muy simple:

def predecir (y):
si (y> = 0):
volver 1
volver 0

¡Solo 4 líneas y clasificará correctamente cualquier ejemplo, sin ningún entrenamiento! ¿Qué tan asombroso es eso?

Por supuesto, si el clasificador que desea no es la función de signo anterior, es posible que desee utilizar un perceptrón. Puedes escribir uno de esos en menos de un minuto. Son bastante utiles.

Oh, si quieres algo más que un clasificador lineal que no sea bueno para lidiar con el ruido, necesitarás algo más complejo. Tal vez una lista de decisiones? ¿Árbol de decisión? SVM? Ingenuo Bayes?

De hecho, déjame ser directo: no quieres ser rápido en la creación del algoritmo. Debe tomarse el tiempo suficiente para resolver el problema y descubrir qué suposiciones puede hacer. Asegúrese de comprender todas las clases importantes de algoritmos de Machine Learning que existen (no solo Deep Learning), y comprenda el poder y las limitaciones de cada uno.

Cuando haya descubierto qué conjunto de enfoques es probable que funcione, pruébelos todos en un pequeño conjunto de datos muestreado de sus datos para ver si hay alguno que claramente no será adecuado. Para los demás, utilice la validación cruzada para encontrar los mejores parámetros y compare.

Luego, ejecútelo en todo el conjunto de datos y tendrá su modelo.

Pero bueno, si realmente quieres algo rápido , te recomiendo un perceptrón. Son bastante ingeniosos, incluso si son un poco viejos.

More Interesting

¿Qué es la perplejidad en el análisis bayesiano?

En vista de los nuevos temas de TI (AI, IoT, datos grandes / rápidos, análisis, blockchain, etc.), ¿hay alguna ventaja en aprender la programación de Python?

¿Cuáles son algunos avances interesantes sobre las matemáticas del aprendizaje profundo?

¿Cuál es la diferencia entre la retropropagación y la retropropagación a través del tiempo?

Cómo combinar un clasificador basado en características con un modelo de serie temporal como ARIMA

¿Qué debe saber un profesional de aprendizaje profundo para un hackathon?

¿Por qué la optimización convexa es tan importante en el aprendizaje automático?

¿Amazon Web es una buena alternativa para que yo use redes neuronales si mi computadora no tiene suficiente energía?

¿Cómo afectarán herramientas como BigML y Google Prediction API al aprendizaje automático? ¿Reducirá la demanda de científicos de datos?

¿Qué arquitectura / herramientas usan los gigantes tecnológicos como Facebook / Amazon / Apple / Microsoft para el análisis de big data / ML?

¿Podemos aplicar el filtrado colaborativo en la recomendación de noticias de última hora en línea?

¿Debo hacer un gran proyecto de investigación de aprendizaje profundo con mi propio dinero (y tiempo), sin que me paguen, solo para que alguien pueda contratarme debido al trabajo?

No tengo dinero para comprar una computadora poderosa, ¿cómo puedo aprender en la GPU?

¿Cuál es la explicación de la causa de la explosión y desaparición del gradiente de red neuronal recurrente RNN?

¿Cuál es la diferencia entre TF-IDF-CF y CF-IDF?