¿Vale la pena desarrollar un algoritmo de minería de datos más rápido que otros de código abierto y comerciales existentes? Si vale lo suficiente, ¿qué valor tiene ser el algoritmo más rápido?

Tu pregunta es bastante abierta. Pero esto debería darte algunas ideas.

Un día, un comerciante de acciones estaba harto del hecho de que cuando planeaba comprar 1000 acciones disponibles, solo tenía unas pocas, y esto sucedía una y otra vez. Para resumir, compró mejores cables para sus servidores, los acercó a la conexión a Internet, luego acercó los servidores a la bolsa de valores, todos los servidores conectados con cables de fibra óptica. Ahora podía comprar partes más grandes de esas 1000 acciones porque era 1–2 ms más rápido, y a medida que ganaba más y más ms, hizo compras más grandes e hizo millones más de lo que obtendría antes de comenzar a mejorar su infraestructura.

Afeitar lo que parece ser una velocidad mínima puede ser crucial, podría significar la vida o la muerte o millones de dólares ganados o perdidos.

Por supuesto, debes ser inteligente al respecto. Para operaciones normales, esto no hace mucha diferencia a ms aquí o allá. Entonces, para una tienda web o alguna otra herramienta, puede ser bueno. He visto fallar muchos proyectos debido a la optimización prematura. La gente simplemente se deja de lado con los puntos de referencia, sigue fijándolos, luego hace puntos de referencia más difíciles y, finalmente, puede servir a millones, sin embargo, su tráfico y sus objetivos comerciales son solo unos pocos cientos.

Ves que esto cuesta dinero, así que asegúrate de que valga la pena. Si planea ser un comerciante de alta frecuencia, haga un análisis de ADN para salvar vidas o atrapar delincuentes, vale la pena, para las operaciones normales del día a día, puede que no sea el mejor uso del tiempo para usted.

More Interesting

En el aprendizaje automático, ¿cómo estima el descenso de gradiente la pendiente de la función de pérdida en un punto dado?

¿Cuáles son los principales enfoques de la inteligencia artificial?

Además de TensorFlow, ¿qué otras bibliotecas de reconocimiento de imágenes son fáciles de usar y mejores?

¿Cuáles son las mejores herramientas de última generación para la extracción de información en Python?

¿Cuáles son algunos usos prácticos o aplicaciones del conjunto de datos de YouTube 8M?

Para un maestro en aprendizaje automático, ¿cuál sería una mejor opción, KTH (MS en aprendizaje automático) o Chalmers (MS en sistemas adaptativos complejos)?

¿Qué debo aprender primero de aprendizaje automático o redes neuronales?

¿Vale la pena adquirir un conocimiento profundo tanto del aprendizaje automático como de la biología? ¿Debo concentrarme?

¿Qué es AdaBoost?

¿Qué debe saber todo programador competitivo (Topcoder) sobre los concursos de Kaggle y ML?

Hipotéticamente, ¿sería posible cultivar tejido cerebral usando células madre y luego usarlo como un procesador distribuido para tareas de aprendizaje complejas?

¿El aprendizaje por refuerzo con redes neuronales profundas implica descenso de gradiente y propagación hacia atrás?

¿Qué tan útil es la regresión del proceso gaussiano? ¿Tienes un buen ejemplo?

¿Hay alguna manera de determinar o reducir las opciones con las que uno debería experimentar para mejorar (por ejemplo) una red neuronal clasificadora de imágenes binarias?

¿Cómo soluciona un bosque aleatorio los problemas de regresión (no normalidad, heterocedasticidad, multicolinealidad, valores atípicos, valores faltantes y variables categóricas)?