Teniendo en cuenta la cantidad de datos que genera un sitio Web2.0 todos los días y su valor en el escenario actual, ¿cree que el aprendizaje automático debería ser el núcleo de la tecnología de cualquier producto? Si es así, ¿qué arquitectura recomendaría en este tipo de casos?

Si bien menciona correctamente la importancia que el aprendizaje automático, la minería de datos y las tecnologías relacionadas ocupan en la web de hoy, es importante tener en cuenta que estas tecnologías a menudo son el medio hacia un fin y no el fin en sí mismas. Por ejemplo, las recomendaciones de Amazon son un medio hacia su objetivo final de ayudar a los usuarios a navegar a través de productos de varias categorías, rangos de precios y casos de uso basados ​​en el perfil de los usuarios, su historial de compras anterior, etc. El punto más importante es que las tecnologías de ML a menudo no ocupar el centro del escenario.

Incluso tome el ejemplo de Google. Su modelo de motor de búsqueda es digno de elogio y es un sistema experto de Machine Learning, pero como empresa dedican mucho esfuerzo a configurar y mantener la infraestructura para permitir a los usuarios consultar ese sistema ML.

Por lo tanto, para responder a su consulta, como arquitecto o diseñador de un producto o sistema que emplea un componente de Aprendizaje automático, es tan importante que se concentre en cuestiones como la escalabilidad y la solidez, así como en los relacionados con el aprendizaje automático. En la mayoría de los casos, debe preocuparse más por las bases de datos paralelas, la respuesta en tiempo real, etc. para implementar un producto o aplicación web exitosa.

Suponiendo que está definiendo “producto” como el sitio web / características, le sugiero que si desea mantener a su audiencia, es mejor que se asegure de que su contenido y recomendaciones estén orientados al usuario y sean de actualidad. Algo de eso es solo una buena prueba y una constante experimentación, pero técnicas de ML como la colaboración y el filtrado de contenido.