Uso mucho Python y R, y me gustaría comenzar una empresa que ofrezca servicios de análisis de datos. ¿Cómo puedo monetizar big data? ¿Donde debería empezar?

¿Opinión honesta? Creo que primero deberías tener más experiencia en tu haber. ¿Por qué digo eso? Porque estás confundiendo términos aquí. Python y R son lenguajes de programación que se usan para el análisis de datos, pero no son herramientas que se usan para manejar grandes datos directamente. Para ello, necesita un marco informático de clúster distribuido como Hadoop o Spark. Estoy seguro de que sabes esto, y me doy cuenta de que soy pedante, pero no creo que la pregunta se formulara así si tuvieras una gran experiencia en Big Data.

Para iniciar una empresa que ofrezca servicios de análisis, necesita un nombre y un perfil para firmar clientes. Idealmente, debe tener al menos un cliente antes de comenzar.

Alternativamente, podría tener una idea de producto realmente buena y encontrar una compañía basada en eso, pero tenga en cuenta que esto es increíblemente arriesgado.

Una opción práctica es primero conectarse con integradores de sistemas establecidos pero medianos, firmas consultoras, en su área. Algunos pueden usar lanceros libres para aumentar su personal proyecto por proyecto. Simplemente cree una LLC para poder facturar, obtener protección de responsabilidad, etc. (legalzoom lo haría).

Eso lo ayudará a conocer a clientes reales, problemas reales y negocios reales. Si lo hace bien, un cliente puede preguntar por usted la próxima vez, alguien puede contactarlo directamente, etc.

Aprenderá el idioma de sus futuros clientes (pista: no es “monetizar grandes datos”), aprenderá los problemas que tienen, cómo funcionan, cómo puede ir de compras … todos los detalles desagradables de un negocio real que lo hacen Importa mucho. Y si descubres que la vida emprendedora no es para ti, tendrás suficientes contactos en LinkedIn y proyectos en tu currículum para conseguir un trabajo.

Además de Python & R, aprenda un análisis específico de la industria o un nicho de proceso de datos. Lo que quiero decir con eso es aprender qué herramientas y fuentes de datos se usan en una industria o sector específico y construir cosas específicamente en su contra.

Mi experiencia, por ejemplo, los datos de salud y financieros se ven muy diferentes, se almacenan en diferentes formatos y necesitan un tipo diferente de análisis, tuberías, procesos previos y posteriores.

La mayoría de los datos médicos son formatos de texto o documentos no estructurados. Muchos EMR no tienen API adecuadas, por lo que terminas construyendo tus propias integraciones desde cero solo para obtener los datos.

Los datos financieros son principalmente series temporales de algún tipo. Las API tienden a existir y están bien documentadas. Lamentablemente, a menudo formato XML. Especialmente con los datos del mercado financiero, encuentra que sus datos financieros no se distribuyen normalmente. Esto tiene un efecto secundario desagradable que muchas estadísticas previas a la construcción, las bibliotecas de matemáticas simplemente no funcionan. Debe volver al tablero de dibujo no en el nivel de código sino en el nivel matemático fundamental.

Estas son las 2 industrias en las que sé cómo aplicar herramientas de big data y aprendizaje automático. Seguramente también hay oportunidades dentro de internet de cosas, logística / envío, riesgo, genética / ADN / ARN, seguridad de TI, Geociencias, lo que sea …

Pero lo principal es construir algo con la aplicación directa de la industria, no solo algo que use las bibliotecas Python / R más nuevas y populares. Qué industria debes elegir. Lo que ames / conozcas. Hay oportunidades en todos ellos.

Asumiré que esta no es una pregunta troll, pero si usa Python y R mucho, ya debería saber la respuesta.

Puede monetizar los datos al encontrar información por la cual el cliente está dispuesto a pagar. Si crea suficientes scripts de automatización y los combina como un software de servicio, puede monetizar utilizando un modelo de suscripción.

Deberías comenzar por encontrar tu primer cliente.

¿Utiliza actualmente Python y R para analizar problemas comerciales del mundo real para una industria en particular?

Si la respuesta es no, entonces debes ir y obtener algo de experiencia haciendo eso, ser contratado, pasante o trabajar gratis para obtener experiencia bajo tu cinturón.

Si la respuesta es afirmativa, simplemente enfóquese en la industria en la que está trabajando actualmente. Vaya más cerca, concéntrese en este nicho y descubra quién en su industria está dispuesto a pagarle por el análisis de datos.

Desafortunadamente, los únicos servicios que he entregado con éxito son el de presidencia o el de presidencia. Me encantaría un método más simplificado para el descubrimiento y la visualización de datos.