Como científico de datos, ¿con quién preferirías jugar: Google o Facebook?

Creo que los datos de Facebook son mucho más directos y estructurados, y si tuviera algunas hipótesis, las cosas serían más fáciles de probar. Facebook también puede afirmar que tiene un poco de información sobre una porción mucho mayor de estadounidenses de formas que no son anónimas. Aquí se puede hacer mucho que es una ciencia interesante, significativa y excelente. Pienso en particular en el trabajo reciente realizado por Eytan Bakshy, “Repensando la diversidad de la información en las redes”: https://www.facebook.com/notes/f…
La red social de Facebook es la mejor representación digital que tenemos de las redes sociales reales, por lo que si desea saber algo sobre cómo las personas interactúan entre sí, los datos de Facebook son el lugar indicado. Si le importa más algo como la forma en que el idioma ha cambiado en los últimos 100 años, diría que vaya con Google.

En otra nota, los datos de Google son potencialmente mucho más poderosos pero con muchos más desafíos. Google es la puerta de entrada a Internet de muchas maneras. Para las personas como yo que usan Chrome y Android y tienen varias direcciones de Gmail, Google tiene los datos para saber absolutamente todo sobre mí que vale la pena conocer. Podrían recrear toda mi red social de Facebook (sin mencionar Twitter y LinkedIn) solo a partir de notificaciones por correo electrónico. Mi teléfono solo se apaga en los aviones, por lo que también podrían conocer mis patrones de movimiento físico. Sin embargo, la realidad es que Google no puede (o quizás más precisamente no) extraer datos de esta manera. Sería una violación fenomenal del espíritu que la compañía ha presentado, así que tenga la seguridad.

En conclusión, creo que los datos de Google son más interesantes, pero prefiero jugar con los de Facebook. Los datos de Facebook están más estructurados e imitan mejor la realidad en formas que me parecen interesantes. Además, nadie tendrá acceso no regulado a todos los datos de Google en toda la empresa. Eso no quiere decir que algo tan simple como los datos de búsqueda no sea fantásticamente genial, y el rastreo web de Google tiene una mejor comprensión de la estructura de Internet que nadie, pero aún así tomaría los datos de Facebook.

Esta pregunta sería aún más interesante si los datos de la NSA también fueran una opción.

More Interesting

Cómo aprender a usar Sas, R, Excel y SQL en un año

¿Cuáles son los métodos de ciencia de datos más utilizados en los negocios?

¿Debo aprender las estructuras de datos y la informática real o continuar con las aplicaciones de Oracle?

¿Por qué agregar más como primera columna de datos en el aprendizaje automático?

¿Cómo se puede utilizar Data Science en el sector de las telecomunicaciones?

Recuperación de información: ¿Cuáles son algunas de las API más importantes que todo científico de datos debe conocer?

¿Puede uno convertirse en un exitoso arquitecto de Big Data sin aprender Data Science? ¿Cuál es la diferencia entre el arquitecto de Big Data y el científico de datos?

¿Habilidades para el autoaprendizaje de la ciencia / análisis de datos o las estadísticas de EM?

¿Qué libros se deben comprar para comenzar a aprender Data Science?

Quiero convertirme en un científico de datos, ¿cómo me convierto en un buen estadístico? ¿Cuáles son buenos libros, conferencias, blogs, etc. que mejorarán mi comprensión de los métodos estadísticos a nivel profesional?

¿Por qué mi CNN proporciona una buena precisión en los datos de entrenamiento y prueba (división 80-20 del total de datos de entrenamiento) pero falla miserablemente en los datos de validación (no vistos)?

¿Qué deben saber todos sobre la ciencia de datos?

¿Por qué los científicos usan palabras no rigurosas como "ultra intenso"?

¿Qué tipo de análisis puede hacer para bienes raíces?

¿A qué proyectos de código abierto relacionados con la ciencia de datos podría contribuir como programador novato?