Creo que los datos de Facebook son mucho más directos y estructurados, y si tuviera algunas hipótesis, las cosas serían más fáciles de probar. Facebook también puede afirmar que tiene un poco de información sobre una porción mucho mayor de estadounidenses de formas que no son anónimas. Aquí se puede hacer mucho que es una ciencia interesante, significativa y excelente. Pienso en particular en el trabajo reciente realizado por Eytan Bakshy, “Repensando la diversidad de la información en las redes”: https://www.facebook.com/notes/f…
La red social de Facebook es la mejor representación digital que tenemos de las redes sociales reales, por lo que si desea saber algo sobre cómo las personas interactúan entre sí, los datos de Facebook son el lugar indicado. Si le importa más algo como la forma en que el idioma ha cambiado en los últimos 100 años, diría que vaya con Google.
En otra nota, los datos de Google son potencialmente mucho más poderosos pero con muchos más desafíos. Google es la puerta de entrada a Internet de muchas maneras. Para las personas como yo que usan Chrome y Android y tienen varias direcciones de Gmail, Google tiene los datos para saber absolutamente todo sobre mí que vale la pena conocer. Podrían recrear toda mi red social de Facebook (sin mencionar Twitter y LinkedIn) solo a partir de notificaciones por correo electrónico. Mi teléfono solo se apaga en los aviones, por lo que también podrían conocer mis patrones de movimiento físico. Sin embargo, la realidad es que Google no puede (o quizás más precisamente no) extraer datos de esta manera. Sería una violación fenomenal del espíritu que la compañía ha presentado, así que tenga la seguridad.
En conclusión, creo que los datos de Google son más interesantes, pero prefiero jugar con los de Facebook. Los datos de Facebook están más estructurados e imitan mejor la realidad en formas que me parecen interesantes. Además, nadie tendrá acceso no regulado a todos los datos de Google en toda la empresa. Eso no quiere decir que algo tan simple como los datos de búsqueda no sea fantásticamente genial, y el rastreo web de Google tiene una mejor comprensión de la estructura de Internet que nadie, pero aún así tomaría los datos de Facebook.
- Aprendizaje profundo: ¿Cuándo aplicamos la eliminación de ruido en el codificador automático de eliminación de ruido?
- Actualmente hay cuatro idiomas para escribir aplicaciones de Big Data: Scala, R, Python y Java. ¿Cuál usar para las aplicaciones de Big Data?
- ¿Cómo obtengo un trabajo de análisis orientado a datos en LinkedIn u otra empresa enfocada en análisis sin muchos antecedentes en matemáticas, estadísticas o disputas de datos?
- ¿Cómo mejorar mis habilidades de depuración en el aprendizaje automático? A menudo me resulta difícil entender por qué un modelo se comporta de cierta manera. ¿Cómo depuran rápidamente los grandes científicos de datos?
- Cómo acceder a los valores de estas variables MATLAB en base a una matriz que almacena los índices de las columnas requeridas
Esta pregunta sería aún más interesante si los datos de la NSA también fueran una opción.