¿Cuáles son algunos de los análisis de datos más interesantes que se hayan hecho?

Había leído sobre esto hace mucho tiempo: puede ser que los encuentres interesantes.

1. El análisis personal de mi vida por Stephen Wolfram
Este es un gran esfuerzo de nada menos que el fundador y CEO de Worlfram Research Stephen Wolfram.
Cuán grande dices, ha archivado todos los correos electrónicos (salientes y entrantes), reuniones y eventos (calendario), cada pulsación de tecla, llamadas desde 1989. Eso es 23 años de su vida. Excepto esto, una trama de archivos modificados desde 1980 (32 años) y pocos años de análisis de actividad física. Puede ver algunas tendencias de la vida a través de estos análisis.

2. Cómo un genio de las matemáticas hackeó OkCupid para encontrar el amor verdadero | CABLEADO
Sí, un clic de un título es sobre el matemático Chris McKinlay.
Lo crucial es que McKinlay escribe un código en Python, lo entrena para emular la velocidad de uso y escritura humana para eliminar datos de OkCupid. Pasa esos datos a través del algoritmo de modo K para colocarlos en siete grupos y tomó dos grupos que le gustaron. Nuevamente extrae dos grupos y escribe las respuestas honestas (¡sí! Después de todo eso) basándose en los datos con un poco de ayuda del algoritmo de refuerzo adaptativo.

3. Hackear el sistema educativo de la India por Debarghya Das on On the Stepping Stone
Un estudiante de Cornell mina / piratea el sitio web de ICSE, y encuentra algunos resultados interesantes como cambios en los números.

4. Una charla ted: el nacimiento de una palabra

Aquí hay un análisis de datos realmente fundamental sobre las estrellas. Cuando aparecieron los diagramas de Hertzsprung-Russell por primera vez, se encontró información realmente interesante y demostró mucho sobre el ciclo de vida de las estrellas.
En un eje, trace el brillo absoluto de una estrella, o su luminosidad total (cuánta luz está emitiendo). En el otro eje, trace su temperatura o la longitud de onda de su pico de emisión de luz (su color). El resultado es extremadamente interesante;

La vasta, vasta, gran mayoría de las estrellas está en esta “secuencia principal”: las estrellas son simplemente las máquinas que destruyen el hidrógeno que son. Cuando comienzan a quedarse sin hidrógeno, también comienzan a romper helio, y cuando eso sucede se vuelven más brillantes, pero la superficie se enfría (porque se inflan).

El gráfico muestra la clasificación de 2 variables, es decir, no se puede clasificar una estrella solo en una variable medible, pero es bastante fácil hacerlo con dos variables.

Imágenes afortunadas:

– Toma una cámara de alta velocidad y la apunta (con un telescopio) hacia el cielo.
– Sus imágenes ahora serán perturbadas por la atmósfera en la tierra, lo que resultará en una resolución peor que la óptima.
– Con el análisis de imágenes, usted caracteriza la perturbación de la atmósfera y selecciona solo el 10% de sus exposiciones cortas a la cámara, donde tiene “suerte” y la perturbación de la atmósfera es pequeña.
– Beneficio: ¡Agregue todas las buenas exposiciones juntas para obtener una imagen súper nítida!

¡Bien, señor, acaba de aumentar la resolución de la imagen y puede ver aún más detalles en objetos a al menos 3 millones de kilómetros de distancia!

La búsqueda de Jim Gray: una descripción técnica proporciona información sobre la desafortunada desaparición de Jim Gray y cuántas personas han intentado analizar los datos de Geo para encontrarlo.

More Interesting

¿Cómo manejan las empresas el análisis cooperativo de datos que preserva la privacidad? ¿Hay algunos casos reales?

¿Qué libros se enseñan en los cursos de posgrado de aprendizaje automático?

¿Qué campo es mejor (para el crecimiento profesional en TI y seguridad laboral en los próximos cinco años), RPA (Robotics Process Automation) o Data Science?

Para el análisis de datos, ¿cuál es mejor, SAS o Hadoop? Soy ingenuo en la programación pero estoy pensando en darle una oportunidad.

¿Cuáles son los pros y los contras de usar Kaggle Scripts?

¿Vale la pena hacer un curso de PGP en ciencia de datos de la escuela de negocios Aegis?

Cómo aprender a recuperar, insertar, buscar datos en Big Data

¿Cuál es la diferencia entre los datos generados por la actividad y los generados por la máquina en la terminología de Big Data?

Cómo adelantarme a mi competencia con la ayuda de Big Data

¿Por qué no se puede usar R para escribir código de grado de producción? ¿Por qué Python no se usa también para la creación de prototipos?

Cómo usar datos de MongoDB para el análisis de datos

¿El comercio de alta frecuencia y la ciencia de datos comparten muchas similitudes?

¿Cuáles son las compañías en India que trabajan en el dominio de las ciencias de datos aparte de Mu Sigma?

¿Qué aspectos del aprendizaje automático teórico y aplicado requieren una formación formal en qué subdisciplinas de las matemáticas y / o estadísticas?

¿Qué núcleos recomienda para aprender la ciencia de datos de Python?