¿Cuáles son algunos buenos proyectos de ciencia de datos?

Amigos

Mucha gente me ha hecho esta pregunta, así que pensé en compartir mis 2 centavos en esto.

Aquí están mis 10 proyectos de ciencia de datos del mundo real de Kaggle con grandes conjuntos de datos que imitan la aplicación de proyectos de ciencia de datos en el mundo real.

Mi humilde consejo es que debe aprovechar las soluciones existentes, pero tratar de resolver por su cuenta. Finalmente, deberías intentar subir al ring tú mismo y subir tu solución.

¡Feliz aprendizaje!

  1. Análisis de la cesta de la compra de Instacart (¿Qué compraré después? 3 millones de órdenes de Instacart, de fuente abierta)
  2. Amazon Reviews for Sentiment Analysis (Seamos sentimentales. Pocos millones de filas de texto de reseñas de clientes de Amazon y calificaciones de estrellas)
  3. Liga Premier India | Kaggle (¿Love Cricket? Este es el conjunto de datos para usted. Este conjunto de datos tiene datos de IPL de todas las temporadas y todos los partidos. ¿Puede predecir el ganador para la próxima temporada?)
  4. Reclutamiento de Walmart – Pronóstico de ventas en la tienda (Hmm … ¿crees que puedes pronosticar? Los datos de 45 tiendas en los EE. UU., También se basan en la estacionalidad y los eventos clave, así que prepárate para altibajos).
  5. Tendencias en videos y comentarios de videos de YouTube (¿Qué tal un buen análisis de datos exploratorios (EDA) y generación de ideas? ¿Puedes identificar los atributos que hacen que un video sea popular? 200 videos de tendencias de EE. UU. Y el Reino Unido)
  6. Detección de fraude con tarjeta de crédito (Juguemos fraudes. Datos de una tarjeta de crédito europea. ¿Puede hacer frente a la baja tasa de incidencia del 0,17%?)
  7. Cambio climático: datos de temperatura de la superficie terrestre (¿Es real el calentamiento global? Datos de temperatura global desde el año 1750 en adelante. ¿Cuál será una buena manera de segmentar estadísticamente estos datos?)
  8. https://www.kaggle.com/hhs/healt… (El análisis de atención médica está en auge. Datos del Departamento de Salud de EE. UU. sobre empresas individuales y pequeñas. ¿Qué impulsa la tarifa del plan? ¿Quién gana más dinero?)
  9. Base de datos de autos usados ​​| Kaggle (370,000 datos de autos usados ​​raspados de Alemania Ebay. Seamos simples: construya un modelo de regresión lineal)
  10. Analítica de Recursos Humanos | Kaggle (¿Por qué los empleados se van? Tenga en cuenta que se trata de datos simulados y de tamaño no muy grande)

Espero que esto ayude.

¡Salud!

Gracias por sus votos a favor de antemano. Me mantienen en marcha! ¡¡Gracias!!

Actualizado el 29 de marzo, 18

Con la gran demanda de científicos de datos en la actualidad, es imperativo decir que alguien que quiera entrar en el campo de la ciencia de datos comenzando por ser un novato requiere tener una gran cantidad de proyectos realizados y completados en su haber.

La mejor manera de hacer más proyectos en el campo de la ciencia de datos son:

  • Kaggle: Kaggle alberga varias competiciones en el campo de la ciencia de datos, participar en él no solo te mejora como científico de datos, sino que también te demuestra en una etapa global. Kaggle es un gran lugar para practicar, obtener conjuntos de datos y nuevas ideas incluso para iniciar su propio proyecto en Data Science.
  • Descarga de conjuntos de datos de fuente abierta : los conjuntos de datos de fuente abierta están disponibles en varias fuentes que puede utilizar para su propio proyecto de ciencia de datos. Incluso puede correlacionar y comparar sus modelos con otros desarrolladores que han trabajado con el mismo modelo, lo que aumenta la ventaja competitiva.
  • Proyectos basados ​​en cursos de MOOC: muchos cursos, incluidos los nanogrados de Udacity, incluyen proyectos que incluso ofrecen flexibilidad para probar sus propias ideas basadas en el alcance de ese proyecto.

Algunos recursos para obtener conjuntos de datos son:

  • Mundo de datos
  • Kaggle
  • Conjuntos de datos
  • Depósito de aprendizaje automático de UCL
  • Data.gov
  • Impresionantes conjuntos de datos públicos – GitHub

Hay una estructura jerárquica que se debe seguir al emprender proyectos en Data Science:

Nivel principiante:

Comience con algunos proyectos de nivel principiante para familiarizarse con conjuntos de datos básicos y proyectos.

  • Conjunto de datos de iris
  • Conjunto de datos titánicos
  • Conjunto de datos de predicción de préstamos

Nivel intermedio:

Ahora puede pasar al siguiente nivel y ser práctico en los siguientes conjuntos de datos.

  • Reconocimiento de actividad humana
  • Conjunto de datos del viernes negro
  • Conjunto de datos de minería de texto

Nivel avanzado:

Felicitaciones por llegar tan lejos, ahora para llevarlo al nivel avanzado, pruebe sus habilidades en lo siguiente:

  • Identifique su conjunto de datos de dígitos
  • Conjunto de datos de Yelp
  • Conjunto de datos netos de imagen
  • Conjunto de datos de KDD 1999

Algunos otros proyectos de Data Science a nivel principiante:

  • Conjunto de datos de predicción de préstamos
  • El dominio de seguros tiene el mayor uso de métodos de análisis y ciencia de datos. Este es un problema de clasificación. Los datos tienen 615 filas y 13 columnas.
  • Problema: prediga si un préstamo será aprobado o no.
  • Fuente: Obtener datos
  • Conjunto de datos de ventas de Bigmart
    • El comercio minorista es otra industria que utiliza ampliamente análisis para optimizar los procesos comerciales.
    • Problema: Predecir las ventas.
    • Fuente: Obtener datos
  • Conjunto de datos de vivienda de Boston
    • El conjunto de datos proviene de la industria de bienes raíces en Boston (EE. UU.). Este es un problema de regresión. Los datos tienen 506 filas y 14 columnas.
    • Problema: Predecir el valor medio de las viviendas ocupadas por sus propietarios.
    • Fuente: Obtener datos

    ¿Cómo aprender ciencia de datos?

    Únase al curso de ciencia de datos utilizando Python, SAS y Excel de Digital Vidya. ¡No son solo horas de teoría! Como parte del curso, los alumnos deben emprender el proyecto Capstone, que es la tarea culminante que les permitirá tener una experiencia integrada del programa.

    Leer más: ¿Cuáles son algunos buenos recursos para comenzar el autoaprendizaje de la ciencia de datos?

    ¿Cuál es el papel y la elegibilidad del científico de datos?

    Espero que esto ayude. No dude en enviarme un mensaje para cualquier consulta adicional. ¡Todo lo mejor!

    Competiciones Kaggle
    Los problemas en Kaggle cubren un amplio espectro de posibilidades de Data Science y están presentes en diferentes niveles de dificultad. Si eres estudiante y quieres algún proyecto o estudio de caso en tu curso de reconocimiento de patrones, elige el problema Titanic o Movie Sentiment. Si eres experto en minería de patrones gráficos, elige

    Proyectos MOOC
    Algunos cursos en línea sobre un área relevante también incluyen un proyecto. Un curso bastante popular llamado Introducción a la ciencia de datos ahora también incluye un proyecto. https://www.coursera.org/course/… . Algunos cursos en Udacity giran totalmente en torno a los proyectos.

    Blogs de incubadoras, institutos de formación.
    Las buenas incubadoras e institutos de capacitación generalmente siguen compartiendo nuevos problemas creativos de Data Science, recursos y tutoriales. Marcarlos y seguir revisando. Aquí hay una maravillosa lista de recursos:
    Fuentes de datos para proyectos de ciencia de datos geniales: Parte 1
    ¿Aspirante a científico de datos? Aquí hay algunas ideas de proyectos en el trabajo

    Colegios y universidades
    Las buenas universidades que ofrecen cursos como aprendizaje automático, reconocimiento de patrones, minería de datos, recuperación de información, visión por computadora, etc. incluyen un proyecto en sus cursos. Por lo general, esta información no es pública, pero si tiene un amigo en alguna universidad de renombre, puede solicitarle que encuentre y le envíe una lista de proyectos de cursos en áreas relacionadas.

    Los proyectos de ciencia de datos siempre serán (en el mejor de los casos) tan buenos como los datos que está utilizando . Por lo tanto, después de haber trabajado con algunos conjuntos de datos de juguetes y haber tenido su experiencia con Kaggle, puede ser una buena idea pensar qué preguntas le parecen realmente interesantes e intentar adquirir los datos necesarios para ese propósito.

    Una idea del proyecto que se me ocurrió y me di cuenta fue el análisis de los resultados de las elecciones parlamentarias y presidenciales polacas. Me puse en contacto con el comité electoral y pude reunir datos detallados que datan de principios de 2000 ‘. Encontré muchas ideas útiles que publiqué en línea. Los más interesantes se referían a la correlación entre las partes y cómo cambia drásticamente a lo largo de los años.

    El proyecto en el que estoy trabajando actualmente es Singlethink. La idea es que las personas de todo el mundo expresen cómo se sienten acerca de varios temas . Es dinámico: los usuarios también pueden sugerir que se agreguen nuevos temas para que el espacio de temas pueda seguir creciendo.

    Los usuarios se visualizan en un mapa que muestra cuán similares son sus opiniones. Puede ver qué usuarios tienen opiniones similares a usted y sobre qué temas. El mapa se actualiza dinámicamente a medida que los usuarios expresan más opiniones. Visita Singlethink para probarlo.

    Mis planes para el futuro cercano incluyen la siguiente funcionalidad adicional:

    • Los usuarios pueden agregar amigos y ver fácilmente con quién de sus amigos tienen opiniones similares / diferentes.
    • Mapa que muestra qué temas están relacionados entre sí y son similares
    • Un motor de recomendación

    ¡Espero que algunos de ustedes lo encuentren útil / interesante / inspirador!

    No estoy seguro de cómo calificar “bueno” en su pregunta. Aquí hay algunos lugares para mirar:

    1. Si desea participar en desafíos o ver algunos de los desafíos pasados, eche un vistazo a kaggle: su hogar para la ciencia de datos
    2. Si desea utilizar Data Science para hacer el bien, puede inspirarse en Data Science for Social Good – Data Science for Social Good Summer Fellowship
    3. Si desea que los proyectos comiencen, puede consultar Cinco proyectos de ciencia de datos para comenzar Cinco proyectos de ciencia de datos para aprender ciencia de datos (encontré esto buscando en Google “mini proyectos de ciencia de datos” y hay muchos otros enlaces allí).

    Espero que esto ayude.

    1. También puede encontrar datos para explorar a través de plataformas de datos abiertas. Hay muchos de ellos, pero enumeraré algunos recursos que pueden ayudarlo a comenzar:
    • Banco Mundial
    • Naciones Unidas
    • Portales de datos
    • openFDA
    • Datos abiertos del gobierno de EE. UU.
    • Datos abiertos del gobierno del Reino Unido
    • Portal de datos abiertos de la Unión Europea – https://data.europa.eu/euodp/en/

    2. También encontrará conjuntos de datos en DataHub, Your Home for Data Science y DrivenData.

    3. También podría considerar el raspado web como una fuente para recopilar datos. Puede consultar el tutorial breve de R: Raspado de datos generados por Javascript con R si desea trabajar con R o The Hitchhiker’s Guide to Python for Python.

    4. Como ya se mencionó, los cursos de ciencia de datos y los MOOC también proporcionan un proyecto para consolidar el conocimiento que ha reunido a lo largo del curso; Esto también es cierto para los cursos de ciencia de datos: Tutoriales de análisis de R & Python | DataCamp.

    ¡No olvides escribir tu código y análisis en cuadernos! Estos se comparten muy fácilmente y puede exportarlos a casi cualquier formato que desee.

    ¡Buena suerte!

    Áreas tecnológicas

    a) PNL: el procesamiento del lenguaje natural es un área importante de trabajo donde la industria está trabajando activamente.

    Algunas fuentes de aprendizaje, tutoriales y práctica de problemas de PNL son:

    1 – Este tutorial se enfoca en Word2Vec para el análisis de sentimientos.

    https://www.kaggle.com/c/word2ve

    2 – Reseñas de Amazon para el análisis de sentimientos

    b) Predicción de series de tiempo

    Las series de tiempo encapsulan muchos problemas diferentes en diferentes aplicaciones como finanzas, ya sea, tráfico web.

    1 – Predicción de series temporales de tráfico web

    2 – Análisis de datos de series temporales para la predicción del mercado de valores

    https://www.researchgate.net/pub

    c) Procesamiento y clasificación de imágenes

    Clasificación de fotos de restaurantes de Yelp

    Industria

    1 – Predicciones de ventas

    Análisis completo de Python y D3.js Favorita

    2 – Fraude

    Detección de fraude con tarjeta de crédito

    3- cuidado de la salud

    Conjunto de datos de Wisconsin (diagnóstico) de cáncer de seno

    4 – Criptomoneda

    Precios históricos de criptomonedas | Kaggle

    De mi respuesta en Data Science Stack Exchange: página en stackexchange.com.

    Intentaría analizar y resolver uno o más de los problemas publicados en Kaggle Competiciones (Competiciones | Kaggle). Tenga en cuenta que las competiciones se agrupan por su complejidad esperada, desde 101 (al final de la lista) hasta Investigación y destacados (al principio de la lista). Una banda vertical codificada por colores es una guía visual para la agrupación. Puede evaluar el tiempo que podría dedicar a un proyecto ajustando la duración esperada de la competencia correspondiente, según sus habilidades y experiencia .
    Se pueden encontrar varias ideas de proyectos de ciencia de datos navegando en la siguiente página web de Coursolve: Página en coursolve.org.
    Si tiene habilidades y desea trabajar en un proyecto de ciencia de datos real , centrado en los impactos sociales , visite la página de proyectos de DataKind: DataKind | Proyectos Se pueden encontrar más proyectos con enfoque de impacto social en la página web de la beca Data Science for Social Good: Data Science for Social Good.
    La página de Ideas del Proyecto de Ciencia en el sitio de My NASA Data se ve como otro lugar para visitar en busca de inspiración: http://mynasadata.larc.nasa.gov/… .
    Si desea utilizar datos abiertos , esta larga lista de aplicaciones en Page en data.gov puede proporcionarle algunas ideas interesantes de proyectos de ciencia de datos : Aplicaciones – Data.gov.

    Gracias Yutang Wang por A2A,

    Intente participar en los concursos de Kaggle Your Home for Data Science, es muy útil y puede conseguir trabajo para ello.

    MOOC:

    • Cursos de análisis, big data y ciencia de datos (certificaciones)
    • Cursos de ciencia de datos | Coursera (Proyectos de grandes universidades MIT, Michigan University, Stanford …)
    • udacity Todos los cursos y programas de nanogrado | Udacity. (Certificaciones)

    Espero que ayude 🙂

    Esto es relativo a lo que preguntas en tu pregunta.

    Esto debería darte esperanza.

    Actualmente estoy tratando de encontrar una manera de construir una máquina de borrado de memoria humana, que use una máquina de cuchillas gamma modificada, para ionizar grupos de neuronas de tamaño cúbico de micras en el cerebro.

    ¿Podría esta técnica ser más segura de usar que la terapia electroconvulsiva, al borrar recuerdos específicos de personas con TEPT?

    El siguiente paso en el trabajo de Andre Fenton es borrar los recuerdos espaciales específicamente en el cerebro de un ratón usando una máquina de gamma cuchillo modificado

    Los pasos para hacer esta técnica están a continuación.
    La máquina de resonancia magnética INUMAC que aún no se ha construido (para obtener imágenes de la enfermedad neurológica con MR de alto campo y contrastophores) puede obtener imágenes de un área de aproximadamente 0.1 mm, o 1000 neuronas, y ver los cambios que ocurren tan rápido como una décima de segundo.
    Permitiría imágenes funcionales mucho más precisas del cerebro en el trabajo, de lo que está disponible actualmente. Realmente no se puede discriminar lo que está sucediendo en el cerebro al nivel de unos pocos cientos de neuronas.
    Combine el INUMAC con los últimos escáneres CT. Con los últimos escáneres CT, la imagen final es mucho más detallada que una imagen de rayos X. Dentro del escáner CT hay un detector de rayos X que puede ver cientos de niveles diferentes de densidad. el INUMAC y los últimos escáneres CT con magnetoencefalografía (MEG) y electroencefalograma (EEG) para ver las señales eléctricas, que ocurren en la magnetoencefalografía real, el magnetómetro SERF (sin intercambio de espín de relajación) en investigación para futuras máquinas. Esto ayudará a aumentar el futuro precisión de la señal eléctrica en el cerebro.
    Ahora tiene señales BOLD y electro y químicas para deducir qué neuronas contienen qué memoria espacial específica.
    Modifique una máquina Gamma Knife, actualmente las lentes de bola deben ser trabajadas para ionizar grupos de neuronas del tamaño de micras, en áreas cúbicas en el cerebro.
    Recuerde que una onda gamma puede atravesar algo tan pequeño como una cirugía con cuchillo gamma: ionizan tumores en el cerebro del tamaño de un guisante, por lo que ionizar un área cúbica en el cerebro de alrededor de 20 micras sería mucho más seguro que la cirugía con cuchillo gamma. para este cuchillo gamma modificado se encuentra en la descarga a continuación en la parte inferior de esta página. La forma en que funciona la máquina de cuchillas gamma modificadas es que solo usa de dos a veinticinco haces. Pero dos haces harán que la reunión más pequeña se encuentre en el centro, donde la intensidad de los haces de ondas gamma es la más fuerte para ionizar las células. El colimador ajusta el ancho de los dos haces de rayos gamma para ionizar grupos de neuronas en un área de tamaño cúbico en el cerebro. Dos haces de rayos gamma son los mejores para hacer un área de encuentro más pequeña en el centro, pero más de dos haces pueden se usa si ayuda mejor con la ionización de un área cúbica de un grupo de neuronas.

    El tiempo que los grupos de neuronas necesitan ser ionizados también es un factor de ionización.
    Un neurocientífico puede decir “necesita encontrar un grupo de neuronas asociadas con una memoria específica, y luego necesitaría ionizar cada grupo de neuronas asociadas con esa memoria para borrar esa memoria específica”.

    No necesita encontrar CADA grupo de neuronas en el cerebro que contiene una memoria específica.

    Ionizar ALGUNOS de los grupos de neuronas es suficiente para interrumpir una memoria específica.

    Y así es como lo haces.
    Usted busca los grupos de neuronas que contienen la mala memoria en la tecnología INUMAC MRI y FMRI, CT EEG y MEG.

    Encuentras los malos recuerdos, pidiéndole a la persona que recuerde los malos recuerdos.

    Cuando haya identificado qué grupos de neuronas podrían contener los malos recuerdos.
    Le pide a la persona que recuerde la mala memoria, a medida que ioniza las neuronas asociadas con la mala memoria, le sigue pidiendo a la persona que recuerde la mala memoria, cuanto más ioniza, más borrosa se vuelve la mala memoria para la persona, a medida que usted pídale que lo recuerde.

    Entonces, gradualmente, la mala memoria debe borrarse, pero el punto es que no fue necesario encontrarla e ionizar CADA grupo de neuronas en el cerebro para borrar la mala memoria.

    Lo que sería como encontrar una aguja en un bosque.

    Entonces, lo que ha hecho aquí es que ha impedido que las neuronas se comuniquen entre sí para hacer un mal funcionamiento completo de la memoria de la persona.

    Al ionizar ALGUNAS de las neuronas, ha interrumpido el proceso de comunicación de las neuronas entre sí que forma la mala memoria para la persona.

    ¿Es mejor que la persona se vaya confundida y que las cosas en su mente no tengan un poco de sentido, o que la persona esté severamente deprimida con TEPT?

    De todas las neuronas que contienen la mala memoria, solo ionizando menos del 10% de los grupos de neuronas, podría ser suficiente para interrumpir el proceso de comunicación entre estas neuronas para borrar con éxito una memoria.

    Esto es mucho más seguro que la terapia electroconvulsiva, puede causar confusión y pérdida de memoria, ya sea de buenos recuerdos o recuerdos importantes que debe saber. y esta técnica con INUMAC y FMRI, y una cuchilla gamma modificada es más específica, para borrar los malos recuerdos y dejar los buenos recuerdos y recuerdos de cosas que necesita saber.
    ZIP (péptido inhibidor de Zeta), y la optogenética nunca funcionará en un ser humano.
    En la cirugía con Gamma Knife, ionizan un área del cerebro del tamaño de un guisante, quiero ionizar un área cúbica de unas pocas micras de tamaño, por lo que esto sería mucho menos peligroso que la cirugía con gamma Knife.
    Además, es posible que no sea necesario utilizar ondas gamma, se podrían usar rayos X para ionizar los grupos de neuronas, lo que sería más seguro.

    La seguridad es la prioridad más importante en esta idea.

    Esta idea de borrar recuerdos específicos, es una opción que es una técnica más segura y más específica mejor que la terapia electroconvulsiva.

    Los científicos de Stanford han demostrado una técnica para observar cientos de neuronas que disparan en el cerebro de un ratón vivo, en tiempo real, y han vinculado esa actividad al almacenamiento de información a largo plazo. El trabajo sin precedentes podría proporcionar una herramienta útil para estudiar nuevas terapias para enfermedades neurodegenerativas como el Alzheimer.

    Los investigadores primero utilizaron un enfoque de terapia génica para hacer que las neuronas del ratón expresen una proteína verde fluorescente que fue diseñada para ser sensible a la presencia de iones de calcio. Cuando se activa una neurona, la célula se inunda naturalmente con iones de calcio. El calcio estimula la proteína, haciendo que toda la célula tenga una fluorescencia verde brillante.

    Un pequeño microscopio implantado justo encima del hipocampo del ratón, una parte del cerebro que es crítica para la memoria espacial y episódica, captura la luz de aproximadamente 700 neuronas.

    El microscopio está conectado a un chip de cámara, que envía una versión digital de la imagen a la pantalla de una computadora.

    Luego, la computadora muestra un video casi en tiempo real de la actividad cerebral del mouse cuando un mouse corre alrededor de un pequeño recinto, que los investigadores llaman una arena.

    Los disparos neuronales se ven como pequeños fuegos artificiales verdes, explotando aleatoriamente contra un fondo negro, pero los científicos han descifrado patrones claros en el caos.

    “Literalmente podemos averiguar dónde está el ratón en la arena mirando estas luces”, dijo Mark Schnizer, profesor asociado de biología y física aplicada.

    Cuando un mouse se rasca en la pared en un área determinada de la arena, una neurona específica se disparará y parpadeará en verde. Cuando el ratón se desplaza a un área diferente, la luz de la primera neurona se desvanece y se genera una nueva célula.

    “El hipocampo es muy sensible a la ubicación del animal en su entorno, y las diferentes células responden a diferentes partes de la arena”, dijo Schnitzer. “Imagínese caminando por su oficina. Algunas de las neuronas en su hipocampo se iluminan cuando está cerca de su escritorio, y otras se disparan cuando está cerca de su silla. Así es como su cerebro hace un mapa representativo de un espacio”.

    El grupo descubrió que las neuronas de un ratón se disparan con los mismos patrones incluso cuando ha pasado un mes entre experimentos. “La capacidad de regresar y observar las mismas células es muy importante para estudiar las enfermedades cerebrales progresivas”, dijo Schnitzer.

    Por ejemplo, si una neurona particular en un ratón de prueba deja de funcionar, como resultado de una muerte neuronal normal o una enfermedad neurodegenerativa, los investigadores podrían aplicar un agente terapéutico experimental y luego exponer al ratón a los mismos estímulos para ver si la función de la neurona regresa.

    Aunque la tecnología no se puede utilizar en humanos, los modelos de ratón son un punto de partida común para nuevas terapias para enfermedades neurodegenerativas humanas, y Schnitzer cree que el sistema podría ser una herramienta muy útil para evaluar la investigación preclínica.

    Si combinaste mi idea modificada de máquina de cuchillas gamma, para ionizar neuronas en el cerebro de los ratones, en este experimento podrías probar mi teoría del 10% que no necesitas encontrar e ionizar CADA neurona asociada con una memoria espacial.

    Solo necesita ionizar el 10% de las neuronas asociadas con una memoria espacial específica, para borrar la memoria.

    Probar esta teoría que no es necesario encontrar e ionizar todas las neuronas del cerebro para borrar una mala memoria es el siguiente paso en el experimento realizado por Andre Fenton.

    Andre Fenton borró recuerdos espaciales en ratones usando ZIP (péptido inhibidor de Zeta) pero no puede borrar recuerdos específicamente, sería un experimento más avanzado basado en su experimento con el ratón en la tarea de evitar la colocación.

    Parece que los recuerdos se crean como cambios de algunas moléculas hechas en sinapsis seleccionadas dispersas en muchas regiones del cerebro, y no en neuronas completas, ni en conjuntos de neuronas ubicadas una al lado de la otra.

    Es posible que pueda deducir ionizando neuronas a escalas de micras cómo se consolidan los recuerdos en esta técnica.

    Además, si pueden ayudar, solicito una subvención para que este cuchillo gamma modificado se construya en una universidad, así como una pasantía para comenzar a construir este cuchillo gamma prototipo y comenzar a hacer este experimento.

    Hola,

    1.Nivel de principiante:

    Iris DataTitanic

    Predicción de préstamo de datos

    DataBigmart Sales

    Datos de vivienda de DataBoston

    2.Nivel intermedio:

    Datos de reconocimiento de actividad humana

    Datos del viernes negro

    Datos de competencia de Siam

    Datos del historial de viaje Millones de datos de canciones

    Datos de ingresos del censo Datos de lentes de película

    3. Nivel Avanzado:

    Identifique sus dígitos Datos de ayuda

    Datos de ImageNet

    KDD Cup 1998Chicago Crime Data

    http://kosmiktechnologies.com/da

    Cualquier artículo científico de más de 50 años o cualquier libro generalmente no tiene derechos de autor.

    ¡Ponga sus datos en una base de datos y saque algunas conclusiones!

    Los datos del censo de la mayoría de las naciones están abiertos. ¡Saca algunas conclusiones!

    FRED de la Reserva Federal es un vasto mar de datos gratuitos sobre todo lo económico.

    Los genomas de varias especies ahora están disponibles de forma gratuita.

    Grandes cantidades de datos de la NASA son de código abierto. Aprende visualmente en las fotos del Hubble.

    ¿Qué tal una base de datos de todas las plantas medicinales conocidas? ¿O uno que vincule cada molécula compleja que se encuentra en la mayoría de las plantas?

    ¿Qué tal una base de datos de micrografías como las estructuras celulares de las pieles de rana?

    ¿O una base de datos de muestras de agua globales realizadas regularmente con análisis de temperatura?

    ¿Qué tal tomar los datos de la aerolínea y analizarlos contra el PIB nacional?

    ¿O contar el número de abejas que salen de las colmenas y analizar la relación entre las abejas y la temperatura?

    O mida todas las llamas solares y correlacione con los eventos humanos.

    La lista es interminable.

    A continuación se presentan los proyectos de ciencia de datos más interesantes.

    • Titanic: Aprendizaje automático del desastre
    • Competiciones | Kaggle

    Para inspirarme, recomendaría mirar a través de proyectos pasados ​​del Curso de Ciencia de Datos de Harvard.

    cs109 – YouTube

    Mi proyecto CS109 favorito es The Karma Train

    Las competiciones / conjuntos de datos en Kaggle y los conjuntos de datos de los repositorios UCI son buenos para probar en proyectos personales.

    Si ha terminado de aprender R y Python, le sugiero que visite
    El hogar de la ciencia de datos
    Aquí puede encontrar problemas de análisis de datos del mundo real y muchas personas comparten sus soluciones en los foros de kaggle también.
    Personalmente encontré este sitio muy útil.

    Aquí hay una lista ‘impresionante’ de aplicaciones comprobadas de ciencia de datos.

    GitHub / awesome-datascience-ideas

    ¡Siéntase libre de agregar el suyo enviando una solicitud de extracción!

    Además de Kaggle, como los sitios web de la competencia, puede utilizar los datos del gobierno de los EE. UU. Data.gov

    Los proyectos de Data Science pueden ayudar a implementar la ciencia de datos en un campo particular. Estos son algunos de los proyectos que se hicieron famosos actualmente.

    • Desafío de visualización de Hubway
    • datos de movielense
    • Conjunto de datos titánicos de kaggle
    • Conjunto de datos netos de imagen
    • Conjunto de datos de delitos de Chicago

    Para obtener más información: BEPEC | ¿Por qué ciencia de datos? Bangalore

    Tampoco sé qué implica un “buen” proyecto de ciencia de datos. “Bueno” es una palabra demasiado subjetiva para dar una respuesta precisa. Honestamente, siempre que esté dedicado a un proyecto y le haga justicia, entonces la calidad del mismo brillará.

    Eso es lo que aprendí trabajando en conjuntos de datos simples con Conseris.