¿Cuál es la mejor computadora portátil para un científico de datos?

Soy dueño de una computadora portátil ASUS con procesador Intel Core i5, 4 GB de RAM y sin GPU. No experimenté la lentitud de mi computadora hasta que trabajé en algunos proyectos paralelos y cursos en línea relacionados con Big Data y Deep Learning. Mi hardware es tan limitado que ni siquiera cumple con algunos requisitos de software en Big Data. Por ejemplo, me costó mucho descargar e instalar IBM InfoSphere BigInsights Quick Start Edition V3 antes de darme cuenta de que no tengo suficiente memoria RAM para ese software. Para Deep Learning, la mayoría de sus algoritmos están optimizados para ejecutarse en GPU en lugar de CPU tradicional. Un algoritmo que toma GPU un día puede tomar CPU una semana para ejecutarse. Por supuesto, puedes aprender Deep Learning con CPU. Pero pronto sentirá el dolor y se dará cuenta de que la lucha es real.

Entonces, mi recomendación es que una buena computadora portátil (de cualquier género) sea: procesador de 4 o 6 núcleos, al menos 16 GB de RAM y GPU.

Actualización: y HDD de 1 TB (trabajará mucho con grandes conjuntos de datos)

Actualización: Ya uso esta computadora portátil porque apesta para el trabajo.

Me hice exactamente la misma pregunta hace un año, y se me ocurrió una solución que ahora funciona de manera sorprendente, aprendí mucho y me ahorré un montón de dinero en el proceso.

Ya había construido mi computadora de análisis de datos ideal (es decir, potente) aproximadamente un año antes, pero era una computadora de escritorio. Pensé que en realidad podría comprar una computadora portátil realmente barata, mantener mi computadora de escritorio funcionando todo el tiempo y luego usar RDP *, Teamviewer * o un programa VNC * para conectarme a ella cada vez que necesitaba hacer un análisis de datos.

Compré la computadora portátil barata (AU $ 350, pantalla táctil de 11 “, Windows 8, HP net book), y comencé a tratar de configurar VNC. Lo puse a funcionar, pero eso significaba que siempre tenía que dejar mi escritorio funcionando, y fue bastante lento.

Más tarde descubrí Amazon AWS EC2, un servicio que te permite crear computadoras virtuales con cualquier sistema operativo que desees y personalizar cómo accedes a ellas. Configuré uno de estos (Linux), luego me enseñé a mí mismo cómo usar Linux.

Lo más útil es que he instalado un IDE basado en web para R en él (Rstudio), que me permite ir a un sitio web alojado en mi servidor EC2 y usar R como si estuviera sentado en esa computadora. Ahora, cada vez que quiero hacer algo de trabajo, puedo hacerlo desde cualquier computadora del mundo con conexión a Internet, simplemente visitando un sitio web, y todo el procesamiento se realiza en el servidor de Amazon.

Tiene que pagar por el servidor, pero son económicos y paga diferentes cantidades según el procesador (virtual), RAM, GPU, etc. del servidor. Además, hay una prueba gratuita de 1 año que le permite usar el servidor virtual menos potente sin costo alguno.

Entiendo que R puede no ser el único lenguaje que desea utilizar, pero dado que puede instalar lo que desee en su servidor, parece una opción viable.

Ventajas:

  • Puede acceder al servidor desde cualquier dispositivo con internet
  • Los archivos son siempre accesibles. Ni siquiera necesita descargarlos (como lo haría con el cuadro desplegable), solo ver en el servidor
  • Cuesta mucho menos que una computadora portátil potente
  • El servidor se puede diseñar mediante programación para escalar dependiendo de las necesidades de análisis utilizando una API

Desventajas

  • La pantalla del portátil es bastante pequeña, pero ahora encuentro que accedo al servidor principalmente desde otros escritorios
  • Requiere conexión a internet para usar
  • Puede tomar algo de tiempo aprender a usar EC2

* Todos estos programas le permiten ver y controlar una computadora desde una segunda computadora, a través de Internet.

Si está siguiendo una carrera en ciencia de datos (ya sea académica o en la industria), rara vez trabajará en su computadora portátil.

En cambio, tentarás con máquinas mucho más potentes.

Si eres estudiante, obtén algo asequible. Tenga la seguridad de que lo que compre hoy probablemente no lo usará en dos años.

Algunas personas dicen que salte por la RAM extra. Sugeriría: obtenga solo 2 GB-4 GB de RAM y luego use el dinero que ahorró para alquilar tiempo en AWS de Amazon y obtenga un cómodo control remoto en esas máquinas. Si decide ingresar a la industria, eso lo ayudará a destacarse como candidato (no solo la experiencia, sino más bien el autocontrol y la iniciativa).

Una última sugerencia: adhiérase a un entorno similar a UNIX, de los cuales las Mac son probablemente las más fáciles de usar, pero incluso una máquina Ubuntu simple le servirá significativamente mejor que una configuración similar de Windows.

Buena suerte

Esto solía importar mucho, pero probablemente importará menos de lo que lo hace ahora.

A partir de 2017, debería poder obtener una computadora portátil con un procesador Intel Core i5 de la serie Kaby-Lake competente y alrededor de 8 GB de RAM. Tener una tarjeta gráfica de buena calidad podría ayudar si realmente está haciendo cálculos numéricos utilizando marcos como CUDA, pero lo que puede ayudarlo más puede ser que haya más RAM.

Las series MacBook Pros y Lenovo T son obviamente buenas opciones.

Sin embargo, con un cambio hacia el almacenamiento en la nube y las tecnologías informáticas, ahora es mucho más fácil comenzar a hacer análisis de datos y ciencia de datos con una computadora portátil realmente básica, siempre que pueda pagar por un servicio basado en la nube para alojar sus archivos y hacer cálculos remotamente en un clúster. Para esto, solo necesita una máquina básica, por lo que un Windows básico o una Mac de gama baja deberían funcionar si está dispuesto a gastar en almacenamiento en la nube y computación.

Yo diría … depende …

Para el trabajo diario uso un ideapad Lenoivo i5. Veo muchos Lenovos alrededor, probablemente porque ofrecen un buen poder por dinero. No estoy seguro acerca de MacBookPro. ¿Ustedes encuentran que tiene una buena relación potencia / $$?

Personalmente me gusta el mío porque tiene gráficos intercambiables para que pueda obtener más duración de la batería o más potencia de gpu. A veces uso el procesamiento de GPU para el análisis de imágenes, lo que hago con bastante frecuencia. Pero te animo a que no inviertas en GPU. Es muy raro usar la potencia de la GPU como Data Scientist, verifique su conjunto de minería favorito y cómo se hace todo en la CPU … (si usa CUDA o similar, hágalo, pero es poco probable). En lugar de invertir en RAM, cuanto más mejor y más barato, desea mover tantos datos a la memoria como sea posible, verifique los límites de mobo. Cualquier cosa por debajo de 8-16 GB no tiene sentido. Definitivamente elegiría 32 GB. Por supuesto, el procesador debe ser de gama media, media-alta, pero esto también depende de sus frecuentes requisitos de procesamiento.

En mi portátil tengo 2 discos, 1 SSD para el sistema operativo y 1 giratorio para la información. Desea el primero al menos 64 GB y el segundo 750 GB. El primero para OS y el segundo para llevar datos contigo. Mantenga una partición encriptada por razones de seguridad.
La pantalla del portátil debe ser lo suficientemente grande, cualquier cosa por debajo de 14 pulgadas no tiene sentido. El mío es 15.6 y me gusta. El teclado debe ser cómodo y de buena calidad. Si opta por Alienware u otra computadora portátil grande, piense dos veces si finge moverla. Si va a pequeño o delgado, entonces probablemente no sea para un procesamiento fuerte, más para viajes de reuniones.
Su computadora portátil debe tener conectores para una segunda pantalla. Como Data Scientist, tendrá que desarrollar software (o al menos scripts) y escribir informes, por lo que una segunda pantalla es imprescindible. Una tercera pantalla puede ser útil o una distracción, depende.
Esas son algunas buenas especificaciones sobre Lenovo, lo malo es que es un poco frágil, las bisagras para ser más concisas se sueltan fácilmente debido a una mala decisión de diseño (torsión en plástico duro mehhh), por lo que no puede elegirlo desde la pantalla o se pierden con el tiempo.

Acerca de los sistemas operativos Me gusta el arranque múltiple con la virtualización de los sistemas operativos instalados en HDD. Me gusta poder iniciar los mismos sistemas operativos nativos y virtualizados, pero hay que tener cuidado de no corromperlos. Siempre debe usar copias de seguridad programadas incrementales para evitar la pérdida de información (Cobian Bckup, por ejemplo) y una opción de recuperación rápida del sistema (Acronis True Image, por ejemplo).
Para emular entornos de clúster, me gusta el Servidor 12 Hyper-V porque tiene deduplicación automática de datos para que pueda tener un nodo VM adicional por solo 100 MB de HDD, y con 32 GB de RAM puede ensamblar combinaciones de clúster agradables. Ciertamente, desea saber cómo implementar clústeres de Linux si desea emular compañías más grandes, y también algunas pruebas de pen convencionales (es decir, Backtrack-Kali) para evitar crear grandes agujeros.
Cuando necesite un poco más de potencia que la que ofrece su computadora portátil, debería tener una computadora de escritorio con Wake-on-lan, para que pueda dejar un proceso ejecutándose allí, también es útil para que más máquinas virtuales prueben la alta disponibilidad, por ejemplo. También es una buena idea tener un NAS para ubicar, hacer copias de seguridad y compartir datos fácilmente.
Por supuesto, para el procesamiento de big data real (la mayoría de los datos no son tan grandes si realiza un procesamiento en tiempo real) necesita un clúster: Amazon, Azure, algunos Uni … pero el personal de TI y administración de su empresa debería tener un asesoramiento más sólido sobre la elección. Si es por ti mismo, ve a la nube. Si solo lo necesita para pruebas y emulaciones RAM + VM + deduplicación de datos es lo suficientemente bueno.

En primer lugar, felicitaciones a todos los científicos de datos. Sé que el trabajo realizado por el analista de datos es muy tedioso y pesado. El trabajo requiere una gran concentración y tranquilidad. Por lo tanto, una máquina lenta y retrasada no es deseable. Teniendo en cuenta los problemas que enfrenta el científico de datos, he elaborado las especificaciones necesarias para la computadora portátil de ciencia de datos.

Especificaciones a buscar en la computadora portátil Data science:

  • Procesador Intel Core i7 o i5
  • 16 GB de memoria de acceso aleatorio
  • Procesador mínimo de cuatro núcleos
  • Buen almacenamiento
  • Tamaño de pantalla grande

Al analizar todas las características anteriores, he seleccionado algunas de las mejores opciones de computadora portátil para el análisis de datos.

  • Apple Macbook Pro MLW72LL / A
  • Portátil Dell Inspiron Touchscreen Signature
  • Acer Aspire VX 15

A continuación se encuentran las especificaciones de las computadoras portátiles mencionadas anteriormente:

Apple Macbook Pro MLW72LL / A

  • Procesador Intel i7 de cuatro núcleos
  • 16 GB de RAM
  • 256 GB de almacenamiento flash
  • Gráficos Intel HD 530

Portátil Dell Inspiron Touchscreen Signature

  • Procesador Intel Core i7 de 6.a generación
  • 16 GB de RAM DDR3L
  • Laptop de 17.3 pulgadas

Acer Aspire VX 15

  • Intel Core i5 de 7.a generación
  • 16 GB de RAM DDR4
  • NVIDIA GeForce GTX 1050 Ti
  • Pantalla Full HD de 15,6 pulgadas

Así que estas fueron algunas de las mejores computadoras portátiles elegidas para la ciencia de datos. Para ver más opciones visite la fuente

Depende de la naturaleza de los proyectos.

¿Va a hacer muchos proyectos en solitario con datos que van desde unos pocos GB que tiene que proceder localmente (debido a GDPR o por razones similares)?

  • Obtenga 8–16GB de memoria, e idealmente un i7 con 256GB ssd.
  • Si solo hace todo a través de la computación en la nube, simplemente obtenga algo con especificaciones menores, que simplemente funcione sin problemas.

¿Eres consultor, tienes que viajar y / o mostrar algunas presentaciones?

  • Obtenga un formato de computadora portátil. Personalmente, iría con una pantalla pequeña (12–14 ″) y <1,5 kg, ya que es menos peso que tienes que andar. Siempre puede encontrar un monitor más grande por separado si lo desea.

¿También vas a hacer un aprendizaje profundo?

  • ¿Solo por algunos ejercicios y familiaridad? No hay necesidad real de GPU.
  • ¿Realmente quieres aprender un modelo de aprendizaje profundo desde cero, pero solo una o dos veces? Obtenga una GPU 970+ / 1060+, o no se moleste y solo use la computación en la nube. Obtenga un sistema operativo Unix: ubuntu / macOS
  • ¿Aprende muchos modelos de aprendizaje profundo> desde cero

¿Te gustan muchos paquetes experimentales / cosas experimentales de aprendizaje profundo?

  • Obtenga un sistema operativo Unix: ubuntu / macOS. O ve con dualboot.

¿Quieres algo más elegante? ¡Ve con una laptop con pantalla táctil!

Como Data Scientist, escribirás bastante código, así que asegúrate de que la distribución del teclado cumpla con tus estándares. Por ejemplo, poder usar home / end fácilmente, así como las posiciones ctrl / shift / alt. Algunas computadoras portátiles tienen inicio / inserción sin botón de finalización, y esto puede arruinar fácilmente su mundo.

Hay tantas computadoras portátiles en el mercado que es difícil elegir una. En lugar de enumerar marcas y tipos, esto es lo que debe estar buscando:

1.Mac o Windows? – Ambos tienen sus ventajas y desventajas. Muchos científicos de datos optan por un Macbook para hacer ciencia de datos debido a su velocidad y rendimiento. La mayoría del software se puede usar tanto en Mac como en Windows hoy en día, depende más de las preferencias personales. Si opta por Windows, asegúrese de usar Windows 10 o Windows 7, ¡SALTE Windows 8 a toda costa!

2.RAM: esta es la clave para la selección de su computadora portátil. La mayoría de los científicos de datos que usan R o Python localmente le dirán cuán importante es la RAM, especialmente cuando se trabaja con conjuntos de datos más grandes. Cargue tanta RAM como sea posible. Necesita al menos 8 GB de RAM, pero opte por más. Mi computadora portátil tiene 16 GB de RAM y puede manejar una gran cantidad de datos y ahorro horas de tiempo de procesamiento. Solía ​​hacer algoritmos de aprendizaje automático en una computadora portátil con 4 GB de RAM y cuando actualicé, recuperé horas de tiempo de procesamiento. Los algoritmos que solían tardar 4 horas en ejecutarse ahora demoran 20 minutos. ¡Habla sobre ahorros! También tenga en cuenta que hay muchas soluciones en la nube y procesadores paralelos que se pueden alquilar que permiten que una gran cantidad de datos se procesen de manera eficiente. No todo tiene que ser local.

3.Procesador: para Windows, dispare para un procesador Intel i7 al menos. ¡La velocidad de procesamiento que proporciona el i7 evitará que te vuelvas loco! Puede manejar bastante. Intel también es el estándar para procesadores. Creo que AMD simplemente no funciona tan bien. Al mirar los procesadores, desea ver la cantidad de núcleos y los ghz de rendimiento. Desea un procesador que funcione a alrededor de 3.0 ghz. Muchos procesadores i7 alcanzan un máximo de 3.5 ghz. Con núcleos, tiene una opción de dos o cuatro. Los núcleos a menudo se pasan por alto y muchas computadoras portátiles hoy en día son solo dos núcleos. Sin embargo, cuando realiza un trabajo que realiza un científico de datos, desea la potencia de procesamiento en paralelo. Dos núcleos se ejecutarán más rápido en el uso diario, pero los cuatro núcleos se amortizan al ejecutar algoritmos. Tengo cuatro núcleos y no volveré a dos núcleos. Nuevamente, dos núcleos le ahorrarán dinero, pero se deben preferir cuatro núcleos. CUIDADO: es posible que tenga que profundizar en las especificaciones técnicas del procesador para ver cuántos núcleos ofrece.

4. Unidad de disco duro – HDD o SSD. Una decisión que no es tan importante con el advenimiento del almacenamiento en la nube y el almacenamiento físico, pero prefiero que mis computadoras portátiles tengan algo de espacio en el disco duro. La unidad de disco duro es la versión anterior de un disco duro y a menudo se la conoce por su rotación constante. Cuando calcule algoritmos grandes, espere que se escuche este ruido giratorio. No me molesta, pero sí molesta a algunos usuarios de computadoras portátiles. Un SSD no tiene partes móviles y, por lo tanto, es mucho más silencioso. Los SSD suelen ser más caros y a menudo almacenan menos. Al elegir una computadora portátil, no está fuera de la cuestión hoy en día tener al menos 1 TB de almacenamiento. Esto sería suficiente para el científico de datos promedio.

5.Extras: obtenga el tamaño de pantalla más cómodo. Puede obtener una pantalla de hasta 17 “y proporciona una gran visibilidad, pero una pantalla de 15” es más portátil. Si la computadora portátil tiene una buena tarjeta gráfica o GPU, esta es una ventaja. La GPU se puede usar para ayudar a acelerar los algoritmos y, a menudo, las computadoras portátiles usarán la GPU para procesar aplicaciones de software. La potencia de la GPU es asombrosa si se puede aprovechar adecuadamente. Es necesario un teclado retroiluminado si planea viajar. Esto es útil en entornos oscuros como un avión. Mi computadora portátil también tiene pantalla táctil, no la uso mucho, ¡pero me gusta saber que está ahí! Además, si le gusta trabajar en un escritorio, busque algo que tenga la opción de una estación de acoplamiento.

Entonces, dependiendo de lo que esté buscando gastar, si se enfoca en algunos de estos principios básicos, ¡hará una selección que lo beneficiará para la ciencia de datos! Si está interesado en los principios de la ciencia de datos, no dude en consultar nuestros procesos y publicaciones de ciencia de datos en http://www.bizscisolutions.com . ¡Suscríbase también a nuestro boletín informativo!

En mi opinión, una PC para juegos es ideal para un científico de datos. Por lo general, vienen con muy buenas especificaciones, que necesitarás si te tomas en serio la ciencia de datos.

  • SO: Windows, OS X o Linux. Realmente no importa en estos días, pero las PC para juegos se envían con Windows.
  • Memoria: 16 GB de RAM es el mínimo, repito, el mínimo . 32 GB o 64 GB es obviamente mejor, pero la mayoría de las computadoras portátiles no vienen con eso como estándar. Compruebe si admite agregar RAM adicional. Es la pieza de hardware más importante para la ciencia de datos, tanto para mantener grandes conjuntos de datos en la memoria como para ejecutar máquinas virtuales.
  • CPU: Core i7 o equivalente. El cálculo rápido es importante cuando se ejecutan algoritmos de aprendizaje automático.
  • Disco duro: dos opciones aquí en mi experiencia. Ya sea una SSD de 256 GB con una unidad de disco duro adicional de 1 TB o una SSD de 512 GB. Los discos duros no son ideales debido al rendimiento, pero no son tan malos en estos días y compensan con pura capacidad.
  • GPU: al menos GTX1060. No obtengas la serie 9, están en desuso. Los algoritmos de aprendizaje automático pueden ejecutarse significativamente más rápido en la GPU utilizando bibliotecas como TensorFlow.
  • Pantalla: si no va a conectar la computadora portátil a monitores externos (que debería), desea tener una pantalla lo más grande posible. Las PC para juegos a menudo vienen con pantallas de 17 ″.

Debe obtener Mac (prefiero) o Windows con buenas configuraciones, procesador y vida útil.

  • Disco duro: al menos 512 GB es ideal teniendo en cuenta los grandes conjuntos de datos. No quieres quedarte corto aquí. Mientras más, mejor.
  • Tipo de HD: prefiero SSD sobre HDD dado que odio los discos que giran 🙂 Vea los precios aquí.
  • RAM: al menos 16 GB es preferible ya que es posible que desee ejecutar máquinas virtuales a veces su máquina no puede manejar el procesamiento pesado. De nuevo, cuanto más mejor
  • I7 es el mejor en los negocios, pero I5 es manejable.

Ahora, cuando usa Amazon EC2 o Microsoft Azure o VMware (compañía) o cualquier máquina virtual, su RAM aparece en la imagen, por lo que las configuraciones anteriores importan independientemente. He estado usando Mac durante algunos años y nunca me decepcionó el procesamiento y el desarrollo intensivos de datos.

Como señala Jesse, la nube de análisis es la mejor opción. En algún momento, superaríamos la capacidad de una sola máquina.
Dicho esto, para los conjuntos de datos que son manejables:

  • Opción 1: MacBook Pro 15 “con quad core I7, 16 GB de RAM (Apple acaba de actualizar esto, pero decepcionante. Esperaba 32 GB + Broadwell)
  • Opción 2: MacBook pro 13 “con doble núcleo I7, 16 GB de RAM (Apple actualizó esta máquina y es muy decente en términos de portabilidad y potencia informática)
  • Opción 3: Macbook Air 13 “, dual core I7, 8GB RAM

Pregunta interesante, ya que estoy reflexionando sobre este tema. Algunas consideraciones que estoy viendo:

  1. Portabilidad: uno termina usando la máquina en aeropuertos, trenes, sala de estar, bibliotecas … usted obtiene la imagen. Por lo general, tengo ideas interesantes sobre la disputa de datos en momentos extraños y una máquina sería útil.
  2. Frameworks: uno estará trabajando en R, Spark, H2O y otros. Por lo tanto, un clúster en la nube (1 o más instancias) es mucho más flexible que la máquina local. El servidor R y el portátil iPython se pueden alojar en la nube. Spark y H2O también se pueden implementar como marcos informáticos.
  3. Conjuntos de datos: los conjuntos de datos más grandes (como Criteo o RecSys2015) necesitan un clúster en la nube
  4. Transformaciones de larga duración, entrenamiento de modelos y otros. Últimamente la mayoría de mis carreras duran más de 10 horas; mucho más fácil de ejecutar en la nube. La máquina local estaría apagada / en modo inactivo a medida que uno lleva a cabo lo esencial de la vida

Así que me estoy inclinando hacia la Opción 3 y me obligo a trabajar desde AWS.

He comparado y comparado más de 40 computadoras portátiles (línea de negocios) para una empresa, que se especializa en vender dispositivos de alta calidad a estudiantes y profesores suizos (ver http://www.projektneptun.ch/en/s …).

Creo que algo como un Lenovo ThinkPad T440p o T450 con una GPU dedicada (Nvidia) es una gran compensación en fiabilidad, comodidad y costo.

Pros:

  • fiabilidad: 3 años de garantía, 5 años de disponibilidad de todas las piezas de repuesto.
  • mantenimiento: HD, RAM, batería, teclado reemplazable
  • extensibilidad: puerto M.2 para SSD adicional, ultrabay para HD adicional en lugar de DVD-Drive, estación de acoplamiento, diferentes tamaños de baterías
  • T440p con CPU de cuatro núcleos disponible
  • muy buen teclado
  • muchos puertos de E / S
  • buena compatibilidad con Linux

Contras:

  • costo relativamente alto, si no hay descuento
  • T440p no tiene botones reales cuando se utiliza el punto de seguimiento (pero acostumbrarse)
  • T450 no tiene puerto de acoplamiento si se compra con GPU dedicada

No malgastes tu dinero en una computadora portátil elegante porque tus problemas se superarán. .

Los científicos de datos resuelven tres problemas comunes de datos. Volumen, velocidad y variedad. Si usted es un científico de datos de volumen o velocidad, la mejor computadora portátil para usted será la que le permita más fácilmente:

  • Conéctese a los sistemas donde se resuelven sus problemas reales.
  • Cree e implemente ejemplos reproducibles de sus problemas.

Si trabaja con frecuencia en el tercer V, problemas de variedad, puede valer la pena comprar una computadora portátil costosa, pero esto rara vez es beneficioso. Aquí hay algunas recomendaciones básicas:

  • Mínimo 8 GB de RAM (para que pueda cargar / crear una cantidad razonable de datos de prueba)
  • Mínimo 4 núcleos (para que pueda probar la eficiencia con paralelo en n-1 núcleos)
  • SSD de 512 GB (la mayoría de sus datos reales vivirán en la nube pero sus muestras serán pequeñas)
  • SO con sabor a Linux (Windows no se conecta bien y requiere muchos extras para adaptarse a un flujo de trabajo típico que terminará en la nube)

Si está haciendo un trabajo que requiere procesamiento de GPU, es posible que desee considerar una computadora portátil que no tenga gráficos integrados, pero realmente se va a vender a sí mismo tratando de hacer el procesamiento de GPU en una computadora portátil (lea: obtenga una computadora de escritorio )

Si su análisis está escalando más allá de la necesidad de 8 gb de RAM, realmente debería estar usando recursos temporales en la nube. El costo / beneficio siempre funciona en contra de la compra de una “mejor computadora portátil” y creo que eso será válido durante mucho tiempo con Linode, AWS, Microsoft y Digital Ocean que venden una potencia de cómputo increíblemente barata.

Personalmente, estoy usando una Dell XPS 13 Developer Edition (Ubuntu), y puedo decir que esto es hermoso, pero más poderoso de lo que realmente necesito de una computadora portátil.

Es un problema de NP.

Hace 40 años que estoy buscando la mejor computadora portátil para cálculos y visualizaciones de datos pesados. Sucede que la industria de TI logra producir una mejor computadora cada 6 meses. Compro uno de vez en cuando. Por lo general, es solo para notar que no hace mucho más que el anterior para el trabajo de datos que necesito.

Comencé con FORTRAN en algo así. No podía escuchar música, mirar televisión, hablar con amigos o leer Wikipedia, pero créanme, por la combinación de números se comparó con mi nuevo Lenovo Yoga. Un poco más ruidoso sin embargo.

Por lo tanto, mi consejo: compre una computadora portátil con un monitor y teclado con los que se sienta cómodo, y en caso de que realmente necesite más tiempo de CPU, compre un poco en una computadora súper paralela en el ciberespacio. Sin embargo, tenga en cuenta que la carga de datos y la descarga de resultados requieren bastante tiempo y que pierde totalmente la interacción con los cálculos.

Yo diría una computadora portátil con una GPU. No mucho mas. Una computadora portátil de alta calidad puede ser muy costosa y seguirá estando a años luz de una estación de trabajo o clúster profesional. Una computadora portátil estándar es suficiente para la mayoría de los usos básicos en ciencia de datos: programación, prueba de su código en el conjunto de datos de juguetes, lectura de documentos … Tener 8 núcleos en lugar de 4 puede hacer que su código se ejecute dos veces más rápido … Si lo hizo lo suficientemente bien como para usar la computación paralela , y nunca compensará una mala implementación en [math] O (n ^ 3) [/ math] en lugar de [math] O (n ^ 2) [/ math] por ejemplo.

El único consejo que tengo es elegir uno con una GPU para familiarizarme / practicar la implementación de la GPU, porque es una habilidad muy útil para algún aspecto del trabajo.

Con respecto al sistema operativo o al constructor, obtenga uno con el que le guste trabajar. Empíricamente, la distribución basada en macOS y Linux (en Dell en general) es dominante a mi alrededor, pero si desea usar Windows, hágalo.


Al final, una computadora portátil de ~ 1000 $ es suficiente para aprender los conceptos básicos de la ciencia de datos y entrenar sus habilidades de programación. Y, por otro lado, invertir en una computadora portátil de 4k $ no será suficiente para escalar con un conjunto de datos “profesional”, y tampoco lo convertirá en un mejor científico de datos.

Yo uso un Asus G74S. Es una computadora portátil gigante para juegos (no soy un jugador). La razón por la que uso esta máquina es porque:

  • La pantalla es enorme. Creo que las pantallas más grandes y más espacio en la pantalla son muy importantes para mi propia productividad.
  • Tiene dos bahías de disco duro. Tengo el sistema operativo en un SSD y luego almaceno archivos más grandes en la segunda unidad de disco convencional.
  • La máquina admite hasta 16 GB de RAM, la mía tiene 12 y esto ha sido suficiente
  • El procesador es rápido (Intel Core i7-2630QM)
  • Tiene un puerto lateral adicional para un segundo monitor. Cuando estoy en casa uso una configuración de monitor dual.

Los mayores inconvenientes son:

  • Es muy grande
  • Es muy pesado
  • La batería no dura mucho

Nota: El G74S probablemente tenga fecha. Creo que ASUS tiene opciones similares con componentes más modernos. Otros fabricantes tienen ofertas similares también.

Nuestro equipo de ciencia de datos @ en EverythingMe usa computadoras portátiles Lenovo w540, configuradas con 32 GB de RAM y, a veces, un disco duro adicional para que puedan ejecutar las tareas que consumen más recursos de forma local y remota cuando sea necesario.

Las ventajas son claras de 32 GB de RAM y toda la potencia que necesita, al igual que las desventajas: es bastante grande.

Personalmente, creo que la mejor computadora portátil para cualquier usuario avanzado es una computadora portátil para “juegos”. Las características que lo hacen deseable para un jugador (CPU y GPU rápidas, gran cantidad de memoria RAM, disco de estado sólido, pantalla grande de alta calidad) también lo hacen deseable para cualquier otra persona que necesite un alto rendimiento y pase una parte sustancial de sus horas de vigilia usando eso.

La única diferencia real entre una “computadora portátil para juegos” y una “estación de trabajo móvil” es cosmética. Eso, y la computadora portátil para juegos generalmente tiene mejores especificaciones por un precio más bajo.

Las mejores computadoras portátiles para el análisis de datos

  • 1. MacBook Pro de 15 pulgadas con pantalla Retina
  • 2. Estación de trabajo móvil Lenovo Thinkpad W541
  • 3. Asus Rog GL552VW- DH74 Laptop
  • 4. Lenovo Ideapad Y700-17 ”
  • 5. Acer Aspire V15 Nitro Black Edition
  • 6. Apple MacBook Pro 13 pulgadas con pantalla Retina
  • 7. Estación de trabajo móvil HP ZBook 15 G2
  • IBM`s i2 Analyst Notebook

Para el científico de datos , sugeriré esto

DELL O LENOVO O HP

La mejor computadora portátil para el uso diario de mi lado Lenovo ideapad i5, que es inferior a 50000.

Lenovo Ideapad 80TV0071IH Portátil de 39,62 cm (15,6) (Core i5 (7a generación) / 4 GB / 1 TB / Windows 10 Home 2 GB) →

Características de Lenovo:

  • Intel Core i5 de 7.a generación
  • 4 GB de RAM DDR4
  • Disco duro de 1 TB
  • Pantalla Full HD de 15.6 “, Windows 10

HP :

Compre una computadora portátil Dell Inspiron 5559 de 15.6 pulgadas (Intel Core i5-6200U / 8 GB / 1 TB / Win 10 / AMD Radeon 2GB DDR3), →

Su costo es de alrededor de 50000 a 55000 solamente.

caracteristicas:

  • MS Office 2016 precargado por valor de 5999 rupias
  • Intel Core i5-6200U 2.30 GHz
  • 8 GB de RAM, sistema operativo Windows 10 Home
  • Disco duro de 1 TB, pantalla de 15,6 “pulgadas
  • Gráficos de 2 GB

Laptop Dell Inspiron 7359 de 13.3 pulgadas:

Laptop Dell Inspiron 7359 de 13.3 pulgadas (Core-i5-6200u / 8 / GB / 500GB / Windows 10), plateado

caracteristicas:

  • 2.3 GHz con Turbo Boost hasta 2.8 GHz
  • Procesador Intel Core i5-6200U de 6.a generación
  • 8 GB de RAM
  • Disco duro de 500 GB
  • Pantalla FHD de 13.3 pulgadas
  • Sistema operativo Windows 10
  • Gráficos Intel HD 52

Portátil HP 15-AY078TX de 15,6 pulgadas:

Laptop HP 15-AY078TX de 15.6 pulgadas (Core i7-6500U / 8GB / 1TB / DOS / 4GB Graphics), Turbo Silver

  • Procesador Intel Core i7-6500U de 2.5GHz
  • 8 GB de RAM DDR4
  • Disco duro Serial ATA de 1TB
  • Pantalla de 15,6 pulgadas, gráficos AMD Radeon R7 M440 de 4 GB
  • DOS
  • Computadora portátil 2.19kg

More Interesting

Soy un estudiante de secundaria interesado en Data Science. ¿Cómo puedo comenzar a aprender y jugar con conjuntos de datos?

¿Habrá un momento en la Tierra cuando todos los datos digitales se vuelvan redundantes?

¿Qué es el álgebra relacional y para qué se utiliza? ¿Cómo se relaciona con la ciencia de datos?

¿Cuáles son algunas de las mejores predicciones / pronósticos que se hayan hecho utilizando el aprendizaje automático y las estadísticas computacionales?

¿Cuáles son algunos buenos proyectos de ciencia de datos?

¿Cómo se utilizan los grandes datos en la industria del petróleo y el gas? La industria del petróleo y el gas ya contaba con sistemas de adquisición de datos e informes implementados para la producción y el mantenimiento. ¿Qué nivel adicional de gestión de datos proporciona Big Data?

¿Hay algún programa de capacitación en ciencia de datos para empleados de H1B que trabajan en otro dominio?

¿Cómo es útil el análisis de datos?

¿Es la estadística aplicada una buena especialidad para la ciencia de datos?

En el aprendizaje automático, ¿por qué utilizamos un tercio de los datos para las pruebas y dos tercios para la capacitación? ¿Es sentido común o hay una razón científica?

¿Cómo se compara KNIME con Alteryx independientemente del factor de fijación de precios? ¿Cúal me recomiendas?

¿Cómo se puede usar Big Data contra nosotros?

¿Son DataFrames el futuro de Spark?

¿Qué es anaconda?

¿Cuáles son algunas áreas de investigación desafiantes / declaraciones de problemas en la minería de datos?