Con chips de CPU que tienen miles de millones de transistores, ¿qué sucede si algunos se estropean durante el funcionamiento normal dentro de una PC, un teléfono inteligente?

Una vez que la CPU se envía al ensamblaje del cliente, no hay forma de evitar / reemplazar un transistor defectuoso.

Una vez que el / los transistor / es no funciona bien, la probabilidad de que el producto falle es alta. No todos los transistores defectuosos tendrán un impacto mortal, ya que depende de la función IP, el tipo exacto de dispositivo y la naturaleza de la falla del transistor.

En pocas palabras: un solo transistor que funciona mal puede matar completamente a toda la CPU, sin embargo, las posibilidades de esto son pequeñas. En la mayoría de los casos, la falla de un solo transistor conducirá a una pérdida parcial de la funcionalidad de la CPU.

Más aquí: la respuesta de Daniel Fishman a ¿Están los transistores muertos individualmente, o los transistores en una CPU u otros componentes siempre están juntos? ¿Es posible reciclar transistores funcionales en un componente muerto?

“Con los chips de CPU que tienen miles de millones de transistores, ¿qué sucede si algunos se estropean durante el funcionamiento normal dentro de una PC, un teléfono inteligente?”

Dependiendo de la naturaleza de la falla, pueden suceder varias cosas. La CPU podría comenzar a extraer el exceso de corriente y destruirse por sobrecalentamiento. Podría dejar de funcionar por completo. Puede arrancar, funcionar correctamente la mayor parte del tiempo pero bloquearse ocasionalmente o cuando se utiliza un software en particular. Puede tener un rendimiento inferior pero funcionar aparentemente de manera normal.

Hace muchos años tuve un Motorola 68030 en mi Amiga, que tenía dificultades con la división de 64 bits. Aproximadamente cada 1000a división de este tipo resultó en 0xffffffff, independientemente de los valores de entrada. Ok, fue ligeramente overclockeado de 25MHz a 60MHz, pero funcionó correctamente durante muchos años antes de desarrollar este extraño error.

Los circuitos integrados envejecen, pero se espera que la lógica digital tenga una vida útil muy larga. Los semiconductores de potencia, que están sujetos a mayores densidades de corriente y temperaturas, pueden envejecer sorprendentemente rápido. La difusión iónica destruye las estructuras de semiconductores de una manera bastante bien comprendida que puede modelarse y calcularse con precisión. La hoja de datos de dispositivos de alimentación a menudo contiene gráficos de vida útil esperados en función de la temperatura y corriente del troquel. Lo más sorprendente para mí fue un interruptor de alimentación de semiconductores, que fue calificado para 5000 operaciones solamente.

Uno de los beneficios de la integración de circuitos a gran escala es que la probabilidad de que falle un solo transistor es prácticamente inexistente, ya que la confiabilidad de un chip en su conjunto no es realmente menor que la de un transistor discreto a pesar de la presencia de miles de millones de elementos activos en el chip. Por esta razón, las fallas de un solo transistor son prácticamente desconocidas. Es más probable que una falla involucre a miles o millones de transistores a la vez, con una falla catastrófica del dispositivo.

También se deduce que todos los transistores en un chip dado tienen las mismas tolerancias o márgenes. Si uno es llevado demasiado lejos, muchos otros también lo están llevando nuevamente a un fracaso catastrófico. Los fabricantes prueban y califican los chips individuales. Los que continúan pasando todas las pruebas incluso a las velocidades más altas se venden como chips de alta velocidad, y los que comienzan a funcionar mal a velocidades más altas se venden como chips más baratos y de menor velocidad.

De todos modos, cuando falla el hardware, generalmente falla de una manera muy obvia que detiene el sistema. Las disfunciones sutiles que permiten que el sistema continúe funcionando son estadísticamente muy poco probables.

Están agrupados más abajo, eso es lo que hace cada fabricante de CPU. Intel, por ejemplo, los cpus mejor clasificados se convierten en i7s, mientras que los que tienen más fallas se convierten en i5s y los que no califican para i5s se convierten en i3s. Es por eso que ves que los cpus aptos para overclock tienen diferentes grados de rendimiento máximo.

Si en el momento en que sucede, se está utilizando el dispositivo, entonces puede ver un comportamiento inesperado dependiendo de qué tipo de transistor explotó.
Pero durante el próximo inicio, el proceso de BIOS / inicio fallará y el dispositivo no podrá iniciarse solo debido a que falla alguna comprobación previa al inicio.

PD: No tengo evidencia de lo que digo y es solo un pensamiento 😛