La electromigración es uno de los mayores riesgos que se han de evitar a la hora de hacer overclocking a nuestro procesador o tarjeta gráfica. Este fenómeno físico es el gran responsable de que un proceso de overclocking mal hecho acabe rompiendo nuestro procesador o provocando que necesite más voltaje para alcanzar el mismo nivel de frecuencia. Es lo que solemos conocer como tener la CPU degradada.
Sin duda, la mejor arma para evitar la electromigración es conocerla, saber qué la causa y qué provoca, y sobre todo cómo hacer un mejor overclocking que evite este efecto. En este artículo lo analizaremos en profundidad. ¡Comenzamos!
Índice de contenidos
La electromigración a nivel físico
Vamos a explicar intentando dar una explicación básica de lo que ocurre en este proceso a nivel electrónico. No somos físicos, pero tampoco pretendemos dar una exposición excesivamente avanzada y perfecta. Queremos que os hagáis una idea de lo que implica la electromigración.
La electromigración no afecta a los transistores directamente, sino que afecta a las partes metálicas de la CPU. Hablamos de las microscópicas conexiones internas de cobre del chip, que podríamos definir coloquialmente como los “cables” que unen los transistores. De vez en cuando, alguno de los electrones que está pasando golpea un átomo del material metálico pudiendo desplazarlo mínimamente.
Cuando esto ocurre demasiadas veces, entonces la conexión se debilita de forma notable, reduciendo su sección, lo que hace que la densidad de corriente que pasa por ella aumente. Incluso en un peor caso se puede llegar al desenlace fatal de que el chip deje de funcionar porque demasiadas de estas conexiones están dañadas y ya no se puede conducir correctamente la electricidad por su interior.
Resumamos un poco el fenómeno que acabamos de explicar pensando en un cable de tamaño normal con dos conexiones. Si el interior de cobre se debilita y se reduce la sección, seguirá pasando la misma corriente, pero lo hará en un conductor con una corriente máxima soportada inferior, por lo que una vez ocurre seguirá debilitándose. Este es el gran problema, que lo que ocurre una vez tiene un efecto irreversible.
¿Cuáles son las causas de la electromigración?
La temperatura es una de las grandes causas de la electromigración, y es algo que también tiene una explicación física. El silicio es un material que tiene un coeficiente de temperatura α negativo, y para entender lo que implica debéis tener en cuenta la fórmula de variación de la resistencia eléctrica con la temperatura: R = R0 ( 1 + α * ΔT). Esto significa que cuando el coeficiente de temperatura es negativo entonces un aumento en la temperatura provoca una reducción en la resistencia del silicio, y por tanto un aumento del flujo de electrones al aumentar la corriente. Así se empeora la electromigración.
De hecho, lo que mejor prueba esta idea es que esa es la causa de que se use el nitrógeno líquido para hacer overclocking extremo, ya que al conseguir llevar al procesador a temperaturas bajo cero entonces conseguimos un ΔT negativo que provoca un aumento en la resistencia del silicio de la CPU, y por tanto la cantidad de corriente que pasará a una igualdad de voltaje será muy inferior, y se puede aumentar el voltaje muy por encima de los límites seguros sin problemas. Está claro que esto es algo que no podemos conseguir en la práctica, para un equipo normal.
Aquí entra precisamente el segundo gran causante de la electromigración, que es el voltaje que se le aplica a la CPU. Conforme este aumenta, se incrementa la corriente y por ello el flujo de electrones dentro del procesador, además de subir la temperatura, por lo que sin duda es el cóctel perfecto para que ocurran los problemas de degradación. Luego os explicaremos más a fondo hasta qué punto se puede dar esto, ya que es evidente que hay unos márgenes de voltaje y temperatura relativamente seguros.
¿Y sus consecuencias? Cómo detectar la degradación del procesador
Hemos visto la explicación intuitiva de lo que ocurre en la electromigración a nivel eléctrico, y también las causas que lo provocan, y la verdad es que resulta bastante sencillo deducir cuáles son las consecuencias en nuestro procesador y en nuestra experiencia diaria.
La consecuencia más obvia sería que el chip dejase de funcionar, directamente. Pero para matar a un chip se necesita muchísimo tiempo, se tienen que estropear suficientes conexiones dentro de la CPU para poder dejar de funcionar, algo que no ocurre con facilidad ni siquiera en casos relativamente importantes.
En la práctica, empezaréis a notar cómo se está desarrollando la electromigración cuando se apaga el PC o hay un crasheo del overclocking al realizar una tarea muy demandante, como una renderización o una prueba de estrés. Ese es el primer gran indicativo de que tu CPU se está degradando, pues implica que ahora necesita más voltaje para forzar a los electrones a pasar por todas esas conexiones rotas o debilitadas.
Mucha gente sufre este problema, piensa que tan solo se debe a que el voltaje que tenían en un principio era bajo, así que lo subirán y se quedarán tan alegres porque ahora la CPU vuelve a funcionar perfectamente. Si habéis estado atentos al artículo, sabréis bien que lo que han hecho ha sido empeorarlo.
Derivado directamente de esto, la otra consecuencia directa que se puede notar es que los márgenes de frecuencia alcanzables son inferiores, y que ahora el nivel de frecuencia que podréis alcanzar de forma estable a la misma cantidad de voltaje será bastante peor. En resumen, a igualdad de frecuencia se necesita más voltaje, e incluso con más voltaje se puede perder frecuencia máxima alcanzable.
Casos particulares
La electromigración depende en gran medida del chip concreto con el que tratemos y su proceso de fabricación. Y es que según cómo se haya fabricado tendremos márgenes de voltaje tolerables muy distintos.
Disclaimer: como te explicaremos, estos márgenes de voltaje no son una “verdad absoluta” aplicada a todos los casos. No hagáis OC tomándolo como tal.
Por ejemplo, en la primera y segunda generación de Ryzen (con procesos de fabricación de 14nm y 12nm) la propia AMD pone como límite razonable alrededor de 1.425 voltios, ya que a esos niveles se mantendrán unos buenos márgenes de corriente. Para el proceso de 7 nanómetros, que sepamos AMD no se ha pronunciado oficialmente al respecto así que no podemos hacer grandes afirmaciones. En todo caso, el consenso generalizado que hay entre los expertos suele rondar la zona de los 1.3 voltios para cargas fuertes en la CPU. En usos más livianos como la mayoría de los juegos se puede llegar incluso a acercarse a los 1.5V sin problemas, pero esto ya es un riesgo añadido que cada usuario debe decidir si asume o no.
Destacar que, ya que AMD no ha dicho nada oficialmente al respecto, estos “márgenes consensuados” se basan en las pruebas realizadas por expertos en base al funcionamiento del algoritmo de boost.
¿A qué se debe esta diferencia? Es algo que tiene que ver con la densidad de transistores de la CPU. En un proceso de 7nm la separación mínima que podemos ver entre los transistores es muy inferior, acomodaremos más en un espacio mucho menor, y por lo tanto estas conexiones internas que pueden causar la electromigración serán mucho más sensibles.
Esta densidad de transistores influye en la densidad energética del chip. Esta es una medición muy interesante: se hace en W/mm2 (potencia por unidad de superficie) y da una buena visión de cómo de estresados están las conexiones internas de la CPU.
Ojo: hay que tener muy en cuenta una cosa. El margen de voltaje seguro depende específicamente de las características exclusivas de cada silicio. Es decir, cada chip es un mundo. Todos sabemos que esto es así para los márgenes de overclocking alcanzables, pero también para los límites de voltaje seguros. Por ejemplo, un chip Zen 2 de 7nm con un overclocking a un voltaje de 1.325V en el que se usan muchas cargas pesadas podría acabar degradándose a los pocos meses, simplemente porque no es una buena muestra.
Vayámonos ahora a Intel, donde evidentemente también se aplican los principios antes mencionados. La compañía lleva varios años con el mismo proceso de fabricación, aunque con ligeras variaciones, por lo que es más fácil hablar de los límites de voltaje que encontramos. El consenso generalizado ronda los 1.45 voltios. Pero se habla de una especial sensibilidad a la temperatura, por lo que es necesario mantenerlo por debajo de los 80 grados si queremos tener ese voltaje. Esto con algunas CPU y sistemas de refrigeración es imposible por lo que el límite práctico está por debajo.
Os recordamos que todos los voltajes que os hemos dado son valores orientativos que no tienen por qué aplicarse a todos los chips, además de que solo estamos hablando del voltaje del núcleo y no de otros voltajes como el del SoC en AMD o System Agent en Intel.
La importancia del contexto y cómo influye el uso que se le dé a la máquina
Está claro que no es lo mismo hacer un “OC inseguro” en un equipo que se va a dedicar predominantemente a jugar que uno en el que se van a hacer renderizaciones pesadas. No solo por la duración de los períodos de alta carga a la CPU, que cuanto más largos sean más la degradarán, sino también por la propia naturaleza de esa carga. Un juego no suele estresar en exceso al procesador, mientras que en el caso contrario podemos tener una aplicación que haga uso de todos sus núcleos a la vez y con instrucciones complejas y demandantes como AVX, por ejemplo.
Por eso, una persona que sea totalmente consciente de lo que está haciendo y solo planee dedicarse a jugar podría hacer un overclocking un poco más allá de los límites considerados seguros para así obtener una frecuencia bastante mayor, y no sufriría electromigración. Pero es algo que hay que saber hacer muy bien y que evidentemente acarrea riesgos. Lo mejor para calibrar esto es ver qué ocurre con la temperatura, aunque fuerces bastante el voltaje, si tienes unos datos de temperatura razonables y no vas a aplicar cargas exageradas entonces podrías estar tranquilo.
Por poner un ejemplo, la propia AMD sabe esto bien, de ahí que sus algoritmos de boost lleven a la CPU por encima de los márgenes de voltaje máximos seguros en sus algoritmos de boost cuando la carga del procesador no sea excesiva. Y es que la culpa no es directamente del voltaje, sino de la densidad de corriente por unidad de superficie que haya dentro del procesador, que evidentemente aumenta si subimos el voltaje, pero si la demanda de la CPU es baja estará en niveles mucho más bajos.
Otro punto tremendamente relevante, hablando del contexto, es que tendremos mucho más margen de overclocking seguro con CPUs con menos núcleos dentro de una misma arquitectura. Por ejemplo, un Intel Core i5-10600K es muchísimo más fácil de OCear que un Intel Core i9-10900K, pues comparten sustrato, arquitectura, proceso de fabricación y núcleos solo que este último tiene 4 más, de tal forma que su consumo con OC es mucho mayor, su densidad de corriente por superficie aumenta, y los márgenes para evitar electromigración son menores.
Otra cosa que os queremos comentar es que el overclocking automático de las placas base suele ser más peligroso de lo normal. Todos los fabricantes incluyen sus opciones de OC con un click, con las que se pueden conseguir aumentos de frecuencia bastante interesantes, pero en la mayoría de los casos se exceden mucho con el voltaje. De hecho, hemos visto muchos casos de gente que ha usado estas opciones con CPUs con disipadores muy buenos, pero que gracias al voltaje tremendo forzado por la placa han pasado a tener temperaturas excesivamente altas, creando un peligro real de electromigración.
Entonces, ¿cómo realizo un overclocking adecuado para evitar la electromigración?
Realizar un overclocking bueno depende infinitamente de las tareas que hagas en tu equipo. Si te dedicas al encoding, renderizado, cálculos complejos, tareas científicas, etc, entonces demandarás mucho de la CPU y por lo que te hemos explicado debes tener mucho cuidado, con voltajes reducidos (por debajo de 1.3 voltios en la mayoría de plataformas), o si te acercas los máximos recomendados deberías mantener unas buenas temperaturas. Un dato arbitrario de referencia serían los 75 grados.
¿Tareas pesadas durante muchas horas? Voltajes bajos y temperaturas controladas.
Si únicamente te vas a dedicar a jugar, entonces el margen con el voltaje será mucho mayor y podrás irte a voltajes cercanos a los límites recomendados, siempre buscando respetar las temperaturas.
En caso de que tu sistema de refrigeración no consiga mantener unos buenos números, simplemente rebaja tus aspiraciones y pon un voltaje más seguro, donde tener una temperatura «alta» no será un problema.
En el caso de los juegos, hay mayor seguridad con el voltaje, pero si te acercas a los máximos recomendados (arriba te indicamos los valores según la CPU) mantén temperaturas bajas.
También os queremos aclarar que en las últimas CPUs de AMD el overclocking manual no es una idea interesante. El motivo es básicamente que podemos conseguir mejores rendimientos jugando con su algoritmo de boost y opciones como el PBO (Precision Boost Overdrive). En la práctica, solo tiene sentido el OC manual si tenemos una necesidad específica de mayor rendimiento multinúcleo, ya que en el mononúcleo y el rendimiento general podemos acabar perdiendo.
En el caso de Intel, el hecho de que lleven tantos años madurando el mismo proceso de fabricación tiene la ventaja de que ahí sí se consiguen márgenes interesantes de overclocking manual, pero siempre de acuerdo a las indicaciones que te acabamos de dar.
¿Cuánto tiempo puede tardar en aparecer? ¿Hay que obsesionarse con las temperaturas?
Una pregunta que os estaréis haciendo todos es: ¿cuánto tiempo tardará en aparecer la electromigración si no he hecho un overclocking adecuado? La respuesta no es fija, y según el caso podremos hablar de varios meses o varios años.
Mucha gente usa como argumento en contra del OC que “la CPU durará muchos menos años”. Realmente los que hayáis estado atentos al artículo ya habréis entendido que es una cuestión de cómo se hacen las cosas, y no implica automáticamente que el hecho de hacer OC acabe derivando en fenómenos de degradación que rompan el procesador.
Una CPU muy mal overclockeada por encima de los voltajes seguros que se dedique 24/7 a tareas pesadas puede durarnos apenas un par de semanas. Pero en un overclocking normal, tomando nuestras directrices, donde incluso quizás puede haber un voltaje superior al deseable, pero que el uso que se le dé al ordenador resida en juegos y algún renderizado esporádico podría durar varios años. Todo depende de cada caso, pero podemos hablar de 2, 3, 4, 5, 6 años… Todo esto hasta empezar a notar que hay crasheos con el overclocking, es decir, unos síntomas preliminares de electromigración de los que uno puede olvidarse bajando el OC para así tener más años de procesador.
Si tienes un voltaje excesivo y usas la CPU en muchas tareas que consumen mucho, puedes quedarte sin CPU en 1 año. Pero eso es hacer las cosas sin cabeza. Un OC razonable tardará años en dar cualquier síntoma de electromigración.
Si has sufrido degradación por electromigración, entonces has de entender que no existe una cura milagrosa que vaya a recuperar el estado normal de tu CPU. Pero eso no significa que tengas que tirarla a la basura, y mientras funcione puedes salvarlo simplemente bajando tu overclocking.
Oxide Breakdown, donde el voltaje sí tiene un papel protagonista
En el artículo hemos hablado del voltaje como una de las causas de la electromigración, pero incidiendo más bien en lo que se deriva de la subida del voltaje como son las mayores temperaturas o el aumento de la corriente, y no tan específicamente como culpa del voltaje en sí. Por eso os hemos dicho que llevar los voltajes más allá de los límites razonables no tiene por qué causar electromigración si no se dan ciertas condiciones.
Sin embargo, sí hay un fenómeno distinto que se suele confundir con la electromigración y que está afectado por el voltaje. Se llama oxide breakdown y afecta directamente a los transistores de la CPU, no a las conexiones internas como la electromigración. Además, sus efectos son totalmente diferentes.
El oxide breakdown es muy fácil de causar si aplicas un voltaje excesivo. El mismo hecho de poner demasiado voltaje (imaginemos, por ejemplo, 1.8V) durante un período de tiempo corto y a temperatura ambiente va a pasar este efecto. Sus consecuencias son catastróficas, pues en cuestión de segundos y sin hacer nada especial se puede estropear completamente la CPU. Esa es la diferencia fundamental con la electromigración, donde los posibles efectos pueden manifestarse a un plazo mucho más largo.
Si pones un voltaje demasiado excesivo y la CPU se rompe casi al momento, ha ocurrido ‘oxide breakdown’ y no electromigración. La electromigración puede estar dándose durante meses o años sin que muestre efectos claros ni afecte a tu OC.
En el mejor de los casos, un efecto de oxide breakdown no provocará que la CPU se rompa directamente, sino que va a dejar de funcionar a ciertos voltajes y se perderá frecuencia de OC máxima.
El punto para causar el oxide breakdown se suele considerar por encima de 1.5V en los procesos de 14nm de Intel y por encima de 1.8V en la tercera generación de Ryzen. Como veis, solo ocurrirá en los casos más extremos.
Conclusiones
Todos los overclockers saben que uno de los mayores demonios a los que se enfrentan es la degradación de su procesador. Esta ocurre por un fenómeno eléctrico denominado electromigración. Cuando ocurre, sus CPUs dejan de sostener el nivel actual de overclocking y empiezan a requerir unos niveles de voltaje mucho más elevados para poder funcionar.
Este efecto empieza a manifestarse cuando se realiza un overclocking inadecuado del procesador, combinado con un uso intensivo del mismo. Por eso, es muy importante mantener unos voltajes adecuados en el OC, y en caso de usar un voltaje alto vigilar mucho las temperaturas y el uso que se le da al procesador. Y es que a la hora de hacer OC intentando evitar este problema no es lo mismo que nos vayamos a dedicar a renderizaciones de varias horas que al gaming: en este último caso tenemos mucho más margen para jugar con nuestro procesador.
Te recomendamos la lectura de nuestros artículos:
- Undervolting a tu tarjeta gráfica: ¿Es buena idea?
- NVIDIA Turing vs Ampere: comparativa con benchmarks y videojuegos
- Refrigeración líquida AIO: las ventajas e inconvenientes que debes conocer antes de comprar
- Disipador RAM ¿Son necesarios o es mejor una RAM sin disipador?
- ¿Qué es el núcleo de un procesador?
En este artículo hemos dado una importante serie de ideas para entender cómo evitar la electromigración según la CPU usada, después de introducir los fundamentos físicos, las causas y las consecuencias del fenómeno. Entre otras claves, también hemos hablado de por qué en las últimas CPU AMD jugar con el algoritmo de boost puede ser mejor idea que overclockear, y hemos introducido un efecto muy parecido al de la electromigración pero con unas causas muy distintas, el oxide breakdown. Una visión profunda de los mayores enemigos de nuestro OC de CPU.
Esperamos que este artículo te haya servido para plantarle cara al gran enemigo que es la electromigración, y realizar tus overclockings con más tino y cabeza.