EDIT 12.08.2024: Intel a lansat update-ul de microcod pentru remedierea problemei. Așa cum am dedus și noi, voltajele prea mari sunt sursa degradării.
Articolul original:
De mai mult de un an, utilizatorii procesoarelor intel high-end, în special 13700K/KF, 14700K, 13900K/KF/KS, 14900K/KF/KS, au raportat instabilitate în anumite aplicații sau în jocuri (cum ar fi cele cu engine Unreal 5). Erorile sunt foarte diverse, inclusiv o eroare de memorie video insuficentă. Toate bune și frumoase, doar că erorile cu memorie insuficientă apar inclusiv la sisteme cu RTX 4090, care are 24 GB VRAM.
Problema
Utilizatorii individuali și-au diagnosticat cum au putut calculatoarele, obținând concluzii variate: de la memorie defectă la probleme de soft, de la placa video la procesor. În realitate, din informațiile pe care le avem în acest moment, problema este una complexă și ține în principal de procesor. Elementele care contribuie la problemă sunt:
- Faptul că, spre deosebire de AMD, NVIDIA și orice alt producător normal la cap, intel nu a obligat partenerii (board partners cum ar fi ASUS, GIGABYTE, MSI etc) să respecte limite de putere stricte pentru alimentarea procesorului – limite care adăugau un plus de siguranță în ceea ce privește fiabilitatea. Nu, intel a dat recomandări, care recomandări puteau fi (și au și fost) încălcate de producătorii de plăci de bază. Păi când ești la concurență cu vecinul tău producător de plăci care integrează fix același chipset cu fix aceleași procesoare, normal că te folosești de orice tertip ca să fii în față la performanțe, iar limitele mai mari de putere fix asta făceau, dădeau un spor de performanță.
- Asta nu ar fi fost neapărat o problemă dacă procesoarele în sine erau construite și programate corect. Voi simplifica un pic, în cele ce urmează, dar indiferent de puterea disponibilă din partea plăcii de bază, procesorul are un tabel de voltaje (așa numitul VID) care spune: la frecvența x vreau să îmi furnizezi voltajul y. Acest VID este de fapt mult mai complex, ține cont și de temperaturi și de alți factori, dar în esență este o hartă care spune plăcii de bază ce necesar de curent și voltaj are în funcție de încărcare și frecvențe. Ce să vezi însă: din informațiile disponibile în acest moment, se pare că pentru unele procesoare high-end, VID-ul include valori care sunt unsafe procesor. Mai pe românește, procesorul spune: pentru 6 GHz am nevoie de (să zicem) 1.55V, placa de bază cu limitele încălcate spune: ia 1.55V. Problema e că 1.55V e prea mult pentru aceste procesoare.
Ce urmează este o degradare fizică progresivă a procesorului, prin fenomenul denumit electron migration. Pe scurt, voltajul prea mare degradează traseele din procesor și le crește, treptat, rezistența, astfel încât procesorul are nevoie de tot mai mult voltaj pentru a fi stabil la o frecvență dată. Dacă procesul continuă, procesorul sfârșește prin a fi instabil la setări default, chiar și în sarcini foarte ușoare, moment în care poți deja să îl faci breloc. Sau să îl trimiți la garanție.
Problema este greu de diagnosticat pentru utilizatorii casnici și concluziile apar tardiv, când procesorul deja a dat ortu' popii. Din acest motiv, shitstorm-ul media apare abia acum, când procesoarele din retail încep să pice pe capete. Țineți minte, problema nu se manifestă de la început și degradarea este în cele mai multe cazuri foarte treptată.
Configurația noastră (work in progress)
În urma problemelor apărute, am decis să publicăm un set de limite pe care am început să le aplicăm la sistemele vândute de noi. Sistemele noastre care conțin procesoarele potențial vulnerabile au plăci de bază Gigabyte Z790, ca urmare ghidul de mai jos este adresat acstora. Totuși, valorile folosite ar trebui să fie valabile și pentru plăcile Z790 de la alți producători (doar că denumirile setărilor e posibil să fie diferite). Setările pe care noi le folosim sunt:
- XMP activ
- Power Limit 1 (PL1) limitat la 253W
- Power Limit 2 (PL2) limitat la 280W
- Core Current Limit 350A pentru procesoarele Intel 14900K și 320A pentru 14700K și 13900K
- IA VR Voltage limit 1500mV
Aceste setări sunt testate, stabile și afectează performanța într-o măsură foarte mică – aproximativ 5% în medie. Am decis să nu umblăm la setări mai avansate, cum ar fi LLC (Load Line Calibration) și AC Loadline, pentru că setările respective se aplică la fiecare procesor în parte, nu universal, și necesită ore întregi de teste. Am preferat setări ceva mai simple, care elimină, cel puțin din informațiile pe care le avem în acest moment, problema degradării procesoarelor vizate.
NOTĂ: pentru procesoarele care sunt deja degradate, care nu mai sunt stabile la setările default, aceste setări nu fac decât, în cel mai bun caz, să le mărească stabilitatea. Degradarea este ireversibilă și se manifestă prin instabilitatea PC-ului în utilizarea normală. Recomand în acest caz să mergeți cu procesorul la garanție.
NOTĂ 2: e posibil ca în urma update-ului de BIOS sau din varii motive, aceste setări să nu mai fie prezente. Verificați prezența lor chiar și pe sistemele care vin de la noi.
Pasul zero (opțional) este să faceți update la BIOS la ultima versiune non-beta. Pentru cine nu știe să facă update la BIOS la plăcile Gigabyte Z790, există tutoriale pe YouTube. Momentan nu recomand neapărat să vă repeziți la ultima versiune de BIOS, pentru că producătorii de plăci de bază au lansat tot felul de versiuni care de cele mai multe ori castrează performanțele sistemului, în lipsa unei soluții clare de la Intel.
Pasul 1 este să intrați în BIOS. Pentru asta, deschideți PC-ul și apăsați repetat tasta Delete până când apare imaginea, apoi continuați să apăsați până întâlniți un ecran ca acesta (atenție, culorile pot diferi, cele mai multe plăci de bază au fundalul negru în BIOS):
Puteți alterna între modul simplu și modul avansat apăsând tasta F2. Primul pas este să verificați, în modul simplu, dacă aveți XMP și Re-Size BAR Support activate. Aceste setări nu au legătură cu problema, dar vor spori performanțele PC-ului și noi le ținem activate. Mergeți deci în modul simplu, apoi click cu mouse-ul pe setarea XMP, apoi selectați XMP1 sau ce setare apare acolo (poate scrie și EXPO, e același lucru). Dați apoi switch-ul de la Re-size BAR Support în poziția Pornit:

În pasul următor, treceți înapoi în modul Avansat apăsând F2. În tab-ul Tweaker, intrați în meniul Advanced CPU Settings (puteți face asta fie prin double click pe setare fie cu săgețile de pe tastatură și apoi Enter). În acest meniu, mergeți până jos de tot (fie apăsați tasta End pe tastatură, fie dați scroll cu Page Down etc.) și selectați Turbo Power Limits, apoi Enabled.
Imediat ce faceți asta, vor apărea sub Turbo Power Limits opțiuni noi. Setați valorile pentru Package Power Limit1, Package Power Limit2 și Core Current Limits în funcție de modelul procesorului.
Setările pe care le folosim noi sunt următoarele (dar puteți încerca și valori mai mici, ca să vedeți impactul asupra performanței):
| 13700K/13900K | 14700K | 14900K | 14900KS | |
| Package Power Limit1 | 253 | 253 | 253 | 253 |
| Package Power Limit2 | 253 | 280 | 280 | 320 |
| Core Current Limit | 320 | 320 | 350 | 380 |
Ca să scrieți valorile în câmpurile respective, mergeți cu cursorul până la poziția respectivă apoi scrieți pe tastatură valoarea.
Următorul pas este să apăsați Escape pe tastatură până ajungeți din nou în meniul de bază Tweaker. Alternativ, puteți da click pe orice alt tab și apoi din nou pe tab-ul Tweaker. În meniul Tweaker, navigați până jos de tot, la opțiunea Advanced Voltage Settings și intrați în submeniul corespunzător (cu Enter când opțiunea e selectată sau cu dublu click de mouse). În meniul care apare, mergeți la CPU/VRM Settings, dați Enter sau dublu click, apoi la Internal VR Control (Enter sau dublu click).
In meniul Internal VR control, căutați opțiunea IA VR Config Enable, dați dublu click pe ea sau apăsați Enter, apoi selectați Enabled. După ce selectați Enabled, vor apărea mai multe setări. Mergeți la IA VR Voltage Limit și scrieți 1500. Puteți încerca valori și mai mici (chiar și 1400) dacă vreți să fiți mai în siguranță, dar cu cât este mai jos valoarea, cu atât procesorul va scădea mai mult frecvența de boost maximă.
Ce face aseastă setare? Practic, valoarea asta este valoarea maximă a tensiunii (voltajului) pe care placa de bază i-o „anunță” procesorului ca fiind disponibilă. Dacă să zicem un 14900K vine la placa de bază și zice, conform hărții VID interne a lui, „pentru 6000MHz am nevoie de 1.57V”, placa va spune „nu avem”. Procesorul se uită înapoi la VID și spune „ok, pentru 5900MHz am nevoie de 1.51V”, placa spune din nou nu. Procesorul cere apoi pentru 5800MHz 1.48V, moment în care placa îi furnizează voltajul cerut.
Este o simplificare a procesului, dar ce se întâmplă este că procesorului îi vor fi refuzate valori ale voltajului mai mari de 1.5 V (în cazul în care puneți 1500 acolo), iar procesorul nu va mai folosi frecventele la care voltajul respectiv era necesar. Diferența dintre această setare și o scădere manuală a frecvenței de operare este că folosind IA VR Voltage Limit, procesorul va face boost până la frecvența maximă pentru el, în particular, pentru că fiecare procesor are alt tabel VID, în funcție de calitatea CPU-ului.
De exemplu, un procesor mai slab va avea nevoie de voltaje mai mari pentru atingerea aceleiași frecvențe față de un procesor mai bun (silicon lottery, cum zice americanul), deci cu limita asta pusă, va folosi mai puțin boost. Invers, un procesor bun va fi mai puțin constrâns de valoarea asta, pentru că nu are nevoie de un voltaj așa mare pentru a ajunge la aceeași frecvență de boost.
O consecință directă a acestui mecanism este că setarea acestei limite nu dăunează stabilității, pentru că placa de bază nu dă mai puțină tensiune electrică procesorului. Nu, aceasta doar refuză voltajele peste limită, iar procesorul trece la frecvența imediat inferioară corespunzătoare voltajului sub pragul prestabilit.
Revenind, după ce ați făcut toate aceste configurări, tot ce mai e de făcut e să salvați setările și să ieșiți din BIOS. Pentru asta, apăsați F10 pe tastatură, apoi Yes. Calculatorul e posibil să repornească ceva mai greu, dar nu vă panicați, așteptați cam un minut.
Ce o să remarcați din start sunt temperaturi (uneori semnificativ) mai bune în funcționarea în full load. Performanțele nu vor fi afectate semnificativ și o să puteți sta mai liniștiți știind că procesorul nu se va sinucide pe termen lung.
Atenție: acestea sunt valorile pe care noi le folosim pentru PC-urile vândute de noi. În afară de rata de retururi și know-how-ul despre CPU-uri, nu avem vreun studiu care să certifice dacă problema este eliminată complet. Totuși, în cel mai rău caz, aceste setări vor crește fiabilitatea sistemului prin scăderea temperaturilor și a tensiunii, curentului și puterii utilizate de procesor, în condițiile unei diminuări foarte mici a performanțelor, deci rău nu pot face.
În a doua jumătate a lui August, Intel a anunțat că va lansa un update de microcod (care se va regăsi și în BIOS-urile noi ale plăcilor de bază) care va elimina riscul de deteriorare pentru procesoarele 13700K/KF, 13900K/KF/KS, 14700K/KF, 14900K/KF/KS. Deocamdată nu știm ce modificări va conține acel update, dar vă ținem la curent.
Surse: Intel, Actually Hardcore Overclocking și altele.











