Nehalem Preview: Intel colpisce ancora!

Dopo due anni dall'uscita del primo processore con micro-architettura Core Intel sembra voler dare un'ulteriore scossone al mondo delle CPU. Dopo aver aggiornato il Conroe con il Penryn, nient'altro che una revision del Conroe rispetto al quale sono stati ridotti i consumi e sono state aumentate leg

Non un solo Nehalem, ma due!
Come si può leggere nelle varie notizie che si trovano online, il nuovo processore prodotto da Intel è già di per se molto stabile, il problema è che è stato nelle mani dei produttori Taiwanesi di schede madri per troppo poco tempo ecco quindi che l'unica scheda madre matura per questo chip è quella prodotta dalla Intel stessa che si basa sul nuovo chipset X58. I setup che sono stati utilizzati dai ragazzi di Anadtech sono due e anche se il tempo a loro disposizione era molto poco vediamo di riassumere i risultati che sono stati ottenuti.
Le prove sono state effettuate essenzialmente su un Nehalem da 2.66GHz, sfortunatamente la scheda madre a loro disposizione aveva molti problemi con le memorie (infatti ad esempio non vi era differenza tra configurazioni in single e triple channel, e tra le varie impostazioni dei timings. La sicurezza che questi problemi erano della sola scheda madre l'hanno avuta dopo aver testato il processore su un secondo setup e aver visto che nella nuova mainboard tutti questi bug erano stati risolti. Sfortunatamente i test più lunghi li hanno potuti effettuare solo ed esclusivamente sulla scheda più "buggata"...ma vediamo che cosa è saltato fuori)
Nella seconda sessione di test hanno avuto seri problemi con il PCI Express quindi non sono riusciti a portare a termine dei test grafici significativi. Questi problemi, a detta degli ingegneri Intel, sarebbero stati risolti da li ad un mese all'incirca, ecco perchè quindi non dovete aspettarvi di vedere ancora la vera potenza del Nehalem.Come già detto poco sopra le CPU sono già molto mature, e non scaldano assolutamente nulla, la frequenza in questi primi sample è stata limitata per tutti i modelli a 2.66GHz in modo tale da non mostrare subito tutti i prodotti che usciranno con questa nuova architettura. Al contrario il nuovo chipset Intel X58 sembra scaldare molto.Come si vede dall'immagine il Nehalem abbandona il bus convenzionale, infatti in questo caso la frequenza è data dal moltiplicatore per 133Mhz. Aspettiamoci quindi i prossimi processori by Intel con FSB multipli di 133Mhz.Il SocketCon il controller di memoria integrato nel chip, Intel ha avuto bisogno di ingrandire il socket. Ecco quindi il nuovo layout del socket con tre canali a 64bit per memorie DDR3 e l'interfaccia a 1366 pin LGA:
LGA-1366 (sx) vs. LGA-775 (dx)Il socket è molto più grosso dell'attuale LGA-775 come pure l'area per il montaggio dei dissipatori. Sfortunatamente non saremmo più in grado di utilizzare i vecchi dissipatori che montiamo attualmente sulle nostre schede con socket 775. Intel sembra voler tenere ancora il sistema di montaggio con "viti" push-in.Visto che il socket è più largo e ha più pin anche la CPU stessa è più grande. Ecco un E8500 (a destra) confrontato con il nuovo Nehalem (a sinistra):
Nehalem (sx) vs. Penryn (dx)
Nehalem (sx) vs. Penryn (dx)Intel uscirà anche con una versione dual-channel per il Nehalem in futuro, ma non si è capito bene se utilizzerà anche un socket diverso, forse denominato LGA-1160. Potrebbe essere anche che Intel decida di puntare tutto su questo socket per le versioni riservate al mercato desktop, e che riservi la versione LGA-1366 per un utilizzo "professionale", ma è tutto ancora molto incerto al momento.Il ritorno dell'Hyper ThreadingIl Nehalem è stato crato per supportare fino a 8 cores per chip, ognuno di questi core ha l'hardware necessario per eseguire due threads simultaneamente - esatto... è tornato l'Hyper Threading. Così ora il nuostro quad-core Nehalem risulterà avere 8 core logici sotto Windows Vista:
Quattro core, otto threads, tutti su una CPU per DesktopDa notare che come nella vecchia versione dell'Hyper threading (o altri processori SMT) non ci sarà un raddoppio delle risorse per l'esecuzione dei calcoli, ma semplicemente lascerà che due thread di istruzioni viaggino nello stesso momento attraverso le pipeline così da avere un uso più efficace dei cicli di idle. Quindi 8 core fisici sono ovviamente più performanti di 8 core logici (4 fisici), tuttavia è un compromesso intelligente per avere più potenza e risparmiare in consumo di energia.Iniziamo con i test, i ragazzi di Anandtech come prima cosa hanno subito cercato di capire la differenza prestazionale dovuta all'introduzione dell'Hyper threading, passando quindi da un processo a 4 thread ad uno a 8 thread in un programma come Valve Map Compilation:Mentre il Core 2 Quad Q9450 (Penryn) ha impiegato 127 secondi per eseguire il doppio del lavoro, il Nehalem ha utilizzato solo 49 secondi. E se siete curiosi, questo quad core Nehalem a 2.66GHz ha circa il 20% delle performance di un sistema Skulltrail da 8core e 3.2GHz.Non essendo in grado di disabilitare l'Hyper Threading i test a riguardo finiscono qui.Due parole sulle memorieLe indagini iniziano sulla parte più visibilmente cambiata dell'architettura del Nehalem: la gestione delle memorie. Il Nehalm implementa una gestione molto simile a quella del suo diretto concorrente Phenom che consiste in una piccola, veloce cache L1 e L2 per ognuno dei suoi quattro core e quindi un'unica, grande cache L3 condivisa tra tutti i core.La cache L1 del Nehalem sembra essere leggermente cambiata dalla versione attualmente montata sul Penryn, è infatti aumentata come latenza; ora utilizza 4 cicli di clock per l'accesso contro i tre necessari del penryn. La cache L2 ora ha solo 256Kb per core invece della cache 24 volte maggiore del Penryn in modo tale da essere molto più veloce ed aver bisogno quindi di soli 11 cicli contro i 15.CPU / CPU-Z LatencyL1 CacheL2 CacheL3 CacheNehalem (2.66GHz)4 cycles11 cycles39 cyclesCore 2 Quad Q9450 - Penryn - (2.66GHz)3 cycles15 cyclesN/ALa cache L3 è la più impressionante, ha bisogno di ben 39 cicli di clock per l'accesso a 2.66GHz, ha una grandezza di 8MB - volte la dimensione della L3 del Phenom, e ha un tempo di accesso molto pù veloce del processore di ATI/AMD. Nei test affrontati da Anandtech la cache del Phenom impiega circa 21.5 ns per dare una risposta, mentre la cache del Nehalem ne impiega circa 14.6 ns - quasi il 50% di tempo in meno!L'introduzione della gestione delle memorie DDR3 nel die del processore è la novità più eclatante di questo nuovo chip. AMD ha utilizzato questa tecnica sin dal 2003, dall'uscita dei suoi primi processori K8 e per anni Intel ha resistito nel non fare altrettanto.Con l'aumento della velocità dei clock e l'aumento dei Core è arrivato anche il momento di chiudere quel gap dato dalla gestione delle memorie. Possiamo già dire che il Nehalem è stato studiato per minimizzare la distanza tra i singoli core della CPU e la memoria principale grazie alla cache creata a posta.I test di banda passante sono stati effettuati con la seconda piattaforma (con un Nehalem a 2.93GHz e memorie DDR3-1066) poichè la prima aveva - come già preannunciato - grossi bug con la gestione delle memorie:CPU / Everest Ultimate 4.50Memory ReadMemory WriteMemory CopyMemory LatencyNehalem (2.93GHz)13.1 GB/s12.7 GB/s12.0 GB/s46.9 nsCore 2 Extreme QX9650 - Penryn - (3.00GHz)7.6 GB/s7.1 GB/s6.9 GB/s66.7 nsDa questi test possiamo vedere come il Nehalem impiegi 2/3 del tempo che serve al Penryn per completare il test, e si pensa che il memory controller DDR3 del Nehalem sia molto più veloce della versione per DDR2 del Phenom.La banda passante è ovviamente più grande con tre canali DDR3, everest ha misurato un incremento di circa il 70% in lettura. L'aumento di prestazioni con WinRAR si attesta invece sul 10% - tra il test in single e triple channel.Performance - Nehalem e l'encodingI ragazzi di Anandtech hanno avuto modo di fare alcuni test di encoding con DivX e x264.DivX 6.8 con XmpegI test effettuati sono gli stessi sempre fatti da Anandtech per le recensioni delle CPU "normali", ossia un semplice encoding di un file 1080p MPEG-2 in DivX.Il test con DivX è molto importante visto che non trae benefici dell'Hyper Threading, quindi la differenza che vedete è tutta dovuta ai miglioramente delle microarchitettura del nuovo Nehalem.Si può dire che il Nehalem è circa il 28% più veloce del Penryn in questo test. Il fatto impressionante è che un Nehalem a 2.66GHz è più veloce del miglior Penryn attualmente sul mercato (QX9770 a 3.2GHz). I miglioramenti delle performance qui sono completamente dovuti alla nuova e più veloce cache L2 e al passo avanti della micro-architettura.x264 Encoding con AutoMKV
Usanto AutoMKV abbiamo compresso lo stesso file usato nelle soliti test di Anandtech in un file da 100MB utilizzando il profilo 2_Pass_Insane_Quality:Anche qui si notano prestazioni entusiasmanti... in pratica un miglioramento a parità di clock del 44%!!! Quello che Intel fece ad AMD nel 2006 con l'introduzione del Conroe, lo sta rifacendo adesso...ma nei confrondi di se stessa! Impressionante!Accesso alla Cache più veloce & 3D Rendering Performance3dsmax r9Il benchmark effettuato è il SPECapc di 3dsmax 8 test ma per il nostro scopo verrà fatto solo il test sulla CPU e non sulla GPU.I risultati riportati sono i secondi impiegati per terminare il render, e il risultato finale è una media geometrica pesata che raggruppa tutti gli score dei test.CPU / 3dsmax Score BreakdownRadiosityThrone ShadowmapCBALLS2SinglePipe2UnderwaterSpaceFlybyUnderwaterEscapeNehalem (2.66GHz)12.891s11.193s5.729s20.771s24.112s30.66s27.357sPenryn (2.66GHz)19.652s14.186s13.547s30.249s32.451s33.511s31.883sIl test CBALLS2 è dove abbiamo notato il miglior aumento delle prestazioni con il Nehalem, le performance infatti sono più che raddoppiate. Sembra quindi che CBALLS2 richiami una funzione delle Librerie Runtime C di Microsoft (msvcrt.dll) che penalizzi molto l'achitettura del Core che fa riferimento all'accesso dei dai non allineati nella cache; mentre, attraverso alcuni trick, Intel è riuscita a migliorare questo aspetto con il Nehalem.
Nehalem a parità di clock è più veloce del 40% del Penryn nel 3dSMax.Cinebench R10Uno dei test più amati da Anandtech è il Cinebench R10, studiato per dare un'indicazione generica delle performance nel rendering di Cinema 4DAnche qui possiamo vedere un aumento del 20% a parità di clock.E' stato effettuato anche un test senza l'opzione multithread per vedere il miglioramento dell'architettura introdotta con il Nehalem:Cinebench evidenzia un incremento del 2%. In applicazioni simili quindi il Nehalem si comporta all'incirca come il Penryn.E' interessante vedere com'è migliorato il multiple thread con il Nehalem:Cinebench R101 ThreadN-ThreadsSpeedupNehalem (2.66GHz)3015125964.18xCore 2 Quad Q9450 - Penryn - (2.66GHz)2931104453.56xIn un programma che sfrutta appieno il multithreading come Cynebench si vede come il Nehalem sia molto superiore al Penryn, arrivando ad un guadagno di un .4.18x contro i 3.56 del Penryn. E' l'Hyper Threading quindi che mette il Nehalem una spanna oltre.Mentre molti test di 3d rendering e video encoding possono prendere dei vantaggi dai più thread del nehalem, cosa succede per le applicazioni che non sfruttano questa proprietà? Un aspetto delle performance del Nehalem che non è stato interessato quasi per nulla è il memory controller integrato (IMC), visto che molti di questi benchmarks si sono dimostrati molto più intensivi dal punto di vista dei calcoli. Quindi dove l'HT non da quel boost impressionante che abbiamo visto, possiamo aspettarci ragionevolmente che sarà l'IMC a dare un quelle prestazioni in più. Il Nehalem usato in questi test sicuramente non è ancora sfruttato al meglio a causa di schede madri ancora immature, ma già un 20% circa di media di prestazioni in più pensiamo sia un ottimo punto di partenza per il nuovo chip di Intel.
POV-Ray 3.7 Beta 24POV-Ray è un programma di rendering molto popolare che ha al suo interno un benchmark. E' stato usata la versione 3.7 beta che ha il supporto SMP e un benchmark multithread integrato.Infine il benchmark POV-Ray riflette esattamente quello che abbiamo notato negli altri benchmark, con un 36% di performance in più rispetto al 2.66 GHz Core 2 Q9450. Da notare che il Nehalem è comunque ancora più veloce di qualsiasi Penryn attualmente sul mercato, anche se ha una frequenza di clock decisamente inferiore.Consumo energetico
Costruito con lo stesso processo produttivo a 45nm del Penryn, ci asepttiamo che il Nehalem abbia un consumo energetico maggiore del Penryn ma intel ha annunciato che il consumo aumenterà di solo 1 punto percentuale.In conclusione i consumi sono buoni, per un 20 - 50 % di performance in più abbiamo un aumento del consumo del 10% circa.ConclusioniPrima di tutto teniamo in mente che questi risultati sono prematuri, e sono venuti fuori da processori ancora "bloccati" e su piattaforme molto premature. Con questa premessa, il fatto che il Nehalem è in grado di aumentare dal 20 al 50% le prestazioni dice una sola cosa su Intel: l'hanno rifatto ancora!!!Ci era stato detto di aspettarci un vantaggio del 20 - 30 % sul Penryn e sembra che Intel voglia iniziare a venderlo solo nel Q4. Alla frequenza di 2.66GHz il Nehalem è già più veloce del Penryn da 3.2GHz! Questo processore è veloce...molto veloce già nelle prime piattaforme altamente premature!Dobbiamo riflettere un attimo sulle performance nelle applicazioni che non sfruttano bene la differenza tra due o quattro core, cosa ci offrifà quindi il Nehalem? Il test DivX non migliora molto grazie ai quattro core, ma le performance del Nehalem sono dipiù veloci di un 20 - 30 % di quello che ci si aspettava. L'altro punto che dobbiamo tenere in mente è che nessuno di questi test hanno realmente utilizzato il memory controller integrato. Quando AMD fece la mossa di passare all'IMC abbiamo notato un boost di performance del 20% nella maggior parte delle applicazioni. Sospettiamo che quelle applicazioni che non sfrutteranno l'Hyper Threading trarranno molto beneficio dall'IMC. Abbiamo solo grattato la parte fuori dell'acqua dell'Iceberg che è il nehalem. Tutti questi dubbi saranno risolti avvicinandosi sempre di più al momento del rilascio ufficiale.Ricordiamo ancora il sito Anandtech dove potete trovare la versione originale in Inglese: AnandTech: The Nehalem PreviewMarco Dominici