Unlike the VU, the integer unit on the APU is vectorized, each vector element is a 32-bit int (VU was only 16-bit) and the register set is shared with the FPU (in VU there is a smaller dedicated integer register set). APU should therefore be somewhat easier to program and much more general-purpose than the VU.
APU -> "attached processing units" A tutti gli effetti una vector unit, molto simile a quelle che troviamo nell'EmotionEngine.
Una vector unit migliorata e semplificata dal punto di vista della programmazione, dotata dell'unità che gestisce le operazioni sugli interi vettorizzata con registri a 32bit, questo rende l'APU a tutti gli effetti più simile ad un DSP che ad una CPU vera e propia.
Infatti l'APU è in grado x ogni ciclo di clock di eseguire una istruzione nell'unità vettoriale che gestisce i calcoli in virgola mobile ed una istruzione nell'unità vettoriale che gestisce i calcoli sugli interi.Questo perchè nell' APU non ci sarà nessuna analisi dinamica sul flusso dei dati, nessun tipo di riordino o di brench prediction.Quindi pipeline corte con accessi diretti ai registri, sia l'FPU(calcoli in virgola mobile) che l'IPU(calcoli sugli interi) potranno leggere, per ogni ciclo di clock, in tre registri e scrivere in uno.
Ogni APU disporra di 128K di RAM unificata per codice e dati, diversamente da quanto accade nelle VU della PS2.Inoltre ogni APu potrà gestire indipendentemente gli accessi alla RAM diversamente da quanto accade nella PS2 dove solo l'host può decidere la suddivisione dei canali DMA.
The declared speed of these APUs is awesome - 32GFLOPS + 32GIOPS (32 billion floating-point instructions and 32 billion integer instructions per second). I expect Sony consider a 4-way vectorized multiply-accumulate instruction to be 8 FLOPs, so the clock speed of the APU is 4GHz, as has been reported elsewhere in the media. This is very much faster than the PS2's sedate 300MHz clock - by about 13 times
Il calcolo non fa una piega, ogni singola APU sarà 13 volte più veloce dell'EmotionEngine, sapendo che la cellula(The Cell) disporrà di 8 APU possiamo calcolare la sua velocità che sarà dell'ordine dei 256GFlops + 256GIOPS, numeri da brividi!!!
Con solo un Cell si avrà quindi una capacità di calcolo circa 100 volte superiore alla PS2.
La PS3 dovrebbe disporre, ed i primi kit di sviluppo dicono così, di 4 cell per una capacità di calcolo di 1 teraFlops, circa 400 volte le capacità di PS2.
Discorso visualizzatore!
Il visualizzatore sarà praticamente un Cell in cui verranno tolte 4 APU e verra inserita della VRam embadded, un controller video ed un pixel engine.
Il sistema sarà formato da 4 visualizzatori in grado ognuno di creare 1/4 dell'immagine in uscita
Ricapitolando avremo una PS3 composta da un chip contenente 4 Cell ognuno dei quali formato da 8 APU per una capacità di calcolo di 1 TFlops, 400 volte PS2 e da un altro chip contenete 4 visualizzatori in grado di processare 1/2 TFlops.
Questa capacità di calcolo spaventosa, necessiterà per forza di cose di molta RAM e molto veloce, nell'ordine sicuramente dei 512MB.