Ma tra l'altro ci sono fior fiore di articoli di sviluppatori su come ottenere cose che si ritenevano IMPOSSIBILI su un hardware semplicemente ottimizzando i processi al limite e non sprecando nulla. Si va da trucchi per scrivere su zone di memoria inaccessibili a approssimazioni virtualmente indistinguibili da calcoli completi più complessi.
Cioè uno ha pure fatto un clone di Portal in 2D su una calcolatrice tascabile.
In qualunque ambiente di sviluppo si troveranno sempre "trucchetti" che miglioreranno (anche esponenzialmente) le prestazioni e i risultati. Non c'è nulla di fanboystico in questo, è solo una pratica per cui serve tempo. Più tempo hai a disposizione e meglio sfrutti l'hardware. Più rosicchi, meno spazio resta da rosicchiare, e quindi le migliorie con il tempo si assottigliano, andando ovviamente a svanire sul lungo periodo. Che è anche il motivo per cui all'inizio il balzo evolutivo è maggiore.
[EDIT sulla base dell'ultima risposta] Non volevo offendere evidenziando quella che mi sembrava un'innocua mancanza. Mica si può sapere tutto di tutto, se mi parli di leggi io scuoto la testa guardando il vuoto.
Ad ogni cambio di processore o scheda video è necessario imparare a comunicare con il nuovo hardware. Se cambi un processore cambi le istruzioni a basso livello che esso accetta; le prestazioni migliori le ottieni andando a programmare, come si dice in gergo, "sul metallo". Non dico in linguaggio macchina come facevano i pionieri sui computer tipo C64 o Spectrum, ma lavorando comunque parallelamente ad un compilatore (che spesso non è affatto ottimizzato).
Un esempio lampante sono i problemi avuti da chi ha adattato Shadow of the Colossus su PS3: era scritto sfruttando talmente bene il peculiare hardware PS2 (e infatti offriva caratteristiche ASSURDE per l'epoca che nemmeno tutti i giochi di oggi presentano) che hanno avuto difficoltà ad ottenere la stessa qualità su un hardware MOSTRUOSAMENTE più potente qual è PS3.
Quindi talvolta la potenza vale meno dell'ottimizzazione. E' ovvio che un programmatore bravo sarà tale su qualunque hardware (aperto o chiuso che sia), ma non è questo il punto, bensì il fatto che su un hardware chiuso avrà più tempo per studiarlo e sfruttarlo al meglio, esattamente per i motivi che ho evidenziato prima (unica configurazione e immobilismo hardware) e su cui tu hai sorvolato.