Nvidia’s geheime recept voor efficiëntere gpu’s onthuld
Met de tweede generatie van zijn Maxwell-architectuur kon Nvidia een grote sprong maken in de prestaties-per-watt die zijn grafische kaarten leverden, maar het bedrijf heeft nooit volledig uitgeklaard hoe het die verbetering heeft gerealiseerd.
De sprong gemaakt met de GeForce GTX 970 en 980 twee jaar geleden was verrassend, aangezien beide grafische kaarten op dezelfde baktechniek gebaseerd waren als hun voorgangers. De prestatiewinst geboekt met de gpu’s is in de regel weggelegd voor een upgrade naar een nieuwer en kleiner bakprocedé.
Website RealWorldTech heeft een belangrijk deel van dat raadsel ontsluierd door GPU’s te onderwerpen aan specifieke testen. In tegenstelling tot de voorgaande Nvidia Kepler-architectuur maken zowel Maxwell als Pascal gebruik van het ongebruikelijke “tiled rendering”-proces om beelden om te zetten.
Onconventioneel
Het alternatief voor tiled rendering is “immediate-mode rendering”. Dit is momenteel de standaardmanier die door fabrikanten gehanteerd wordt, ook door Nvidia-concurrent AMD. Bij Immediate-mode rendering wordt een volledig beeld geconverteerd, tiled rendering deelt deze op in verschillende tegels. Die laatste aanpak heeft als voordeel dat de GPU aan elke tegel apart kan werken. Immediate-mode rendering verbruikt meer energie omdat het bij fouten het beeld helemaal opnieuw moet genereren. RealWorldTech presenteerde zijn testresultaten in een uitgebreide video.
Mysteries blijven
Het gebruik van tiled rendering leidde voor Maxwell en Pascal blijkbaar tot een behoorlijk efficiëntievoordeel, al zijn er nog genoeg onduidelijkheden rond de details van de architecturen dat het moeilijk te zeggen is hoeveel de afwijkende renderingmanier heeft bijgedragen aan de uiteindelijke prestaties. Al durft Extremetech te stellen dat het een niet-triviale rol heeft gespeeld.
[related_article id=”180020″]Iets dat bijvoorbeeld nog niet geweten is, betreft de wijze waarop de Nvidia GPU’s de grootte bepalen van de tegels. De huidige populaire theorie stelt dat Maxwell en Pascal hun tegelgrootte dynamisch kunnen aanpassen op basis van het werk dat voor elke tegel gedaan moet worden. Dit zou de hoeveelheid informatie die de GPU’s moeten bewaren over elke tegel kunnen beperken tot de cache- of bufferlimieten die Nvidia heeft ingesteld.
Wat doet AMD?
Tiled rendering is zeker geen nieuwe techniek. Nvidia gaat voor de implementatie zijn mosterd halen bij grafische chips voor mobiele SoC’s zoals de Mali-gpu van ARM. De aanpak vindt daar zijn oorsprong omdat efficiënt omspringen met stroom onontbeerlijk is voor een smartphone. Dat Nvidia de techniek op zijn desktop-gpu’s implementeert is verrassend omdat deze grafische kaarten traditioneel het hele frame tegelijkertijd te lijf gaan. Software gaat er vandaag nog steeds van uit dat hardware op die manier werkt. Omdat software niet geoptimaliseerd is voor de tiled rendering-techniek, is de implementatie in Maxwell verrassend. Nvidia lijkt een manier te hebben gevonden om de nadelen en mogelijke compatibiliteitsproblemen te omzeilen, concludeert Anandtech.
Misschien maakt AMD – dat met Polaris overigens evenwaardige prestaties weet neer te zetten – een gelijkaardige omschakeling met de naderende lancering van de Vega-architectuur, misschien tovert het nog iets anders uit zijn hoed. Nvidia’s grafische kaarten die gebruik maken van de nieuwe Pascal-architectuur hebben alleszins indruk gemaakt op onze redactie. Zowel de Geforce GTX 1070 als Geforce GTX 1080 konden straffe prestaties neerzetten.
Met de tweede generatie van zijn Maxwell-architectuur kon Nvidia een grote sprong maken in de prestaties-per-watt die zijn grafische kaarten leverden, maar het bedrijf heeft nooit volledig uitgeklaard hoe het die verbetering heeft gerealiseerd.
De sprong gemaakt met de GeForce GTX 970 en 980 twee jaar geleden was verrassend, aangezien beide grafische kaarten op dezelfde baktechniek gebaseerd waren als hun voorgangers. De prestatiewinst geboekt met de gpu’s is in de regel weggelegd voor een upgrade naar een nieuwer en kleiner bakprocedé.
Website RealWorldTech heeft een belangrijk deel van dat raadsel ontsluierd door GPU’s te onderwerpen aan specifieke testen. In tegenstelling tot de voorgaande Nvidia Kepler-architectuur maken zowel Maxwell als Pascal gebruik van het ongebruikelijke “tiled rendering”-proces om beelden om te zetten.
Onconventioneel
Het alternatief voor tiled rendering is “immediate-mode rendering”. Dit is momenteel de standaardmanier die door fabrikanten gehanteerd wordt, ook door Nvidia-concurrent AMD. Bij Immediate-mode rendering wordt een volledig beeld geconverteerd, tiled rendering deelt deze op in verschillende tegels. Die laatste aanpak heeft als voordeel dat de GPU aan elke tegel apart kan werken. Immediate-mode rendering verbruikt meer energie omdat het bij fouten het beeld helemaal opnieuw moet genereren. RealWorldTech presenteerde zijn testresultaten in een uitgebreide video.
Mysteries blijven
Het gebruik van tiled rendering leidde voor Maxwell en Pascal blijkbaar tot een behoorlijk efficiëntievoordeel, al zijn er nog genoeg onduidelijkheden rond de details van de architecturen dat het moeilijk te zeggen is hoeveel de afwijkende renderingmanier heeft bijgedragen aan de uiteindelijke prestaties. Al durft Extremetech te stellen dat het een niet-triviale rol heeft gespeeld.
[related_article id=”180020″]Iets dat bijvoorbeeld nog niet geweten is, betreft de wijze waarop de Nvidia GPU’s de grootte bepalen van de tegels. De huidige populaire theorie stelt dat Maxwell en Pascal hun tegelgrootte dynamisch kunnen aanpassen op basis van het werk dat voor elke tegel gedaan moet worden. Dit zou de hoeveelheid informatie die de GPU’s moeten bewaren over elke tegel kunnen beperken tot de cache- of bufferlimieten die Nvidia heeft ingesteld.
Wat doet AMD?
Tiled rendering is zeker geen nieuwe techniek. Nvidia gaat voor de implementatie zijn mosterd halen bij grafische chips voor mobiele SoC’s zoals de Mali-gpu van ARM. De aanpak vindt daar zijn oorsprong omdat efficiënt omspringen met stroom onontbeerlijk is voor een smartphone. Dat Nvidia de techniek op zijn desktop-gpu’s implementeert is verrassend omdat deze grafische kaarten traditioneel het hele frame tegelijkertijd te lijf gaan. Software gaat er vandaag nog steeds van uit dat hardware op die manier werkt. Omdat software niet geoptimaliseerd is voor de tiled rendering-techniek, is de implementatie in Maxwell verrassend. Nvidia lijkt een manier te hebben gevonden om de nadelen en mogelijke compatibiliteitsproblemen te omzeilen, concludeert Anandtech.
Misschien maakt AMD – dat met Polaris overigens evenwaardige prestaties weet neer te zetten – een gelijkaardige omschakeling met de naderende lancering van de Vega-architectuur, misschien tovert het nog iets anders uit zijn hoed. Nvidia’s grafische kaarten die gebruik maken van de nieuwe Pascal-architectuur hebben alleszins indruk gemaakt op onze redactie. Zowel de Geforce GTX 1070 als Geforce GTX 1080 konden straffe prestaties neerzetten.