Innehåll

Albatron GeForce 4 Ti4200 P Turbo

Inledning
NV25 - GeForce 4
Specifikationer
I kartongen
Layout
Kylning och ljudnivå
Överklockning
Drivrutiner och mjukvara
Testsystem
Prestanda - 3DMark 2001 SE
Prestanda - Quake III
Prestanda - UT 2003 Demo
Prestanda - PCMark 2002
Slutsats


Tack till Albatron som gjorde denna recension möjlig.

27/09-02 | Daniel Rufelt | xx@64bits.se

Utskriftsvänligare versionUtskriftsvänligare version


Inledning

1984 grundades Chun Yun Electronics, ett företag som främst tillverkade TV-apparater, projektorer och dylikt. I slutet av 2001 valde dock företaget en ny inriktning, och valde att satsa på den växande marknaden för datorkomponenter. De började samla ihop ingenjör och tekniker och en del folk från konkurrenten Gigabyte blev rekryterade. I januari 2002 bytte företaget namn till Albatron, och satte igång att tillverka grafikkort och moderkort avsedda främst för slutkunder. Idag har tillverkaren ett ganska brett sortiment av dessa produkter.

Vi ska nu ta en titt på ett av deras senaste produkter, GeForce 4 Ti4200 P Turbo, och avgöra om det är värt att satsa sina pengar på.

NV25 - GeForce 4

Eftersom detta är den första recensionen av ett GeForce 4 Titanium-kort här på 64bits så tänkte jag snabbt gå igenom dess egenskaper och vilka modeller som finns.

NV25 var utvecklingsnamnet för GeForce 4. Trots att GPU:n givetvis är färdigutvecklad så används ibland NV25 när man pratar om själva GPU:n.
För närvarande finns det tre modeller av GeForce 4 Titanium: Ti4200, Ti4400 och Ti4600. Nedan ser ni specifikationerna, och skillnaderna mellan de olika modellerna.
 

  Ti4200 (64 MB) Ti4200 (128 MB) Ti4400 (128 MB) Ti4600 (128 MB)
Tillverkningsprocess 0,15 µ 0,15 µ 0,15 µ 0,15 µ
Antal transistorer 6,3*10^7 6,3*10^7 6,3*10^7 6,3*10^7
GPU-hastighet 250 MHz 250 MHz 275 MHz 300MHz
Minnesbuss 128-bits DDR 128-bits DDR 128-bits DDR 128-bits DDR
Minneshastighet 500 MHz 444 MHz 550MHz 650 MHz
Minnesbandbredd 8,0 GB/s 7,1 GB/s 8,8GB/s 10,4GB/s
Instruktioner / s 1,03* 10^12 1,03* 10^12 1,03* 10^12 1,03* 10^12

Specifikationerna är minst sagt imponerande, värstingmodellen Ti4600 klarar av att skyffla hela 10,4GB/s. Notera att klockfrekvenserna är de NVIDIA rekommenderar, i praktiken kan de vara något annorlunda och det är egentligen fritt upp till tillverkaren att (inom rimliga gränser) välja frekvens på både minne och GPU. Vi går vidare och tar en titt på hur NVIDIA åstadkommit denna bandbredd.

LMA II
Minnesbandbredden är en mycket avgörande faktor för ett grafikkorts prestanda. LMA II, som står för Light Memory Architecture II, är NVIDIAs samlingsnamn för den teknik och de optimeringar NVIDIA använt för att uppnå den relativt höga bandbredden hos NV25.

Den gamla tekniken för överföringen mellan minneskontrollern och själva minnet gick ut på att man hade en buss där man hade en kontroller som fick förfoga över minnena. Ponera att bussen är på 128-bit. Detta innebär alltså att varje "paket" data som överförs kommer att ta upp hela bandbredden eftersom det bara finns en minneskontroller. Så om 32 bit data ska överföras så kommer hela bandbredden att användas, och således kommer 75% av bandbredden indirekt att vara outnyttjad. Detta innebär givetvis att man går miste om en hel del bandbredd.

För att lösa detta så använder NV25 något som NVIDIA kallar "crossbar interface". Detta innebär att man istället har fyra stycken minneskontrollers. Var och en av dessa har, via en 32-bits buss, tillgång till de 4 olika undersystemen av minnen som NV25 har. Detta medför att det går att överföra paket ner till 32 bits storlek, vilket leder till att man går miste om mycket mindre bandbredd vid minnesöverföringar. Eftersom varje minneskontroller har tillgång till hela minnet så medför detta att den effektiva bredden på bussen blir på 128 bit. Eftersom så kallad DDR-teknik används så ökas den effektiva bredden på bussen från 128 bit till 256 bit.

Crossbar interface fanns även hos NV20, men med hjälp av optimeringar och höjd klockfrekvens har NVIDIA ytterliga ökat bandbredden mot minnet.

LMA II inkluderar även något som kallas Quad Cache. Quad Cache innebär att man har fyra stycken självständiga caches där GPU:n kan lagra mindre data innan den skrivs till minnet. Varje cache är optimerad för att lagra viss typ av data, t ex texturdata eller vertexdata. Detta medför att prestandan blir bättre jämfört med om man skulle haft en "all-around"-cache som hade hand om all mindre data innan den lagrades i minnet.

Z-buffern är den del av minnet där varje punkts y, x och z-värden ligger. I Z-buffern lagras även information om huruvida en pixel ska vara synlig eller ej. Eftersom dagens spel använder miljontals pixlar blir tar denna buffert givetvis upp relativt stor plats. För att råda bot på detta problem har NVIDIA infört något de kallar för "Lossless Z Compression", fritt översatt komprimering av Z-buffern utan dataförlust. NVIDIA påstår att de lyckats komprimera denna buffert med kompressionsförhållandet 4:1 utan att bildkvalitén på något sätt försämras. Komprimeringen leder självklart till att mindre data måste skyfflas till och från minnet vilket självklart leder till ökad prestanda då andra saker, som t ex texturer, istället kan skyfflas snabbare till och från minnet.

LMA II omfattar även en del andra optimeringar, t ex ett system som gör att pixlar som inte syns renderas. För den som är intresserad av att läsa mer om LMA II så finns det ett utmärkt dokument om detta för åskådning här.

nfiniteFX II
NfiniteFX II är samlingsnamnet för NV25s pixel- och vertex-shaders. Vertex-shadern är den enhet i GPU:n som har hand om de flesta beräkningar i GPU:n. Jämfört med NV20 (GeForce 3) så har NV25 två stycken pararella vertex-shaders, vilket leder till att NV25 kan hantera mycket fler polygoner än NV20. Pixel-shadern har hand om beräkningar för optimeringar nere på pixel-nivå istället för på polygon-nivå.  Även pixel-shadern har blivit optimerad, men man har dock fortfarande "bara" en pixel-shader.

En viktig egenskap hos både pixel- och vertex-shadern är att de är programmerbara. Detta innebär att spel och programtillverkare inte är låsta till de olika effekter som finns i GPU:n, utan kan anpassa pixel- och vertex-shaders så att de renderar den effekt som just tillverkaren vill. Detta gör givetvis användningsområdet för GPU:n mycket bredare, och tillverkarna kan i princip rendera vilka effekter som helst (så länge prestandan är accepterbar).

För den som vill läsa mer om nfiniteFX II så tillhandahåller NVIDIA ett utmärkt dokument om detta som finns för åskådning här.

Accuview AA
NVIDIA kallar sin teknik för kantutjäming, Antialising, för Accuview AntiAlising . NV20 erbjöd tre former av kantutjämning, 2X FSAA, Quincunx FSAA och 4X FSAA, där 4X FSAA erbjöd bäst kantutjämning men en ganska stor prestandaförlust.

I och med NV25 har NVIDIA även introducerat en ny typ av kantutjämning som de kallar 4XS FSAA. Skillnaden mellan 4XS och 4X är att 4XS erbjuder ytterliggare bättre kantujtämning, till en ganska liten prestandaförlust.

Accuview AA innefattar även något som kallas Anistropic Filtering. Anistropic Filtering är inte direkt någon nyhet, men ändå en intressant teknik att ta upp. Normalt så avtar bildkvaliten med avståndet i en 3D-scen, och t ex golv i ett spel kan se väldigt suddiga ut på långt avstånd. För att förhindra detta så har man infört Anistropic Filtering, som helt enkelt tvingar applikationen att använda en större textur för att undvika att bilden blir suddig.

För den som vill gräva sig djupare och öka sin förståelse för Accuview AA så finns det ett dokument om detta här.

nView
Sist men inte minst tänkte jag gå igenom det som NVIDIA kallar nView. nView är samlingsnamnet för de funktioner för stöd för flera bildskärmar och/eller TV-apparater som finns i NV25. Med hjälp av dubbla integrerade RAMDACs på 350 MHz vardera så går det utmärkt att använda två stycken skärmar samtidigt, utan att uppdateringsfrekvensen eller upplösningen tvingas vara lägre på någon av de anslutna skärmarna.

Den största styrkan hos nView är faktiskt drivrutinerna. I och med att Detonator 40 introducerades så inkluderades stöd för nView 2,0. nView 2,0 inkluderar mängder med funktioner för att göra användandet av flera bildskärmar enkelt, effektivt och användbart.

Givetvis finns det även ett dokument om nView hos NVIDIA, detta går att tanka ner här.

Vad sägs om att lämna den teoretiska världen och se vad Albatrons GeForce 4-kort har att erbjuda?


  Nästa sida »


27/09-02 | Daniel Rufelt | xx@64bits.se

Utskriftsvänligare versionUtskriftsvänligare version

Diskutera denna recensionen i vårt forum!