9800 gt an fabricatie. Determinarea seriei de produse de plăci video Nvidia. Blocuri ROP, scrieri framebuffer, anti-aliasing

Adaptorul video Nvidia GeForce 9800 GT cu o capacitate de memorie de 512 MB a apărut pe piață în 2008, înlocuind modelul anterior. Versiunile ulterioare au fost lansate cu 1 GB GDDR5 și capacități de joc îmbunătățite. Toate opțiunile de card erau în categoria de preț bugetar și erau destinate asamblarii computerelor de jocuri ieftine.

Parametrii adaptorului grafic îndeplinesc pe deplin cerințele aplicațiilor de jocuri în 2008-2009. Principalele caracteristici ale Nvidia GeForce 9800 GT sunt următoarele:

  • GPU G92-270;
  • Frecvența GPU – de la 550 la 600 MHz;
  • Frecvența memoriei – 1400–1800 MHz;
  • Capacitate de biți – 256 de biți;
  • Viteza maximă de transfer de date – 57,6 GB/s;
  • Rezoluția de imagine acceptată este de până la 2560x1600.

Placa grafică acceptă tehnologia Nvidia SLI pentru performanță sporită, HybridPower pentru trecerea automată la grafică integrată și PhysX pentru cea mai realistă experiență de joc. De asemenea, funcționează cu pachetele DirectX 10 și OpenGL 2.0, oferind grafică 3D de înaltă calitate. Nu există suport pentru seturi de funcții API mai moderne.

Recenzie GeForce 9800 GT

Consumul de energie al lui 9800 GT este destul de mare - la 105 W, deci necesită o sursă de alimentare puternică pentru a funcționa. Producătorul recomandă utilizarea a cel puțin 450 W. Pentru a rula jocuri moderne, ar trebui să alegeți surse de alimentare mai puternice - 500 sau 600 W.

Pentru a menține temperatura normală a plăcii video GeForce 9800 GT, toate modificările sunt echipate cu sisteme de răcire active - de obicei cu un răcitor.

În modul normal, cardul se încălzește până la nu mai mult de 77 de grade. Valoarea maximă este de 105 grade.

Pentru a conecta dispozitive periferice, adaptorul video are următorii conectori:

  • 2 DVI, la care puteți conecta cabluri obișnuite VGA și HDMI prin adaptoare;
  • Ieșire TV pentru ieșire semnal analogic;
  • MIO, cu care poți combina două cărți.

Frecvența maximă efectivă a plăcii video este de 2000 MHz, ceea ce permite overclockarea acesteia cu 11-30%, în funcție de model. Merită luat în considerare faptul că o creștere vizibilă a indicatorilor poate duce la supraîncălzire severă.

Cum să overclockați o placă video Nvidia GeForce 9800 GT

Când overclockați Nvidia GeForce 9800 GT, puteți crește frecvența acestuia. Rezultatul este o performanță crescută a cardului și fps în timpul jocului. Deși încă nu veți putea rula jocuri ale căror cerințe minime nu le îndeplinește.

Utilități speciale precum MSI Afterburner sau Nvidia Inspector vor ajuta la asigurarea overclockării plăcii video Nvidia GeForce 9800 GT.

Frecvența maximă a adaptorului video overclockat nu trebuie să depășească 2000 MHz. Un card overclockat funcționează mai repede, dar consumă până la 120-125 W.

După overclocking, minarea pe 9800 GT este posibilă, dar nu este recomandată. Chiar și odată cu apariția noii criptomonede Bitcoin Gold, care poate fi extrasă folosind GPU-uri, performanța va fi încă prea scăzută chiar și pentru a recupera energia electrică, mai ales cu un TDP atât de mare.

Ce jocuri poate gestiona Nvidia GeForce 9800 GT?

Un test efectuat la un moment dat în jocuri cu GeForce 9800 GT a arătat posibilitatea utilizării plăcii video pentru PC-uri de gaming la buget redus. Cerințele minime pentru un computer care se potrivește cu cardul sunt o placă de bază cu sloturi PCI-Express 16x, 512-1024 MB de RAM și o sursă de alimentare de 500 W. De asemenea, se recomandă instalarea pachetului DX10.

Rezultatele testului sunt după cum urmează:

  1. În jocul Crysys (2009), când rezoluția este setată la 1280x1024 pixeli. Modelul de 512 MB oferă de la 22 la 30 fps – aproximativ la nivelul unei plăci video HD 4770.
  2. Când porniți jocul Stalker (rezoluție 1680x1050 pixeli), frecvența de schimbare a imaginii ajunge la 13-25 de cadre pe secundă dacă utilizați un adaptor cu 512 MB GDDR5 și până la 30 dacă instalați versiunea gigabyte pe computer.
  3. Jocul Skyrim cu card de 512 MB nu va începe deloc, iar modificarea gigabyte la setările minime va afișa până la 65 fps.

Nu este recomandat să rulați jocuri lansate după 2011-2012 folosind GeForce 9800 GT 512 MB. Cele mai multe dintre ele vor afișa nu mai mult de 20 de fps, restul nu va funcționa. Versiunea cu 1 GB de memorie este potrivită, dar este puțin probabil să ofere o calitate acceptabilă a jocului.

Comparația producătorilor

La începutul vânzărilor, prețul Nvidia GeForce 9800 GT a fost de aproximativ 2700-3000 de ruble pentru versiunile cu 512 MB și aproximativ 3,5 mii de ruble. pentru modificări de gigabyte. Produsele de la producători mai cunoscuți precum MSI, Palit și Asus au primit o frecvență de memorie de 1800 MHz și un preț mai mare. Acum poate fi cumpărat pe piața secundară pentru doar 600-700 de ruble.

MarcaMemorie, MBFrecvența procesorului, MHzFrecvența memoriei, MHzCost, freacă.
Gigabyte1024 600 1800 3600
Gigabyte512 600 1500 2900
Gigabyte512 550 1800 2800
ECS512 550 1800 2600
MSI512 550 1800 2900
Asus512 600 1800 3000
Inno3D1024 600 1800 3500
Club 3D1024 550 1400 3300
Câștigător1024 550 1800 3500
Zotac1024 550 1600 3400
Palit512 600 1800 2700
Palit1024 550 1800 3400

Opțiunile mai profitabile de la mărcile Zotac, Club 3D și Gigabyte au fost mai ieftine pentru clienți, dar au funcționat și mai lent. Frecvența unor astfel de adaptoare grafice era în intervalul 1400-1600 MHz. Acum prețul lor este aproximativ același ca și pentru modelele care au costat odată mai mult - nu mai mult de 1000 de ruble.

Cum se reinstalează driverul video pentru GeForce 9800 GT

Pentru funcționarea normală a adaptorului video, sunt necesare programe de control care funcționează corect. Există trei moduri de a descărca și instala drivere noi pe un computer cu un card 9800 GT:

  1. Descărcați din resursa oficială a producătorului. Singura opțiune care garantează funcționarea corectă și siguranța computerului dvs.
  2. Descărcare din resurse terțe. O metodă prin care nu numai că puteți descărca un driver pentru Nvidia GeForce 9800 GT, ci și puteți infecta computerul cu un virus.
  3. Folosind utilități speciale, cum ar fi DriverPack Solution, DriverHub sau Driver Booster Free. În acest caz, șoferul poate fi depășit.

Pe site-ul oficial al Nvidia puteți găsi versiuni noi de programe de control pentru placa video, concepute pentru diverse sisteme de operare. Lista de platforme acceptate de card include Windows 7 pe 32 și 64 de biți, Windows 10 și Linux. Pe alte resurse puteți găsi drivere pentru sisteme de operare atât de rare precum Solaris.

Placa video 9800 GT de la NVIDIA este o continuare logică a plăcii 8800GT. Cele două produse tehnologice au parametri aproape identici. Principala diferență între 9800GT și modelul anterior a fost suportul pentru tehnologia HybridPower. Nu există alte îmbunătățiri. GPU-ul cardului este etichetat G92-270. Modelul 8800 a avut unul asemanator.Microcipul are revizia A2, ca si pana acum. Caracteristicile frecvenței de ceas ale plăcii video 9800 GT au rămas la același nivel: 601/1512 MHz.

Specificații 9800 GT

Din punct de vedere tehnic, placa 9800 GT nu a suferit modificări majore de la modelul 8800.

Parametrii plăcii video:

  • GPU: G92.
  • Memorie video: 512 MB.
  • Bus de memorie: 256 biți.
  • Frecvența GPU: 601/1512 MHz.
  • Blocuri de textura: 56.
  • Blocuri POR: 16.
  • Frecvența efectivă la care funcționează memoria plăcii video: 1800 MHz.
  • Procesoare universale (nuclee): 112.
  • Tehnologii unice acceptate: Hybrid Power.
  • Bus de sistem și alte interfețe de comunicare: PCI-E 2.0x16/2xDVI/S-Video. HDMI este acceptat cu un adaptor.

Ce sarcini poate rezolva placa video 9800 GT?

Placa video prezentată se descurcă bine cu jocurile din generația anterioară. Dacă utilizatorul nu urmărește produse noi, atunci 9800 GT i se va potrivi fără îndoială. Caracteristicile cardului vă permit să rulați cu ușurință jocuri precum The Witcher 2, S.T.A.L.K.E.R, Crysis 2, Dead Space 3 și altele. Fallout New Vegas, apropo, rulează și el fără probleme cu această placă. Dar nu va mai fi posibilă lansarea celei de-a patra versiuni a proiectului legendar.

De asemenea, placa video nu va suporta împușcători și simulatoare de mașini moderne lansate după 2013. Există excepții, dar foarte rar. Utilizatorul se simte destul de confortabil atunci când lucrează cu informații grafice și video, vizionează filme la înaltă definiție. Dacă o persoană nu este un fotograf profesionist sau un designer 3D care are nevoie de viteză maximă, atunci placa video 9800 GT este destul de potrivită pentru el.

Avantajele și dezavantajele unei plăci video

Placa în cauză are o serie de avantaje care fac ca utilizarea sa să fie încă relevantă. Deși această soluție are și dezavantaje.

Ce avantaje are 9800 GT? Caracteristicile modelului indică faptul că există multe dintre ele.

  • Placa video acceptă modul SLI. Puteți cumpăra 4 plăci deodată și le puteți combina într-un grup, obținând astfel o creștere semnificativă a performanței.
  • Placa oferă suport pentru tehnologia PhysX. Servește pentru a reproduce efecte speciale suplimentare în jocuri. Este de remarcat faptul că acest lucru reduce semnificativ performanța generală a plăcii video. Pentru a echilibra acest efect, producătorul recomandă utilizarea unui accelerator PhysX suplimentar dedicat, care va completa placa principală.
  • Folosind utilități speciale, puteți îmbunătăți performanța standard a Nvidia 9800 GT, crescând-o cu 5-15%. Indicatorul specific depinde de dorințele utilizatorului și de capacitățile sistemului de răcire al cardului. Când faceți overclock, trebuie să monitorizați cu atenție temperatura de funcționare a dispozitivului pentru a preveni supraîncălzirea excesivă și, ca urmare, defecțiunea.

Defecte:

  • este o soluție depășită;
  • are eficiență limitată în calculul de uz general;
  • redarea lină a discurilor Blu-Ray și a videoclipurilor de calitate HD postate pe Internet va fi influențată semnificativ de puterea procesorului central (pe lângă procesorul plăcii video);
  • performanta scazuta 9800 GT, specificațiile plăcii nu permit rularea jocuri publicate după 2013;
  • consum relativ mare de energie;
  • Performanță insuficientă a plăcii video atunci când lucrați cu efecte PhysX suplimentare.
Seria NVIDIA GeForce 9000
Nume de codG92, G92b, G94, G94b, G96, G98
GPU entry-levelGeForce 9300GS, GeForce 9400GT, GeForce 9500GT
GPU de gamă medieGeForce 9600
GPU-uri de topGeForce 9800
Versiunea Direct3D și shadersDirect3D 10
Shader Model 4.0
Versiunea OpenGLOpenGL 3.3
Versiunea OpenCLOpenCL 1.1
PredecesorGeForce 8
SuccesorGeForce 100

NVIDIA GeForce 9800 GX2

Gigabyte GeForce 9500 GT

Specificații GeForce seria 9

Model 9800 9600 9500 9400 9300
GX2 GTX+ GTX GT GT Green GT GT Green GSO 512 GSO GT GT G.S.
Data de lansare 18.03.08 18.07.08 01.04.08 18.07.08 - 21.02.08 - - 29.04.08 18.07.08 26.08.08 -
GPU 2 x G92 G92b G92 G92b G94 G94b G94 G92 G96 G98
Număr de tranzistori, milioane 2 x 754 754 505 754 314 -
Proces tehnic, nm 65 55 65 65 / 55 55 65 / 55 55 65 55 65
Frecvența miezului, MHz 600 738 675 600 550 650 600 650 550 567
Frecvența unității shader, MHz 1500 1836 1688 1512 1375 1625 1500 1625 1375 1400
Numărul de procesoare de flux 2 x 128 128 112 64 48 96 32 16 8
Numărul de blocuri de textură 2 x 64 64 56 32 24 48 16 8
Numărul de blocuri de rasterizare 2 x 16 16 12 8 4
Performanță, GFLOPS 2 x 576 705 648 504 462 312 288 234 396 134,4 67,2 33,6
Umplerea scenei, miliarde de pixeli / 2 x 9,6 11,8 10,8 9,6 8,8 10,4 9,6 7,8 6,6 4,4 2,2
Umplerea scenei, miliarde de tex / 2 x 38,4 47,2 43,2 33,6 30,8 20,8 19,2 15,6 26,4 8,8 4,4 4,5
Memorie video standard GDDR3 DDR2
Lățimea magistralei memorie video, biți 2 x 256 256 192 128 64
Frecvența memoriei video, MHz 1000 1100 900 800 500
Lățimea de bandă a memoriei, GB/ 2 x 64,0 70,4 57,6 38,4 16,0 8,0
Capacitate memorie video, MB 2 x 512 512 / 1024 512 384 512 256
Consumul de energie, W 265 140 165 105 75 95 60 90 100 50 30
Interfață PCI Express 2.0 x16
Suport pentru versiunea API Direct3D 10, OpenGL 3.3, OpenCL 1.1
Suport pentru versiunea Shader Model Shader Model 4.0

Seria GeForce 9800

NVIDIA GeForce 9800GX2

  • magistrala PCI Express 2.0;
  • Două nuclee grafice G92-450 (65 nm) care funcționează la 600 MHz;
  • 256 (2 × 128) procesoare de flux care funcționează la 1500 MHz;
  • 1024 MB (2 × 512 MB) memorie video GDDR3 cu o interfață de 256 de biți și o frecvență de 1000 MHz;
  • Consumul de energie este de 265 W;
  • Compatibil cu DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Suport Quad SLI.

De fapt, este un card dual bazat pe o pereche de 8800GTS 512 MB. Această placă video este o continuare a conceptului de acceleratoare dual-chip GX2, care au fost găsite în seria NVIDIA GeForce 7900.

NVIDIA GeForce 9800GTX+

  • magistrala PCI Express 2.0;
  • Miez grafic G92b-400 (55 nm), care funcționează la 738 MHz;
  • 128 de procesoare de flux care funcționează la 1836 MHz;
  • 1024 MB sau 512 MB GDDR3
  • Consumul de energie este de 140 W;
  • Suport SLI cu 3 căi.

Este o versiune a GeForce 9800GTX pe o tehnologie de proces de 55 nm cu frecvențe crescute și consum redus de energie. Puțin superioară ca performanță față de AMD/ATI Radeon 4850. Ulterior a fost redenumit GeForce GTS 250.

NVIDIA GeForce 9800GTX

  • magistrala PCI Express 2.0;
  • Miez grafic G92-400 (65 nm), care funcționează la 675 MHz;
  • 128 de procesoare de flux care funcționează la 1688 MHz;
  • memorie video GDDR3 de 1024 MB sau 512 MB cu o interfață de 256 de biți și o frecvență de 1100 MHz;
  • Consumul de energie este de 168 W;
  • Compatibil cu DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Suport SLI cu 3 căi.

Analog NVIDIA GeForce 8800GTS 512 MB cu frecvențe crescute. Foarte repede a cedat loc lui 9800GTX+, care a fost lansat urgent ca răspuns la lansarea AMD/ATI Radeon 4850/4870, care avea performanțe mai mari.

NVIDIA GeForce 9800GT

  • magistrala PCI Express 2.0;
  • Miez grafic G92-400 (65-nm/55-nm), care funcționează la 600 MHz;
  • 112 procesoare de flux;
  • 1024 MB sau 512 MB GDDR3
  • Consumul de energie este de 105 W;
  • Compatibil cu DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Suport SLI bidirecțional.

Analog NVIDIA GeForce 8800GT 512 MB.

NVIDIA GeForce 9800GT Verde

  • magistrala PCI Express 2.0;
  • Miez grafic G92-400 (55 nm), care funcționează la 550 MHz;
  • 112 procesoare de flux;
  • 1024 MB sau 512 MB memorie video GDDR3 cu interfață pe 256 de biți;
  • Consumul de energie este de 75 W;
  • Compatibil cu DirectX 10.0 Shader Model 4.0 OpenGL 3.3;
  • Suport SLI bidirecțional.
tehnologie (nm)90 80 65/55 tranzistoare (M)681 289 210 754 505 314 procesoare universale128 32 16 128 64 32 blocuri de textură32 16 8 64 32 16 amestecarea blocurilor24 8 16 8 magistrala de memorie384 (64x6)128 (64x2)256 (64x4)128 (64x2) tipuri de memorieDDR, GDDR2, GDDR3, GDDR4 magistrală de sistem cu cipPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 x 400MHz interfețeIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTVIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMIIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMI
DisplayPort umbritoare de vârfuri4.0 pixel shaders4.0 precizia calculului pixelilorFP32 precizia calculului vârfurilorFP32 formate de texturăFP32)
FP16
I8
DXTC, S3TC
3Dc formate de randareFP32
FP16
I8
10
alte MRTExistă AntialiasingTAA (poligon transparent AA)
CSAA 2x-16x
generația Z2x în modul fără culoare tampon de șablonbilateral tehnologia umbreihărți umbre hardware
optimizarea umbrelor geometrice

Specificațiile cardurilor de referință bazate pe familia G8X

Hartăcip
obosi
Blocuri ALU/TMUfrecvența centrală (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)completati
rata (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16x
96/24 500 800(1600) 320GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16x
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16x
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
Hartăcip
obosi
Blocuri ALU/TMUfrecvența centrală (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)completati
rata (Mpix)

Detalii: G80, familia GeForce 8800

Specificații G80

  • Numele oficial al cipului GeForce 8800
  • Nume de cod G80
  • tehnologie 90 nm
  • 681 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea fluxului de vârfuri și pixeli, precum și alte tipuri posibile de date
  • Suport hardware pentru cele mai recente inovații DirectX 10, inclusiv noul model de shader - Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare de la shader (ieșire flux)
  • Bus de memorie pe 384 de biți, 6 controlere independente pe 64 de biți, suport GDDR4
  • Frecvența de bază 575 GHz (GeForce 8800 GTX)
  • 128 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,35 GHz pentru 8800 GTX)
  • 32 de unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 64 de unități de filtrare biliniară (adică, este posibilă filtrarea triliniară gratuită, precum și filtrarea anizotropă care este de două ori mai rapidă ca viteză)
  • - dimensiunea blocului de planificare - 8x4 (32) pixeli.
  • 6 blocuri ROP largi (24 de pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32 (adică HDR+AA este posibil). Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanța de vârf a întregului subsistem este de până la 96 de mostre MSAA (+ 96 Z) pe ciclu de ceas, în modul fără culoare (numai Z) - 192 de mostre pe ciclu.
  • Toate interfețele sunt furnizate pe un cip NVIO extern suplimentar (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Scalabilitate foarte bună a arhitecturii, puteți bloca sau elimina memoria și controlerele ROP pe rând (6 în total), unități shader (8 unități TMU+ALU în total)

Specificațiile plăcii de referință GeForce 8800 GTX

  • Frecvența de bază 575 MHz
  • Frecvența procesorului universal 1350 MHz
  • Număr de blocuri de textură - 32, blocuri de amestecare - 24
  • Capacitate de memorie 768 megabytes
  • Lățimea de bandă a memoriei 86,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 13,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 18,4 gigatexeli pe secundă.
  • conector SLI
  • Bus PCI-Express 16x
  • RRP 599 USD

Specificațiile cardului de referință GeForce 8800 GTS

  • Frecvența miezului 500 MHz
  • Frecvența procesorului universal 1200 MHz
  • Număr de procesoare universale 96
  • Număr de blocuri de textură - 24, blocuri de amestecare - 20
  • Tip de memorie GDDR3, 1,1 ns (frecvență standard 2*900 MHz)
  • Capacitate de memorie 640 megaocteți
  • Rata maximă de umplere teoretică este de 10,0 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 12,0 gigatexeli pe secundă.
  • Doi conectori DVI-I (Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 449 USD

Arhitectură

Așteptăm de mult timp trecerea la arhitecturi grafice unificate. Acum putem afirma un fapt - odată cu apariția GeForce 8800, această tranziție a avut loc, iar vârful critic a fost deja depășit. Aceasta va fi urmată de o coborâre treptată a arhitecturilor similare în segmentele medii și bugetare și de dezvoltarea lor ulterioară, până la fuziunea lor cu arhitecturi de procesoare multi-core pe termen lung. Deci, haideți să facem cunoștință cu prima arhitectură unificată de la NVIDIA:

Avem în față întreaga diagramă a cipului. Cipul este format din 8 unități de calcul universale (procesoare shader) și deși NVIDIA vorbește despre 128 de procesoare, afirmând că fiecare ALU este unul, acest lucru este oarecum incorect - unitatea de execuție a comenzii este o astfel de unitate de procesor, în care sunt 4 TMU și 16 ALU. grupate. În total, așadar, avem 128 de ALU și 32 de TMU, dar granularitatea de execuție este de 8 blocuri, fiecare dintre acestea la un moment dat își poate face treaba, de exemplu, executa o parte dintr-un vertex, sau pixel sau geometrie shader peste un bloc de 32 de pixeli (sau bloc al numărului corespunzător de vârfuri și alte primitive). Toate ramurile, tranzițiile, condițiile etc. sunt aplicate în întregime unui bloc și, prin urmare, este cel mai logic să-l numim procesor shader, deși unul foarte larg.

Fiecare astfel de procesor este echipat cu propriul cache de prim nivel, care acum stochează nu doar texturi, ci și alte date care pot fi solicitate de procesorul shader. Este important să înțelegeți că fluxul principal de date, de exemplu, pixeli sau vârfuri, care sunt procesați, mișcându-se într-un cerc sub controlul cardinalului gri (blocul marcat în diagrama Thread Processor) nu este stocat în cache, ci curge , care este principala frumusețe a arhitecturilor grafice de astăzi - lipsa unui acces complet aleatoriu la nivelul primitivelor procesate.

Pe lângă unitatea de control și 8 procesoare compute shader, există 6 unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA (albastru, lângă blocurile cache L2) grupate cu controlere de memorie, cozi de scriere și un al doilea cache de nivel.

Astfel, am primit o arhitectură foarte largă (8 blocuri care procesează porțiuni de câte 32 de pixeli fiecare) capabilă să se scaleze fără probleme în ambele direcții. Adăugarea sau eliminarea controlerelor de memorie și a procesoarelor shader va scala debitul întregului sistem în consecință, fără a dezechilibra sau a crea blocaje. Aceasta este o soluție logică și frumoasă care implementează principalul avantaj al arhitecturii unificate - echilibru automat și eficiență ridicată în utilizarea resurselor disponibile.

Pe lângă blocurile shader și ROP-uri, există un set de blocuri de control și administrative:

  • Blocurile care lansează date de anumite formate (Vertex, Geometry și Pixel Thread Issue) pentru execuție sunt un fel de gatekeeper care pregătesc date pentru zdrobitorul de numere în procesoarele shader în conformitate cu formatul de date, shader-ul curent și starea acestuia, condițiile de ramificare, etc.
  • Setup/Raster/ZCull - un bloc care transformă vârfurile în pixeli - aici se realizează instalarea, rasterizarea triunghiului în blocuri de 32 de pixeli, bloc preliminar HSR.
  • Input Assembler este un bloc care selectează date geometrice și alte date inițiale din memoria sistemului sau memoria locală, colectând structuri de date inițiale din fluxuri care vor merge din exterior la intrarea „caruselului” nostru. Și la sfârșit, după multe cercuri sub controlul setărilor de vârf, geometrie, pixel shader și blending, vom obține pixeli gata (și neteziți, dacă este necesar) din blocurile ROP.

Apropo, o mică digresiune: este clar că în viitor aceste blocuri vor deveni mai generale și nu vor fi atât de legate de anumite tipuri de shadere. Acestea. se va transforma pur și simplu în blocuri universale care lansează date pentru calcularea și conversia formatelor - de exemplu, de la un shader la altul, de la vertex la pixel etc. Acest lucru nu va introduce nicio modificare fundamentală în arhitectură; diagrama va arăta și va funcționa aproape la fel, cu excepția unui număr mai mic de blocuri speciale „gri”. Deja, toate cele trei blocuri Thread Issue sunt cel mai probabil (într-adevăr) un bloc cu funcționalități comune și adăugiri contextuale:

Procesorul Shader și TMU/ALU

Deci, în fiecare dintre cele 8 unități shader există 16 ALU scalare. Ceea ce, din nou, ne oferă potențiala oportunitate de a le crește eficiența încărcării până la 100%, indiferent de codul shader. ALU-urile funcționează la o frecvență dublă și astfel se potrivesc sau depășesc (în funcție de operațiunile shader) 8 ALU-uri vector cu patru căi de stil vechi (G70) la aceeași frecvență de bază de bază. NVIDIA oferă următorul calcul de performanță maximă:

Este valabil însă pentru varianta cea mai dezavantajoasă pentru alții, când au loc două înmulțiri. În viața reală, merită să împărțiți acest avantaj la o dată și jumătate sau cam așa ceva. Dar, în orice caz, aceste ALU scalare, datorită vitezei de ceas mai mari și numărului lor, vor depăși toate cipurile existente anterior. Cu posibila excepție a configurației SLI a lui G71, în cazul shader-urilor care nu sunt cele mai avantajoase pentru noua arhitectură.

Interesant este că precizia tuturor ALU-urilor este FP32 și, având în vedere noua arhitectură, nu prevedem niciun beneficiu pentru shadere-urile FP16 cu precizie redusă. Un alt punct interesant este suportul pentru calcule în format întreg. Acest articol este necesar pentru implementarea SM4. La implementarea aritmeticii, se respectă standardul IEEE 754, ceea ce îl face potrivit pentru calcule serioase non-game - științifice, statistice, economice etc.

Acum despre interacțiunea unităților de textură și ALU într-o unitate de umbrire:

Operația de eșantionare și filtrare a texturilor nu necesită resurse ALU și acum poate fi realizată complet în paralel cu calculele matematice. Generarea coordonatelor texturii (în diagramă - A) încă ocupă o parte din timpul ALU. Acest lucru este logic dacă dorim să folosim 100% tranzistorii cipului, deoarece generarea coordonatelor texturii necesită operații standard flotante și ar fi imprudent să avem ALU separate pentru aceasta.

Modulele de textură în sine au următoarea configurație:

Există 4 module pentru adresarea texturilor TA (determinarea adresei exacte pentru eșantionare prin coordonate) și de două ori mai multe module pentru filtrarea biliniară TF. De ce este asta? Acest lucru permite, cu un consum moderat de tranzistor, să se ofere o filtrare triliniară gratuită, cinstită sau să se reducă la jumătate scăderea vitezei în timpul filtrării anizotrope. Viteza la rezoluții obișnuite, cu filtrare regulată și fără AA a fost de mult timp lipsită de sens - iar generația anterioară de acceleratoare se descurcă bine în astfel de condiții. Noul cip acceptă atât formatele de textură FP16/FP32, cât și corecția gamma SRGB la intrare (TMU) și la ieșire (ROP).

Iată specificațiile modelului shader al noilor procesoare care îndeplinesc cerințele SM4:

Există schimbări cantitative și calitative semnificative - din ce în ce mai puține restricții pentru shadere, tot mai multe în comun cu CPU-ul. Până acum, fără nici un acces aleatoriu special (o astfel de operație a apărut în SM4 - elementul Load Op din diagramă, dar eficiența sa în scopuri generale este încă discutabilă, mai ales în primele implementări), dar nu există nicio îndoială că acest aspect va va fi dezvoltat în curând, deoarece suportul pentru formatele FP a fost dezvoltat de-a lungul acestor 5 ani - de la primele mostre din NV30 până la o conductă totală, de la capăt la cap la FP32, în toate modurile, acum în G80.

După cum ne amintim, pe lângă cele 8 unități shader, există 6 unități ROP:

Diagrama arată două căi separate pentru Z și C, dar în realitate este doar un set de ALU care se împarte în două grupuri atunci când procesează pixeli de culoare sau acționează ca un grup atunci când procesează în modul Z-Only, dublând astfel debitul. În zilele noastre, nu are rost să numărăm pixeli individuali - sunt deja destui; este mai important să calculăm câte mostre MSAA pot fi procesate pe ciclu de ceas. În consecință, cu MSAA 16x, cipul poate produce 6 pixeli întregi pe ciclu de ceas, cu 8x - 12 etc. Interesant este că scalabilitatea lucrului cu frame-buffer este excelentă - după cum ne amintim, fiecare unitate ROP funcționează cu propriul controler de memorie și nu interferează cu cele vecine.

Și, în cele din urmă, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing, acum nu există restricții asupra imaginației dezvoltatorilor, iar HDR de-a lungul întregii conducte nu necesită modificarea secvenței generale a construcției cadrelor, chiar și în modul AA. .

CSAA

A apărut și o nouă metodă de netezire - CSAA. Un studiu detaliat al acestuia va fi în curând pe site, dar deocamdată observăm că această metodă este în multe privințe similară cu abordarea ATI și se ocupă, de asemenea, de modele pseudo-stochastice și de răspândirea eșantioanelor în zonele geometrice adiacente (pixelul este mânjiți, pixelii nu au o limită ascuțită, dar par să se deplaseze unul în celălalt cu punctul AA, acoperind o anumită zonă). Mai mult, culorile mostrelor și adâncimea sunt stocate separat de informațiile despre locația lor și, astfel, pot exista 16 mostre pe pixel, dar, de exemplu, doar 8 valori de adâncime calculate - ceea ce economisește și mai mult lățimea de bandă și ciclurile de ceas.

Se știe că MSAA clasic în moduri mai mari de 4x devine foarte solicitant din punct de vedere al memoriei, în timp ce calitatea crește din ce în ce mai puțin. Noua metodă corectează acest lucru, permițând ca anti-aliasing de 16x să fie considerabil mai bun decât MSAA de 16x, cu un cost de calcul comparabil cu MSAA de 4x.

NVIO

O altă inovație în G80 este interfețele plasate în afara cipului principal de accelerație. Un cip separat numit NVIO este acum responsabil pentru ele:

Acest cip integrează:

  • 2 * 400 MHz RAMDAC
  • 2 * Dual Link DVI (sau LVDS)
  • Ieșire HDTV

Subsistemul de ieșire arată astfel:

Precizia este întotdeauna de 10 biți pe componentă. Desigur, în segmentul mid-range, și mai ales în soluțiile bugetare, un cip extern separat poate să nu fie reținut, dar pentru cardurile scumpe o astfel de soluție are mai multe avantaje decât dezavantaje. Interfețele ocupă o zonă semnificativă a cipului, depind foarte mult de interferențe și necesită o sursă de alimentare specială. Prin eliminarea tuturor acestor probleme cu un cip extern, puteți câștiga calitatea semnalului de ieșire și flexibilitatea configurației și, de asemenea, nu complicați proiectarea unui cip deja complex, ținând cont de modurile optime pentru RAMDAC-urile pe cip.

Detalii: familiile G84/G86, GeForce 8600 și 8500

Specificații G84

  • Numele oficial al cipului este GeForce 8600
  • Nume de cod G84
  • tehnologie 80 nm
  • 289 de milioane de tranzistori
  • Ceas de bază de până la 675 MHz (GeForce 8600 GTS)
  • ALU funcționează la o frecvență mai mult decât dublă (1,45 GHz pentru GeForce 8600 GTS)
  • 16 unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 16 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă care să fie mai eficientă ca viteză)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 8600 GTS

  • Frecvența de bază 675 MHz
  • Frecvența procesorului universal 1450 MHz
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 32,0 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 5,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 10,8 gigatexeli pe secundă.
  • Consum de energie de până la 71 W
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 199-229 USD

Specificațiile cardului de referință GeForce 8600 GT

  • Frecvența miezului 540 MHz
  • Frecvența procesorului universal 1180 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16 (vezi sintetice), blocuri de amestecare 8
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 22,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,3 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 8,6 gigatexeli pe secundă.
  • Consum de energie de până la 43 W
  • conector SLI
  • Bus PCI-Express 16x
  • Preț recomandat 149-159 USD

Specificații G86

  • Numele oficial al cipului este GeForce 8500
  • Nume de cod G86
  • tehnologie 80 nm
  • 210 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv noul model de shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Ceas de bază de până la 450 MHz (GeForce 8500 GT)
  • ALU-urile funcționează la frecvență dublă (900 MHz pentru GeForce 8500 GT)
  • 16 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP de precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • 8 unități de textură, suport pentru componente FP16 și FP32 în texturi
  • 8 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă mai eficientă din punct de vedere al vitezei)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile cardului de referință GeForce 8500 GT

  • Frecvența miezului 450 MHz
  • Frecvența procesorului universal 900 MHz
  • Frecvența efectivă a memoriei 800 MHz (2*400 MHz)
  • Tip de memorie DDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 12,8 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 3,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 3,6 gigatexeli pe secundă.
  • Consum de energie până la 40 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Ieșire TV, ieșire HDTV, suport opțional HDCP
  • Preț recomandat 89-129 USD

Arhitectura G84 si G86

Deja din specificații este clar că G84 este ceva între un sfert și o treime din flagship-ul liniei G80. În ceea ce privește numărul de procesoare universale, este un sfert, iar în ceea ce privește numărul de unități ROP și controlere de memorie, este o treime. Este mai dificil cu unitățile de textură; nu pare să fie un sfert, dar nici jumătate, despre asta vom vorbi mai jos. G86, la rândul său, este în general ceva interesant - în ceea ce privește puterea de calcul este doar 1/8 din G80, iar în ceea ce privește ROP este tot același 1/3. Evident, NVIDIA nu se grăbește să lanseze cipuri low-end care sunt rapide din punct de vedere computațional.

Întrebarea principală aici este: acest trimestru și 1/8 vor fi suficiente pentru a concura cu soluțiile actuale și cu viitoarele cipuri AMD? NVIDIA a redus prea mult numărul de blocuri? Mai mult, nu se poate spune că ambele cipuri sunt prea mici ca număr de tranzistori... G84 are aproape jumătate din tranzistoarele G80, iar G86 are aproape o treime. Se pare că soluția este un compromis; dacă ar fi lăsat jumătate din blocurile G80, cipul ar fi fost prea scump de produs și ar fi fost un concurent de succes pentru propriul GeForce 8800 GTS.

În viitorul apropiat, cel mai probabil, pe baza tehnologiei 65 nm va fi posibil să se realizeze cipuri mai productive pentru intervalele de preț medii și mai mici, dar deocamdată asta s-a întâmplat. Ne vom uita la performanța noilor cipuri în testele sintetice și de joc, dar putem spune deja că G84 și G86 ar putea să nu fie prea rapide din cauza numărului mic de ALU; cel mai probabil vor fi aproximativ la egalitate cu soluțiile actuale. de preturi similare.

Nu ne vom opri prea mult asupra arhitecturii G84 și G86; sunt puține modificări în comparație cu G80; tot ce s-a spus în recenzia GeForce 8800, ajustată pentru caracteristicile cantitative, rămâne valabil. Dar totuși, vom descrie principalele puncte care merită atenția noastră și vom prezenta câteva diapozitive dedicate specificațiilor arhitecturale ale noilor cipuri.

G80 este format din opt unități de calcul universale (procesoare shader); NVIDIA preferă să vorbească despre 128 de procesoare. Unitatea de execuție a comenzilor, aparent, este o întreagă unitate de procesor în care sunt grupate 4 TMU-uri și 16 ALU-uri. Fiecare dintre blocuri la un moment dat poate executa o parte dintr-un vertex, pixel sau geometrie shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și calcule fizice. Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele computaționale shader, există șase unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Această arhitectură este capabilă să se scaleze în ambele direcții, ceea ce s-a făcut în noile soluții. Am menționat deja această soluție frumoasă, care implementează principalul avantaj al arhitecturii unificate - echilibrul automat și eficiența ridicată a utilizării resurselor disponibile în articolul despre GeForce 8800. De asemenea, sa presupus că soluția de nivel mediu ar consta din jumătate din unitățile de calcul, iar soluția ar fi bazată pe două procesoare shader și un ROP va deveni bugetar. Din păcate, în timp ce GeForce 8800 avea opt procesoare, alcătuind 32 de TMU și 128 de ALU, noile cipuri și-au redus numărul mai mult decât ne așteptam inițial. Aparent, circuitul G84 arată astfel:

Adică totul a rămas neschimbat, cu excepția numărului de blocuri și controlere de memorie. Există câteva modificări minore ale blocurilor de textură care sunt vizibile în această imagine, dar despre asta vom vorbi mai târziu. Curios, unde s-au dus atâtea tranzistoare dacă în G84 rămâneau doar 32 de procesoare? G84 are aproape jumătate din tranzistori în comparație cu G80, cu un număr semnificativ redus de canale de memorie, ROP-uri și procesoare shader. Iar G86 are o mulțime de tranzistori, cu doar 16 procesoare...

De asemenea, este interesant cât de bine va fi echilibrată încărcarea în aplicațiile reale între execuția vertex-urilor, pixelilor și geometry shader, deoarece numărul de unități de execuție universale a devenit acum semnificativ mai mic. Mai mult decât atât, arhitectura unificată în sine pune noi provocări pentru dezvoltatori; atunci când o folosesc, aceștia vor trebui să se gândească la cum să folosească în mod eficient puterea comună dintre vertex, pixel și geometrie shaders. Să dăm un exemplu simplu, concentrându-ne pe calculele pixelilor. În acest caz, o creștere a încărcării blocurilor de vârf într-o arhitectură tradițională nu va duce la o scădere a performanței, dar într-o arhitectură unificată va provoca o modificare a echilibrului și o scădere a cantității de resurse pentru calculele pixelilor. Ne vom uita cu siguranță la problema performanței, iar acum vom continua să studiem schimbările în arhitectura G84 și G86.

Procesor Shader și TMU/ALU

Schema unităților shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător; pentru G84 și G86 schema nu s-a schimbat, iar performanța lor este ușor de recalculat. ALU-urile din cipuri funcționează, de asemenea, la o frecvență dublă și sunt scalare, ceea ce permite o eficiență ridicată. Nu există diferențe de funcționalitate, acuratețea tuturor ALU-urilor este FP32, există suport pentru calcule în format întreg, iar implementarea respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Dar modulele de textură s-au schimbat în comparație cu cele folosite în G80; NVIDIA asigură că s-au făcut modificări arhitecturale în noile cipuri pentru a crește performanța procesoarelor unificate. În G80, fiecare motor de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ciclu de ceas. Se pretinde că în noile cipuri primul număr a fost dublat și este capabil să dubleze numărul de mostre de textură. Adică, modulele de textură G84 și G86 au următoarea configurație (pentru comparație, diagrama bloc G80 este afișată în stânga):

Potrivit NVIDIA, acum fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF). G80 a avut patru module TA și opt TF, ceea ce a făcut posibilă furnizarea de filtrare triliniară „gratuită” cu un consum redus de tranzistor sau reducerea la jumătate a vitezei în timpul filtrării anizotrope, ceea ce este util în special pentru acceleratoarele de nivel superior, unde filtrarea anizotropă este aproape întotdeauna utilizate de utilizatori. Vom verifica corectitudinea acestor informații în partea practică; asigurați-vă că vă uitați la analiza testelor sintetice corespunzătoare, deoarece acestea contrazic aceste date.

Toate celelalte funcționalități ale unităților de textură sunt aceleași, sunt acceptate formatele de textură FP16/FP32 și altele.Numai dacă pe G80 FP16 filtrarea texturii a fost și la viteză maximă din cauza numărului dublat de unități de filtrare, acest lucru nu mai este cazul la mijloc. - și soluții de nivel scăzut (din nou, cu condiția ca modificările de mai sus să existe efectiv).

Blocuri ROP, scrieri framebuffer, anti-aliasing

Blocurile ROP, dintre care au fost șase în G80 și două în noile cipuri, nu s-au schimbat:

Fiecare bloc procesează patru pixeli (16 subpixeli), pentru un total de 8 pixeli pe ceas pentru culoare și Z. În modul numai Z, sunt procesate de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. La fel ca și G80, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing.

Noua metodă de anti-aliasing cunoscută de la GeForce 8800 este Coverage Sampled Antialiasing (CSAA), care a fost descrisă în detaliu în materialul corespunzător:

Pe scurt, esența metodei este că culorile și adâncimea eșantionului sunt stocate separat de informațiile despre locația lor; un pixel poate avea 16 eșantioane și doar 8 valori de adâncime calculate, ceea ce economisește lățimea de bandă și ciclurile de ceas. CSAA vă permite să scăpați de transmiterea și stocarea unei singure culori sau valorii Z per subpixel, rafinând valoarea medie a unui pixel de ecran cu informații mai detaliate despre modul în care acel pixel se suprapune marginile triunghiurilor. Drept urmare, noua metodă ne permite să obținem un mod anti-aliasing de 16x, care este vizibil de calitate mai mare decât MSAA 4x, cu costuri de calcul comparabile cu acesta. Și în rarele cazuri în care CSAA nu funcționează, rezultatul este un MSAA normal într-un grad mai mic, mai degrabă decât nici un anti-aliasing.

PureVideo HD

Să trecem la cele mai interesante schimbări. Se pare că G84 și G86 au inovații care le deosebesc chiar și de G80! Aceasta se referă la procesorul video încorporat, care în noile cipuri a extins suportul pentru PureVideo HD. Se afirmă că aceste cipuri ușurează complet procesorul central al sistemului atunci când decodează toate tipurile de date video comune, inclusiv cel mai „greu” format H.264.

G84 și G86 folosesc un nou model de procesor video programabil PureVideo HD, mai puternic decât cel folosit în G80 și care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps; face toată munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să jucați toate HD-DVD-urile și discurile Blu-ray existente chiar și pe computerele cu un singur nucleu de putere medie.

Procesorul video din G84/G86 este format din mai multe părți: a doua generație de procesor video (VP2), care îndeplinește sarcinile de IDCT, compensarea mișcării și eliminarea artefactelor de blocare pentru formatele MPEG2, VC-1 și H.264, care acceptă decodarea hardware. a celui de-al doilea flux; procesor de flux (BSP), care efectuează sarcini de decodare statistică CABAC și CAVLC pentru formatul H.264, iar acestea sunt unele dintre cele mai consumatoare de timp calcule; Motorul de decodare a datelor protejat AES128, al cărui scop este clar din numele său - decriptează datele video utilizate în protecția împotriva copierii pe discuri Blu-ray și HD-DVD. Iată cum arată diferențele în gradul de suport hardware pentru decodarea video pe diferite cipuri video:

Sarcinile efectuate de cipul video sunt evidențiate cu albastru, iar sarcinile efectuate de procesorul central cu verde. După cum puteți vedea, dacă generația anterioară a ajutat procesorul doar cu unele sarcini, atunci noul procesor video folosit în ultimele cipuri face toate sarcinile în sine. Vom verifica eficacitatea soluțiilor în materiale viitoare privind studiul eficienței decodării video hardware; NVIDIA oferă următoarele cifre în materiale: atunci când se utilizează un procesor modern dual-core și decodificarea datelor software, redarea Blu-ray și HD -Discurile DVD consumă până la 90-100% din timpul procesorului, cu decodarea hardware pe un cip video din generația anterioară pe același sistem până la 60-70%, iar cu noul motor pe care l-au dezvoltat pentru G84 și G86 doar 20% . Aceasta, desigur, nu arată ca decodarea hardware completă revendicată, dar este totuși foarte, foarte eficientă.

La momentul anunțului, noile caracteristici apărute în PureVideo HD funcționează doar în versiunea pe 32 de biți a Windows Vista, iar suportul pentru PureVideo HD în Windows XP va apărea abia în vară. În ceea ce privește calitatea redării video, post-procesare, deinterlacing etc., NVIDIA și-a îmbunătățit performanța chiar și în GeForce 8800, iar noile cipuri nu sunt diferite în acest sens.

CUDA, non-game and physics computing

Articolul despre GeForce 8800 a menționat că performanța de vârf crescută a aritmeticii flotante în noile acceleratoare și flexibilitatea arhitecturii unificate shader au devenit suficiente pentru calcularea fizicii în aplicațiile de jocuri și sarcini chiar mai serioase: modelare matematică și fizică, economice și statistice. modele și calcule, recunoaștere a imaginii, procesare a imaginilor, grafică științifică și multe altele. În acest scop, a fost lansat un API special orientat spre calcul, care este convenabil pentru adaptarea și dezvoltarea programelor care transferă calculele la GPU CUDA (Compute Unified Device Architecture).

Mai multe informații despre CUDA sunt scrise în articolul despre G80; ne vom concentra pe o altă tendință la modă recent - suportul pentru calcule fizice pe GPU. NVIDIA numește tehnologia sa similară Quantum Effects. Se declară că toate cipurile video de nouă generație, inclusiv G84 și G86 luate în considerare astăzi, sunt potrivite pentru calcule de acest fel, permițând transferarea unei părți din sarcină de la CPU la GPU. Exemplele specifice includ simulări de fum, foc, explozii, dinamica părului și îmbrăcămintei, blană și lichide și multe altele. Dar deocamdată vreau să scriu mai multe despre altceva. Faptul că până acum ni se arată doar poze din aplicații de testare cu un număr mare de obiecte fizice calculate prin cipuri video și nu există încă nici măcar un indiciu de jocuri cu astfel de suport.

Suport pentru interfețe externe

După cum ne amintim, GeForce 8800 a fost oarecum surprins de o altă inovație neașteptată - un cip suplimentar care acceptă interfețe externe în afara celei principale. În cazul plăcilor video de top, aceste sarcini sunt gestionate de un cip separat numit NVIO, care integrează: două RAMDAC-uri de 400 MHz, două Dual Link DVI (sau LVDS), HDTV-Out. Chiar și atunci am presupus că un cip extern separat era puțin probabil să supraviețuiască în segmentele mijlocii și inferioare și asta este de fapt ceea ce s-a întâmplat. În G84 și G86, suportul pentru toate aceste interfețe este încorporat în cipul însuși.

GeForce 8600 GTS are două ieșiri Dual Link DVI-I cu suport HDCP; aceasta este prima placă video de pe piață cu capabilități similare (HDCP și Dual Link împreună). În ceea ce privește HDMI, suportul pentru acest conector este implementat integral în hardware și poate fi implementat de producători pe carduri special concepute. Dar suportul GeForce 8600 GT și 8500 GT pentru HDCP și HDMI este opțional, dar ele pot fi implementate de producători individuali în produsele lor.

Detalii: G92, familia GeForce 8800

Specificații G92

  • Nume de cod al cipului G92
  • tehnologie 65 nm
  • 754 milioane de tranzistori (mai mult de G80)
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Frecvența de bază 600 MHz (GeForce 8800 GT)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,5 GHz pentru GeForce 8800 GT)
  • 112 (aceasta este pentru GeForce 8800 GT, dar probabil 128 în total) ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport pentru precizie FP pe 32 de biți în standardul IEEE 754, MAD+MUL fără pierderi de ceas)
  • 56 (64) unități de adresare a texturii cu suport pentru componente FP16 și FP32 în texturi (vezi explicația de mai jos)
  • 56 (64) unități de filtrare biliniare (cum ar fi G84 și G86, fără filtrare triliniară gratuită și filtrare anizotropă mai eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile plăcii de referință GeForce 8800 GT 512MB

  • Frecvența miezului 600 MHz
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 249 USD

Specificațiile cardului de referință GeForce 8800 GT 256MB

  • Frecvența miezului 600 MHz
  • Frecvența procesorului universal 1500 MHz
  • Număr de procesoare universale 112
  • Număr de blocuri de textură 56, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,4 GHz (2*700 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei este de 44,8 gigaocteți pe secundă.
  • Rata de umplere maximă teoretică este de 9,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 33,6 gigatexeli pe secundă.
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 199 USD

Specificațiile cardului de referință GeForce 8800 GTS 512MB

  • Frecvența miezului 650 MHz
  • Număr de procesoare universale 128
  • Frecvența efectivă a memoriei 2,0 GHz (2*1000 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 64,0 gigaocteți pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 41,6 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 349-399 USD

Arhitectura chip G92

Din punct de vedere arhitectural, G92 nu este foarte diferit de G80. Din câte știm, putem spune că G92 este flagship-ul liniei (G80), transferat la un nou proces tehnologic, cu mici modificări. NVIDIA indică în materialele sale că cipul are 7 unități de shader mari și, în consecință, 56 de unități de textură, precum și patru ROP-uri largi, numărul de tranzistori din cip ridică suspiciuni că nu spun ceva. Soluțiile anunțate inițial nu implică toate blocurile care există fizic în cip; numărul lor în G92 este mai mare decât cel activ în GeForce 8800 GT. Deși complexitatea crescută a cipului se explică prin includerea unui cip NVIO anterior separat, precum și a unui procesor video de nouă generație. În plus, numărul de tranzistori a fost influențat și de unitățile TMU mai complexe. De asemenea, este probabil ca cache-urile să fi fost mărite pentru a crește eficiența utilizării magistralei de memorie pe 256 de biți.

De data aceasta, pentru a concura cu cipurile AMD corespunzătoare, NVIDIA a decis să lase un număr destul de mare de blocuri în cipul mid-end. Presupunerea noastră din revizuirea G84 și G86 a fost confirmată că cipuri mult mai puternice pentru gama de prețuri medii vor fi lansate pe baza tehnologiei de 65 nm. Există puține modificări arhitecturale în cipul G92 și nu ne vom opri asupra acestui lucru în detaliu. Tot ce s-a spus mai sus despre soluțiile din seria GeForce 8 rămâne în vigoare; vom repeta doar câteva dintre principalele puncte dedicate specificațiilor arhitecturale ale noului cip.

Pentru noua soluție, NVIDIA oferă următoarea diagramă în documentele sale:

Adică, dintre toate modificările, doar un număr redus de blocuri și unele modificări în TMU, care sunt descrise mai jos. După cum sa indicat mai sus, există îndoieli că acesta este cazul fizic, dar oferim o descriere bazată pe ceea ce scrie NVIDIA. G92 este format din șapte unități de calcul universale (procesoare shader), NVIDIA vorbește în mod tradițional despre 112 procesoare (cel puțin în primele soluții GeForce 8800 GT). Fiecare dintre blocuri, în care sunt grupate 8 TMU-uri și 16 ALU-uri, poate executa o parte dintr-un vertex, pixel sau geometry shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și alte calcule (negrafice). Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele compute shader, există patru unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Procesoare de uz general și TMU-uri

Diagrama unităților shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător; pentru G92 nu s-a schimbat; performanța lor este ușor de recalculat pe baza modificărilor frecvenței de ceas. ALU-urile din cipuri funcționează la o frecvență mai mare decât dublă, sunt scalare, ceea ce permite o eficiență ridicată. Încă nu se știe despre diferențele funcționale, dacă acuratețea calculelor FP64 este disponibilă în acest cip sau nu. Cu siguranță există suport pentru calcule în format întreg, iar implementarea tuturor calculelor respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Unitățile de textura din G92 nu sunt aceleași cu cele din G80, ele urmează soluția TMU din G84 și G86, cărora li s-au făcut modificări arhitecturale pentru a crește performanța. Să ne reamintim că în G80 fiecare unitate de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ceas, iar în G84/G86 TMU-urile sunt capabile de două ori mai multe mostre de textură. Adică, fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF):

Să nu credeți că cele 56 de blocuri ale GeForce 8800 GT în aplicații reale vor fi mai puternice decât cele 32 de blocuri ale GeForce 8800 GTX. Cu filtrarea triliniară și/sau anizotropă activată, aceasta din urmă va fi mai rapidă, deoarece pot lucra mai mult la filtrarea probelor de textură. Vom verifica aceste informații în partea practică analizând rezultatele testelor sintetice corespunzătoare. Toate celelalte funcționalități ale blocurilor de textură nu s-au schimbat; sunt acceptate formatele de textură FP16, FP32 și altele.

Blocuri ROP, scrieri framebuffer, anti-aliasing

Nici blocurile POR în sine nu s-au schimbat, dar numărul lor s-a schimbat. G80 a avut șase ROP-uri, iar în noua soluție există patru dintre ele, pentru a reduce costul producției de cipuri și PCB-uri pentru plăcile video. Această reducere poate fi, de asemenea, pentru a evita crearea unei concurențe prea mari cu soluțiile existente de top.

Fiecare bloc procesează patru pixeli sau 16 sub-pixeli, pentru un total de 16 pixeli pe ceas pentru culoare și Z. Modul numai Z procesează de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. Ca și în cazul G80, formatele cadru tampon FP32 și FP16 sunt pe deplin acceptate împreună cu antialiasing.

Noua metodă de antialiasing, Coverage Sampled Antialiasing (CSAA), cunoscută din cipurile anterioare din serie, este acceptată. O altă inovație este că GeForce 8800 GT a actualizat algoritmul de antialiasing al transparenței. Utilizatorului i s-au oferit două opțiuni: multisampling (TRMS) și supersampling (TRSS), prima a avut performanțe foarte bune, dar nu a funcționat eficient în toate jocurile, iar a doua a fost de înaltă calitate, dar lentă. GeForce 8800 GT introduce o nouă metodă de eșantionare multiplă a suprafețelor translucide, care îi îmbunătățește calitatea și performanța. Acest algoritm oferă aproape aceeași îmbunătățire a calității ca și supraeșantionarea, dar are performanțe ridicate - doar cu câteva procente mai proaste pentru modul fără anti-aliasing al suprafețelor translucide activat.

PureVideo HD

Una dintre schimbările așteptate la G92 a fost procesorul video încorporat de a doua generație, cunoscut de la G84 și G86, care a primit suport extins pentru PureVideo HD. Se știe deja că această versiune a procesorului video ușurează aproape complet CPU atunci când decodifică toate tipurile de date video, inclusiv formatele „grele” H.264 și VC-1.

La fel ca G84/G86, G92 folosește un nou model de procesor video programabil PureVideo HD, care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, realizând munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să redați toate cele existente. Discuri HD-DVD și Blu-ray chiar și pe computere cu un singur nucleu de putere medie. Decodarea VC-1 nu este la fel de eficientă ca H.264, dar este suportată în continuare de noul procesor.

Puteți citi mai multe despre procesorul video de a doua generație în partea dedicată cipurilor G84 și G86. Performanța soluțiilor video moderne a fost parțial testată în cel mai recent material privind studiul eficienței decodării video hardware.

PCI Express 2.0

Printre inovațiile reale ale modelului G92 se numără suportul pentru magistrala PCI Express 2.0. A doua versiune de PCI Express dublează lățimea de bandă standard, de la 2,5 Gb/s la 5 Gb/s, rezultând că conectorul x16 poate transfera date la viteze de până la 8 GB/s în fiecare direcție, spre deosebire de 4 GB/s pentru versiunea 1.x. Este foarte important ca PCI Express 2.0 să fie compatibil cu PCI Express 1.1, iar plăcile video vechi vor funcționa pe plăcile de bază noi, iar plăcile video noi cu suport pentru a doua versiune vor rămâne funcționale în plăcile fără suportul acesteia. Cu condiția să existe suficientă putere externă și fără creșterea lățimii de bandă a interfeței, desigur.

Pentru a asigura compatibilitatea cu soluțiile existente PCI Express 1.0 și 1.1, specificația 2.0 acceptă rate de transfer de 2,5 Gbps și 5 Gbps. Compatibilitatea cu versiunea inversă PCI Express 2.0 permite ca soluțiile vechi de 2,5 Gb/s să fie utilizate în sloturi de 5,0 Gb/s care vor funcționa la viteze mai mici, iar un dispozitiv proiectat conform specificațiilor versiunii 2.0 poate suporta atât viteze de 2,5 Gb/s, cât și 5 Gb/s. În teorie, compatibilitatea este bună, dar în practică pot apărea probleme cu unele combinații de plăci de bază și plăci de expansiune.

Suport pentru interfețe externe

După cum era de așteptat, cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe situate în afara celei principale (două RAMDAC de 400 MHz, două DVI Dual Link (sau LVDS), HDTV-Out), în acest caz a fost inclus în cipul în sine, suportul pentru toate aceste interfețe este încorporat în G92 însuși.

Plăcile video GeForce 8800 GT au de obicei două ieșiri Dual Link DVI-I cu suport HDCP. În ceea ce privește HDMI, suportul pentru acest conector este implementat pe deplin; acesta poate fi implementat de producători pe carduri special concepute, care pot fi lansate puțin mai târziu. Deși prezența unui conector HDMI pe o placă video este complet opțională, acesta poate fi înlocuit cu succes de un adaptor de la DVI la HDMI, care este inclus cu majoritatea plăcilor video moderne.

Spre deosebire de plăcile video din seria RADEON HD 2000 de la AMD, GeForce 8800 GT nu conține un cip audio încorporat necesar pentru a suporta transmisia audio DVI folosind un adaptor HDMI. Această capacitate de a transmite semnale video și audio printr-un singur conector este solicitată în primul rând pe cardurile de gamă medie și inferioară care sunt instalate în carcase medii mici, iar GeForce 8800 GT este cu greu potrivită pentru acest rol.

Detalii: G94, familia GeForce 9600

Specificații G94

  • Nume de cod al cipului G94
  • tehnologie 65 nm
  • 505 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 256 de biți, patru controlere independente de 64 de biți
  • Frecvența de bază 650 MHz (GeForce 9600 GT)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,625 GHz pentru GeForce 9600 GT)
  • 64 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 32 de unități de adresare a texturii cu suport pentru componentele FP16 și FP32 în texturi
  • 32 de unități de filtrare biliniare (ca și în G84 și G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrare triliniară gratuită și filtrare anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 4 blocuri ROP largi (16 pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 64 de mostre MSAA (+ 64 Z) per ceas, în modul numai Z 128 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 9600 GT

  • Frecvența miezului 650 MHz
  • Frecvența procesorului universal 1625 MHz
  • Număr de procesoare universale 64
  • Număr de blocuri de textură 32, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 57,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 10,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 20,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Consum de energie de până la 95 W
  • Preț recomandat 169-189 USD

Arhitectura G94

Din punct de vedere arhitectural, G94 se deosebește de G92 doar prin caracteristicile cantitative; are un număr mai mic de unități de execuție: ALU și TMU. Și nu există multe diferențe față de G8x. După cum a fost scris în materialele anterioare, linia de cipuri G9x este o linie G8x ușor modificată, transferată la o nouă tehnologie de proces cu modificări arhitecturale minore. Noul cip mid-end are 4 unități mari de shader (64 ALU-uri în total) și 32 de unități de textură, precum și patru ROP-uri largi.

Deci, există puține modificări arhitecturale în cip, aproape toate sunt descrise mai sus și tot ceea ce a spus anterior pentru soluțiile anterioare rămâne valabil. Și aici vă prezentăm doar diagrama principală a cipului G94:

Unitățile de textură din G94 sunt exact aceleași ca în G84/G86 și G92, ele pot selecta de două ori mai multe eșantioane filtrate biliniar din texturi comparativ cu G80. Dar 32 de unități de textură ale GeForce 9600 GT în aplicațiile reale nu vor funcționa mai repede decât 32 de unități ale GeForce 8800 GTX doar din cauza frecvenței de operare mai mari a GPU-ului. Acest lucru poate fi observat numai atunci când filtrarea triliniară și anizotropă sunt dezactivate, ceea ce este extrem de rar, doar în acei algoritmi care folosesc eșantioane nefiltrate, de exemplu, în maparea paralaxă.

Un alt avantaj al lui G9x și GeForce 9600 GT în special, NVIDIA ia în considerare o anumită tehnologie nouă de compresie implementată în unitățile ROP, care, conform estimărilor acestora, funcționează cu 15% mai eficient decât cea folosită în cipurile anterioare. Aparent, acestea sunt exact aceleași modificări arhitecturale la G9x, concepute pentru a asigura o eficiență mai mare a magistralei de memorie pe 256 de biți în comparație cu cea pe 320/384 de biți despre care am scris mai devreme. Desigur, în aplicațiile reale nu va exista o diferență atât de mare; chiar și conform NVIDIA în sine, creșterea de la inovații în ROP este cel mai adesea de doar aproximativ 5%.

În ciuda tuturor modificărilor din arhitectura G9x care adaugă complexitate cipului, despre care vom vorbi mai jos, numărul de tranzistori din cip este destul de mare. Probabil, această complexitate a GPU-ului se explică prin includerea unui cip NVIO anterior separat, a unui procesor video de nouă generație, a complicațiilor blocurilor TMU și ROP, precum și a altor modificări ascunse: modificări ale dimensiunilor cache-ului etc.

PureVideo HD

G94 are același procesor video de a doua generație cunoscut de la G84/G86 și G92, care oferă suport îmbunătățit pentru PureVideo HD. Descarcă aproape complet CPU atunci când decodifică cele mai comune tipuri de date video, inclusiv H.264, VC-1 și MPEG-2, cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, făcând munca de decodare în întregime în hardware. Și deși decodarea VC-1 de la NVIDIA nu este la fel de eficientă ca H.264, o mică parte a procesului utilizează puterea procesorului central, dar vă permite totuși să redați toate HD DVD-urile și discurile Blu-Ray existente chiar și pe computerele medii. . Puteți citi mai multe despre procesorul video de a doua generație în recenziile noastre despre G84/G86 și G92, link-uri către care sunt oferite la începutul articolului.

Ei bine, vom observa îmbunătățirile software aduse PureVideo HD, care au fost programate să coincidă cu lansarea GeForce 9600 GT. Cele mai recente inovații în PureVideo HD includ decodarea dual-stream, modificări dinamice ale contrastului și saturația culorilor. Aceste modificări nu sunt exclusive pentru GeForce 9600 GT, iar în noile versiuni de drivere, începând cu ForceWare 174, sunt introduse pentru toate cipurile care acceptă accelerarea hardware completă folosind PureVideo HD. Pe lângă placa video pe care o luăm în considerare astăzi, această listă include: GeForce 8600 GT/GTS, GeForce 8800 GT și GeForce 8800 GTS 512.

Îmbunătățirea dinamică a contrastului este destul de comună în electronicele de larg consum, televizoarele și playerele video și poate îmbunătăți imaginile cu o expunere sub-optimă (combinație de viteză a obturatorului și diafragmă). Pentru a face acest lucru, după decodificarea fiecărui cadru, histograma acestuia este analizată, iar dacă cadrul are un contrast slab, histograma este recalculată și aplicată imaginii. Iată un exemplu (în stânga este imaginea inițială, în dreapta este cea procesată):

Același lucru este valabil și pentru îmbunătățirea dinamică a saturației culorilor introdusă în PureVideo HD. Electrocasnicele folosesc, de asemenea, niște algoritmi de îmbunătățire a imaginii de foarte mult timp, spre deosebire de monitoarele de computer, care reproduc totul așa cum este, ceea ce în multe cazuri poate face ca imaginea să fie prea plictisitoare și lipsită de viață. Echilibrul automat al componentelor de culoare din datele video, calculat și pentru fiecare cadru nou, îmbunătățește percepția umană asupra imaginii prin ajustarea ușoară a saturației culorilor acesteia:

Decodificarea dual-stream vă permite să accelerați decodarea și post-procesarea a două fluxuri video diferite simultan. Acest lucru poate fi util în moduri de ieșire, cum ar fi imagine în imagine, care sunt utilizate în unele discuri Blu-Ray și HD DVD (de exemplu, a doua imagine poate arăta regizorul filmului comentându-și scenele prezentate în fereastra principală ), edițiile filmelor RĂZBOI și Resident Evil: Extinction sunt echipate cu astfel de capabilități.

O altă inovație utilă în cea mai recentă versiune de PureVideo HD este capacitatea de a rula simultan shell-ul Aero în sistemul de operare Windows Vista în timp ce redați videoclipuri accelerate de hardware în modul ferestre, ceea ce nu era posibil anterior. Nu pot spune că acest lucru îi îngrijorează foarte mult pe utilizatori, dar este o oportunitate bună.

Suport pentru interfețe externe

Suportul pentru interfețele externe pe GeForce 9600 GT este similar cu GeForce 8800 GT, cu excepția, probabil, a suportului DisplayPort integrat. Cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe în afara celei principale din G94, a fost inclus și în cip în sine.

Placile video GeForce 9600 GT de referinta au doua iesiri DVI Dual Link cu suport HDCP. Suportul HDMI și DisplayPort este implementat în hardware pe cip, iar aceste porturi pot fi implementate de partenerii NVIDIA pe carduri special concepute. Mai mult, așa cum asigură NVIDIA, spre deosebire de G92, suportul DisplayPort este acum încorporat în cip și nu sunt necesare transmițătoare externe. În general, conectorii HDMI și DisplayPort de pe o placă video sunt opționali; aceștia pot fi înlocuiți cu adaptoare simple de la DVI la HDMI sau DisplayPort, care sunt uneori incluse cu plăcile video moderne.

Detalii: familiile G96, GeForce 9400 și 9500

Specificații G96

  • Nume de cod al cipului G96
  • tehnologie 65 nm
  • 314 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Frecvența miezului 550 MHz
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,4 GHz)
  • 32 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 16 unități de adresare a texturii cu suport pentru componentele FP16 și FP32 în texturi
  • 16 unități de filtrare biliniare (ca și în cazul G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrarea triliniară gratuită și filtrarea anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, DisplayPort) sunt integrate pe cip

Specificațiile cardului de referință GeForce 9500 GT

  • Frecvența miezului 550 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2/GDDR3
  • Capacitate memorie 256/512/1024 megabytes
  • Viteza teoretică de eșantionare a texturii de până la 8,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Specificațiile cardului de referință GeForce 9400 GT

  • Frecvența miezului 550 MHz
  • Frecvența procesorului universal 1400 MHz
  • Numărul de procesoare universale 16
  • Număr de blocuri de textură 8, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 25,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 4,4 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Arhitectura G96

Din punct de vedere arhitectural, G96 este exact jumătate din cipul G94, care, la rândul său, diferă de G92 doar prin caracteristicile cantitative. G96 are jumătate din numărul tuturor unităților de execuție: ALU, TMU și ROP. Noul cip video este conceput pentru soluții din cel mai mic interval de preț și are două unități mari de shader (32 ALU în total) și 16 unități de textură, precum și opt ROP-uri. De asemenea, are o magistrală de memorie redusă, de la 256 de biți la 128 de biți, în comparație cu G94 și G92. Toate capabilitățile hardware rămân neschimbate, singurele diferențe sunt în performanță.

Detalii: G92b, familia GeForce GTS 200

Specificațiile plăcii video de referință GeForce GTS 250

  • Frecvența de bază 738 MHz
  • Frecvența procesorului universal 1836 MHz
  • Număr de procesoare universale 128
  • Număr de blocuri de textură 64, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 2200 (2*1100) MHz
  • Tip de memorie GDDR3
  • Capacitate memorie 512/1024/2048 megabytes
  • Lățimea de bandă a memoriei 70,4 GB/s
  • Rata maximă de umplere teoretică este de 11,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 47,2 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • Conector SLI dual
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP, HDMI, DisplayPort
  • Consum de energie de până la 150 W (un conector cu 6 pini)
  • Versiune cu două sloturi
  • RRP 129 USD/149 USD/169 USD

În general, această „nouă” placă video bazată pe cipul G92 de 55 nm nu este diferită de GeForce 9800 GTX+. Lansarea noului model poate fi parțial justificată prin instalarea nu a 512 megaocteți de memorie video, cum ar fi 9800 GTX+, ci a unui gigabyte, care afectează foarte mult performanța în moduri grele cu setări de calitate maximă, rezoluții înalte cu anti- full-screen. aliasing activat. Există și opțiuni de doi gigabyte, dar acesta este mai mult un avantaj de marketing decât unul real.

În astfel de condiții, versiunile mai vechi ale GeForce GTS 250 ar trebui să fie într-adevăr vizibil mai rapide decât GeForce 9800 GTX+ datorită capacității crescute de memorie. Iar unele dintre cele mai moderne jocuri nu vor beneficia nici măcar de cele mai mari rezoluții. Totul ar fi bine, dar unii producători de carduri au lansat GeForce 9800 GTX+ cu un gigaoctet de memorie chiar mai devreme...

Producția de cipuri video G92b folosind standarde tehnologice de 55 nm și o simplificare vizibilă a designului PCB a permis NVIDIA să creeze o soluție similară GeForce 9800 GTX din punct de vedere al caracteristicilor, dar cu un preț mai mic și un consum redus de energie și disipare a căldurii. Și acum, pentru a furniza energie GeForce GTS 250, pe placă este instalat un singur conector de alimentare PCI-E cu 6 pini. Acestea sunt toate diferențele principale față de 9800 GTX+.

Înainte de lansarea plăcii video 9800 GT, mulți analiști și jurnaliști credeau că știrile despre apariția acestui adaptor grafic sunt fictive. După lansarea oficială, informațiile au devenit mai clare. Mulți au dat în avans laurii primatului acestei plăci video ca navă de vârf, dar inginerii NVIDIA au atribuit din nou un nou număr vechilor soluții arhitecturale.

GeForce 9800 GT. Caracteristicile plăcii video

Acceleratorul grafic este o copie aproape completă a predecesorului său - iar unele teste arată că generația anterioară rămâne mai productivă. Noul produs este echipat cu același procesor - G92, chiar și procesul tehnic nu s-a schimbat. A rămas 65 nm, deși mulți credeau că 9800 GT va folosi 55 nm. Frecvențele GPU nu s-au schimbat.

Pe pagina oficială a site-ului web care prezintă GeForce 9800 GT, caracteristicile sunt următoarele:

  • GPU: G92. 112 procesoare universale, 64 de unități de textură.
  • Memorie video: GDDR3, volumul său este de 512 MB.
  • Lățimea magistralei de memorie: 256 biți.
  • Frecvența GPU: 600 MHz.
  • Frecvența unității shader: 1500 MHz.
  • Frecvența memoriei: 1800 (900) MHz.
  • Porturi: 2xDVI-I, ieșire TV.

Singurul lucru care distinge placa video în cauză de 8800 GT este suportul pentru tehnologia HybridPower. Vă permite să comutați între grafica integrată și o placă discretă în modul automat, ceea ce face posibilă reducerea consumului de energie și

Această actualizare nu poate fi considerată importantă pentru GeForce 9800 GT; nu modifică caracteristicile și, în plus, HybridPower nu poate funcționa decât dacă este îndeplinită o condiție. Placa de baza trebuie sa suporte si aceasta tehnologie si in acelasi timp sa aiba un nucleu grafic integrat.

Echipamente

Placa video vine intr-o cutie destul de mare, care este decorata cu predominanta culorilor albastre.

În interiorul acestuia puteți găsi următoarele:

  • Placa video în sine.
  • Setați S-Video-lalea.
  • Cablu de alimentare suplimentar.
  • Disc laser cu drivere și programe.
  • Unele revizuiri includ jocul Civilization IV.
  • Manualul utilizatorului.

Textele imprimate pe ambalaj sunt în principal publicitare. Cu toate acestea, printre odele laudative aduse tehnologiilor utilizate în produsul GeForce 9800 GT, caracteristicile tehnice indică direct faptul că acceleratorul grafic se bazează pe 8800 GT. O astfel de onestitate este de invidiat.

Prezența unui număr mare de adaptoare și cabluri de alimentare indică faptul că NVIDIA îi pasă de clienții săi. Dacă trebuie să conectați echipamente non-standard sau mai multe monitoare, nu va trebui să cumpărați componente suplimentare; trebuie doar să le scoateți din cutie.

Proiecta

Se poate observa că atunci când comparăm GeForce 8800 GT și GeForce 9800 GT, caracteristicile lor coincid mult mai mult decât designul lor. Desigur, în termeni generali o placă seamănă cu alta, dar este imposibil să spunem că sunt identice.

Ambele plăci video au aceleași dimensiuni, locația conectorului de alimentare, contactele SLI acoperite cu un dop de cauciuc, precum și poziția GPU-ului și a memoriei IC. Cipurile sunt fabricate de SAMSUNG, iar timpul de eșantionare este de 1 ns.

Locația lanțurilor rămase este complet diferită. Mai mult, inginerii au decis să nu economisească bani și au folosit dispozitive de cea mai înaltă calitate. Puteți vedea condensatoare solide pe placa video. Durata de viață a unor astfel de produse este mult mai lungă decât a celor electrolitice tradiționale. Bobinele de sufocare cu miez de ferită au, de asemenea, timpi de funcționare mai lungi decât cele standard.

Chiar dacă specialiștii au făcut tot posibilul cu instalarea semiconductoarelor, numărul de porturi pentru conectarea dispozitivelor de ieșire în mod clar nu ajunge la reprezentanții de top. Există doi conectori DVI-I și o ieșire TV. Dar acest dezavantaj este compensat de toate adaptoarele necesare.

Sistem de răcire

La o inspecție mai atentă a modelului 9800 GT, performanța sa nu pare impresionantă. Cu toate acestea, există un element pe acceleratorul grafic care poate da un avans multor alte plăci video - acesta este radiatorul. În primul rând, trebuie menționat că sistemul de răcire instalat a fost produs de celebra companie germană Zalman, care este unul dintre liderii pieței.

Este realizat cat se poate de simplu, dar functioneaza foarte silentios si cat mai eficient. Miezul pe care se aplică pasta termică atinge suprafața GPU-ului. Prin el sunt trecute o pereche de tuburi de șase milimetri; forma lor este similară cu litera „U”. Sunt fabricate din cupru. Deasupra tuburilor sunt plăci subțiri de aluminiu.

Întregul design este completat în mod logic de un șurub de viteză redusă cu un diametru de 8 cm.Viteza sa de rotație este selectată automat în funcție de nivelul de încărcare a nucleului grafic. Singurul dezavantaj al sistemului de răcire este că ascunde al doilea slot PCI EXPRESS. Dacă trebuie să instalați simultan două plăci video în computer, va trebui să vă gândiți la înlocuirea radiatorului.

Overclockare

GT, care are specificații modeste, poate fi overclockat folosind software-ul inclus. Aplicația GamerHUD poate schimba frecvențele în timp ce sistemul de operare rulează fără reporniri inutile. În plus, programul vă permite să manipulați tensiunea furnizată GPU-ului, cu toate acestea, utilizarea acestei caracteristici nu este recomandată, astfel încât procesorul video să nu se defecteze.

După overclocking, placa video GeForce 9800 GT continuă să funcționeze stabil, ale cărei caracteristici de frecvență au fost mărite la 700 MHz pentru GPU, 1700 MHz pentru unitatea de shader și 2000 MHz pentru memorie. Temperatura dupa overclock creste usor, fapt pentru care putem multumi sistemului de racire.