Ce serie de card geforce 9800 gt. Determinarea seriei de produse de plăci video Nvidia. Suport pentru interfețe externe

tehnologie (nm)90 80 65/55 tranzistoare (M)681 289 210 754 505 314 procesoare universale128 32 16 128 64 32 blocuri de textură32 16 8 64 32 16 amestecarea blocurilor24 8 16 8 magistrala de memorie384 (64x6)128 (64x2)256 (64x4)128 (64x2) tipuri de memorieDDR, GDDR2, GDDR3, GDDR4 magistrală de sistem cu cipPCI-Express 16xPCI-Express 2.0 16x RAMDAC2 x 400MHz interfețeIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTVIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMIIeșire TV
TV-In (necesită cip de captare)
2 x DVI Dual Link
Ieșire HDTV
HDMI
DisplayPort umbritoare de vârfuri4.0 pixel shaders4.0 precizia calculului pixelilorFP32 precizia calculului vârfurilorFP32 formate de texturăFP32)
FP16
I8
DXTC, S3TC
3Dc formate de randareFP32
FP16
I8
10
alte MRTExistă AntialiasingTAA (poligon transparent AA)
CSAA 2x-16x
generația Z2x în modul fără culoare tampon de șablonbilateral tehnologia umbreihărți umbre hardware
optimizarea umbrelor geometrice

Specificațiile cardurilor de referință bazate pe familia G8X

Hartăcip
obosi
Blocuri ALU/TMUfrecvența centrală (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)completati
rata (Mpix)
GeForce 8500 GTG86
PEG16x
16/8 450 400(800) 256 DDR212.8
(128)
3600
GeForce 8600 GTG84
PEG16x
32/16 540 700(1400) 256 GDDR322.4
(128)
8600 4300
GeForce 8600 GTSG84
PEG16x
32/16 675 1000(2000) 256 GDDR332.0
(128)
10800 5400
GeForce 8800 GTS 320MBG80
PEG16x
96/24 500 800(1600) 320GDDR364.0
(320)
12000 10000
GeForce 8800 GTS 640MBG80
PEG16x
96/24 500 800(1600) 640 GDDR364.0
(320)
12000 10000
GeForce 8800 GTXG80
PEG16x
128/32> 575 900(1800) 768 GDDR386.4
(384)
18400 13800
GeForce 8800 UltraG80
PEG16x
128/32 612 1080(2160) 768 GDDR3104.0
(384)
19600 14700
GeForce 8800 GT 256 MBG92
PEG16x
112/56 600 700(1400) 256 GDDR344.8
(256)
33600 9600
GeForce 8800 GT 512MBG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 8800 GTS 512MBG92
PEG16x
128/64 650 1000(2000) 512 GDDR364.0
(256)
41600 10400
GeForce 8800GSG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9400 GTG96
PEG16x
16/8 550 800(1600) 256/512 GDDR225.6
(128)
4400 4400
GeForce 9500 GTG96
PEG16x
32/16 550 800(1600) 256/512 GDDR2/GDDR325.6
(128)
8800 4400
GeForce 9600 GSOG92
PEG16x
96/48 550 800(1600) 384 GDDR338.4
(192)
26400 6600
GeForce 9600 GTG94
PEG16x
64/32 650 900(1800) 512 GDDR357.6
(256)
20800 10400
GeForce 9800 GTG92
PEG16x
112/56 600 900(1800) 512 GDDR357.6
(256)
33600 9600
GeForce 9800 GTXG92
PEG16x
128/64 675 1100(2200) 512 GDDR370.4
(256)
43200 10800
GeForce 9800 GTX+G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
GeForce 9800 GX22xG92
PEG16x
2x(128/64)600 1000(2000) 2x512 GDDR32x64.0
(2x256)
76800 19200
GeForce GTS 250G92
PEG16x
128/64 738 1100(2200) 512/1024 GDDR370.4
(256)
47200 11800
Hartăcip
obosi
Blocuri ALU/TMUfrecvența centrală (MHz)frecvența memoriei (MHz)capacitate de memorie (MB)PSP (GB)Rata Texel (Mtex)completati
rata (Mpix)

Detalii: G80, familia GeForce 8800

Specificații G80

  • Numele oficial al cipului GeForce 8800
  • Nume de cod G80
  • tehnologie 90 nm
  • 681 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea fluxului de vârfuri și pixeli, precum și alte tipuri posibile de date
  • Suport hardware pentru cele mai recente inovații DirectX 10, inclusiv noul model de shader - Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare de la shader (ieșire flux)
  • Bus de memorie pe 384 de biți, 6 controlere independente pe 64 de biți, suport GDDR4
  • Frecvența de bază 575 GHz (GeForce 8800 GTX)
  • 128 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,35 GHz pentru 8800 GTX)
  • 32 de unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 64 de unități de filtrare biliniară (adică, este posibilă filtrarea triliniară gratuită, precum și filtrarea anizotropă care este de două ori mai rapidă ca viteză)
  • - dimensiunea blocului de planificare - 8x4 (32) pixeli.
  • 6 blocuri ROP largi (24 de pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32 (adică HDR+AA este posibil). Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanța de vârf a întregului subsistem este de până la 96 de mostre MSAA (+ 96 Z) pe ciclu de ceas, în modul fără culoare (numai Z) - 192 de mostre pe ciclu.
  • Toate interfețele sunt furnizate pe un cip NVIO extern suplimentar (2 RAMDAC, 2 Dual DVI, HDMI, HDTV)
  • Scalabilitate foarte bună a arhitecturii, puteți bloca sau elimina memoria și controlerele ROP pe rând (6 în total), unități shader (8 unități TMU+ALU în total)

Specificațiile plăcii de referință GeForce 8800 GTX

  • Frecvența de bază 575 MHz
  • Frecvența procesorului universal 1350 MHz
  • Număr de blocuri de textură - 32, blocuri de amestecare - 24
  • Capacitate de memorie 768 megabytes
  • Lățimea de bandă a memoriei 86,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 13,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 18,4 gigatexeli pe secundă.
  • conector SLI
  • Bus PCI-Express 16x
  • RRP 599 USD

Specificațiile cardului de referință GeForce 8800 GTS

  • Frecvența miezului 500 MHz
  • Frecvența procesorului universal 1200 MHz
  • Număr de procesoare universale 96
  • Număr de blocuri de textură - 24, blocuri de amestecare - 20
  • Tip de memorie GDDR3, 1,1 ns (frecvență standard 2*900 MHz)
  • Capacitate de memorie 640 megaocteți
  • Rata maximă de umplere teoretică este de 10,0 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 12,0 gigatexeli pe secundă.
  • Doi conectori DVI-I (Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 449 USD

Arhitectură

Așteptăm de mult timp trecerea la arhitecturi grafice unificate. Acum putem afirma un fapt - odată cu apariția GeForce 8800, această tranziție a avut loc, iar vârful critic a fost deja depășit. Aceasta va fi urmată de o coborâre treptată a arhitecturilor similare în segmentele medii și bugetare și de dezvoltarea lor ulterioară, până la fuziunea lor cu arhitecturi de procesoare multi-core pe termen lung. Deci, haideți să facem cunoștință cu prima arhitectură unificată de la NVIDIA:

Avem în față întreaga diagramă a cipului. Cipul este format din 8 unități de calcul universale (procesoare shader) și deși NVIDIA vorbește despre 128 de procesoare, afirmând că fiecare ALU este unul, acest lucru este oarecum incorect - unitatea de execuție a comenzii este o astfel de unitate de procesor, în care sunt 4 TMU și 16 ALU. grupate. În total, așadar, avem 128 de ALU și 32 de TMU, dar granularitatea de execuție este de 8 blocuri, fiecare dintre acestea la un moment dat își poate face treaba, de exemplu, executa o parte dintr-un vertex, sau pixel sau geometrie shader peste un bloc de 32 de pixeli (sau bloc al numărului corespunzător de vârfuri și alte primitive). Toate ramurile, tranzițiile, condițiile etc. sunt aplicate în întregime unui bloc și, prin urmare, este cel mai logic să-l numim procesor shader, deși unul foarte larg.

Fiecare astfel de procesor este echipat cu propriul cache de prim nivel, care acum stochează nu doar texturi, ci și alte date care pot fi solicitate de procesorul shader. Este important să înțelegeți că fluxul principal de date, de exemplu, pixeli sau vârfuri, care sunt procesați, mișcându-se într-un cerc sub controlul cardinalului gri (blocul marcat în diagrama Thread Processor) nu este stocat în cache, ci curge , care este principala frumusețe a arhitecturilor grafice de astăzi - lipsa unui acces complet aleatoriu la nivelul primitivelor procesate.

Pe lângă unitatea de control și 8 procesoare compute shader, există 6 unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA (albastru, lângă blocurile cache L2) grupate cu controlere de memorie, cozi de scriere și un al doilea cache de nivel.

Astfel, am primit o arhitectură foarte largă (8 blocuri care procesează porțiuni de câte 32 de pixeli fiecare) capabilă să se scaleze fără probleme în ambele direcții. Adăugarea sau eliminarea controlerelor de memorie și a procesoarelor shader va scala debitul întregului sistem în consecință, fără a dezechilibra sau a crea blocaje. Aceasta este o soluție logică și frumoasă care implementează principalul avantaj al arhitecturii unificate - echilibru automat și eficiență ridicată în utilizarea resurselor disponibile.

Pe lângă blocurile shader și ROP-uri, există un set de blocuri de control și administrative:

  • Blocurile care lansează date de anumite formate (Vertex, Geometry și Pixel Thread Issue) pentru execuție sunt un fel de gatekeeper care pregătesc date pentru zdrobitorul de numere în procesoarele shader în conformitate cu formatul de date, shader-ul curent și starea acestuia, condițiile de ramificare, etc.
  • Setup/Raster/ZCull - un bloc care transformă vârfurile în pixeli - aici se realizează instalarea, rasterizarea triunghiului în blocuri de 32 de pixeli, bloc preliminar HSR.
  • Input Assembler este un bloc care selectează date geometrice și alte date inițiale din memoria sistemului sau memoria locală, colectând structuri de date inițiale din fluxuri care vor merge din exterior la intrarea „caruselului” nostru. Și la sfârșit, după multe cercuri sub controlul setărilor de vârf, geometrie, pixel shader și blending, vom obține pixeli gata (și neteziți, dacă este necesar) din blocurile ROP.

Apropo, o mică digresiune: este clar că în viitor aceste blocuri vor deveni mai generale și nu vor fi atât de legate de anumite tipuri de shadere. Acestea. se va transforma pur și simplu în blocuri universale care lansează date pentru calcularea și conversia formatelor - de exemplu, de la un shader la altul, de la vertex la pixel etc. Acest lucru nu va introduce nicio modificare fundamentală în arhitectură; diagrama va arăta și va funcționa aproape la fel, cu excepția unui număr mai mic de blocuri speciale „gri”. Deja, toate cele trei blocuri Thread Issue sunt cel mai probabil (într-adevăr) un bloc cu funcționalități comune și adăugiri contextuale:

Procesorul Shader și TMU/ALU

Deci, în fiecare dintre cele 8 unități shader există 16 ALU scalare. Ceea ce, din nou, ne oferă potențiala oportunitate de a le crește eficiența încărcării până la 100%, indiferent de codul shader. ALU-urile funcționează la o frecvență dublă și astfel se potrivesc sau depășesc (în funcție de operațiunile shader) 8 ALU-uri vector cu patru căi de stil vechi (G70) la aceeași frecvență de bază de bază. NVIDIA oferă următorul calcul de performanță maximă:

Este valabil însă pentru varianta cea mai dezavantajoasă pentru alții, când au loc două înmulțiri. În viața reală, merită să împărțiți acest avantaj la o dată și jumătate sau cam așa ceva. Dar, în orice caz, aceste ALU scalare, datorită vitezei de ceas mai mari și numărului lor, vor depăși toate cipurile existente anterior. Cu posibila excepție a configurației SLI a lui G71, în cazul shader-urilor care nu sunt cele mai avantajoase pentru noua arhitectură.

Interesant este că precizia tuturor ALU-urilor este FP32 și, având în vedere noua arhitectură, nu prevedem niciun beneficiu pentru shadere-urile FP16 cu precizie redusă. Un alt punct interesant este suportul pentru calcule în format întreg. Acest articol este necesar pentru implementarea SM4. La implementarea aritmeticii, se respectă standardul IEEE 754, ceea ce îl face potrivit pentru calcule serioase non-game - științifice, statistice, economice etc.

Acum despre interacțiunea unităților de textură și ALU într-o unitate de umbrire:

Operația de eșantionare și filtrare a texturilor nu necesită resurse ALU și acum poate fi realizată complet în paralel cu calculele matematice. Generarea coordonatelor texturii (în diagramă - A) încă ocupă o parte din timpul ALU. Acest lucru este logic dacă dorim să folosim 100% tranzistorii cipului, deoarece generarea coordonatelor texturii necesită operații standard flotante și ar fi imprudent să avem ALU separate pentru aceasta.

Modulele de textură în sine au următoarea configurație:

Există 4 module pentru adresarea texturilor TA (determinarea adresei exacte pentru eșantionare prin coordonate) și de două ori mai multe module pentru filtrarea biliniară TF. De ce este asta? Acest lucru permite, cu un consum moderat de tranzistor, să se ofere o filtrare triliniară gratuită, cinstită sau să se reducă la jumătate scăderea vitezei în timpul filtrării anizotrope. Viteza la rezoluții obișnuite, cu filtrare regulată și fără AA a fost de mult timp lipsită de sens - iar generația anterioară de acceleratoare se descurcă bine în astfel de condiții. Noul cip acceptă atât formatele de textură FP16/FP32, cât și corecția gamma SRGB la intrare (TMU) și la ieșire (ROP).

Iată specificațiile modelului shader al noilor procesoare care îndeplinesc cerințele SM4:

Există schimbări cantitative și calitative semnificative - din ce în ce mai puține restricții pentru shadere, tot mai multe în comun cu CPU-ul. Până acum, fără nici un acces aleatoriu special (o astfel de operație a apărut în SM4 - elementul Load Op din diagramă, dar eficiența sa în scopuri generale este încă discutabilă, mai ales în primele implementări), dar nu există nicio îndoială că acest aspect va va fi dezvoltat în curând, deoarece suportul pentru formatele FP a fost dezvoltat de-a lungul acestor 5 ani - de la primele mostre din NV30 până la o conductă totală, de la capăt la cap la FP32, în toate modurile, acum în G80.

După cum ne amintim, pe lângă cele 8 unități shader, există 6 unități ROP:

Diagrama arată două căi separate pentru Z și C, dar în realitate este doar un set de ALU care se împarte în două grupuri atunci când procesează pixeli de culoare sau acționează ca un grup atunci când procesează în modul Z-Only, dublând astfel debitul. În zilele noastre, nu are rost să numărăm pixeli individuali - sunt deja destui; este mai important să calculăm câte mostre MSAA pot fi procesate pe ciclu de ceas. În consecință, cu MSAA 16x, cipul poate produce 6 pixeli întregi pe ciclu de ceas, cu 8x - 12 etc. Interesant este că scalabilitatea lucrului cu frame-buffer este excelentă - după cum ne amintim, fiecare unitate ROP funcționează cu propriul controler de memorie și nu interferează cu cele vecine.

Și, în cele din urmă, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing, acum nu există restricții asupra imaginației dezvoltatorilor, iar HDR de-a lungul întregii conducte nu necesită modificarea secvenței generale a construcției cadrelor, chiar și în modul AA. .

CSAA

A apărut și o nouă metodă de netezire - CSAA. Un studiu detaliat al acestuia va fi în curând pe site, dar deocamdată observăm că această metodă este în multe privințe similară cu abordarea ATI și se ocupă, de asemenea, de modele pseudo-stochastice și de răspândirea eșantioanelor în zonele geometrice adiacente (pixelul este mânjiți, pixelii nu au o limită ascuțită, dar par să se deplaseze unul în celălalt cu punctul AA, acoperind o anumită zonă). Mai mult, culorile mostrelor și adâncimea sunt stocate separat de informațiile despre locația lor și, astfel, pot exista 16 mostre pe pixel, dar, de exemplu, doar 8 valori de adâncime calculate - ceea ce economisește și mai mult lățimea de bandă și ciclurile de ceas.

Se știe că MSAA clasic în moduri mai mari de 4x devine foarte solicitant din punct de vedere al memoriei, în timp ce calitatea crește din ce în ce mai puțin. Noua metodă corectează acest lucru, permițând ca anti-aliasing de 16x să fie considerabil mai bun decât MSAA de 16x, cu un cost de calcul comparabil cu MSAA de 4x.

NVIO

O altă inovație în G80 este interfețele plasate în afara cipului principal de accelerație. Un cip separat numit NVIO este acum responsabil pentru ele:

Acest cip integrează:

  • 2 * 400 MHz RAMDAC
  • 2 * Dual Link DVI (sau LVDS)
  • Ieșire HDTV

Subsistemul de ieșire arată astfel:

Precizia este întotdeauna de 10 biți pe componentă. Desigur, în segmentul mid-range, și mai ales în soluțiile bugetare, un cip extern separat poate să nu fie reținut, dar pentru cardurile scumpe o astfel de soluție are mai multe avantaje decât dezavantaje. Interfețele ocupă o zonă semnificativă a cipului, depind foarte mult de interferențe și necesită o sursă de alimentare specială. Prin eliminarea tuturor acestor probleme cu un cip extern, puteți câștiga calitatea semnalului de ieșire și flexibilitatea configurației și, de asemenea, nu complicați proiectarea unui cip deja complex, ținând cont de modurile optime pentru RAMDAC-urile pe cip.

Detalii: familiile G84/G86, GeForce 8600 și 8500

Specificații G84

  • Numele oficial al cipului este GeForce 8600
  • Nume de cod G84
  • tehnologie 80 nm
  • 289 de milioane de tranzistori
  • Ceas de bază de până la 675 MHz (GeForce 8600 GTS)
  • ALU funcționează la o frecvență mai mult decât dublă (1,45 GHz pentru GeForce 8600 GTS)
  • 16 unități de textură, suport pentru componentele FP16 și FP32 în texturi
  • 16 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă care să fie mai eficientă ca viteză)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 8600 GTS

  • Frecvența de bază 675 MHz
  • Frecvența procesorului universal 1450 MHz
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 32,0 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 5,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 10,8 gigatexeli pe secundă.
  • Consum de energie de până la 71 W
  • conector SLI
  • Bus PCI-Express 16x
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 199-229 USD

Specificațiile cardului de referință GeForce 8600 GT

  • Frecvența miezului 540 MHz
  • Frecvența procesorului universal 1180 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16 (vezi sintetice), blocuri de amestecare 8
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei 22,4 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,3 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 8,6 gigatexeli pe secundă.
  • Consum de energie de până la 43 W
  • conector SLI
  • Bus PCI-Express 16x
  • Preț recomandat 149-159 USD

Specificații G86

  • Numele oficial al cipului este GeForce 8500
  • Nume de cod G86
  • tehnologie 80 nm
  • 210 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv noul model de shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Ceas de bază de până la 450 MHz (GeForce 8500 GT)
  • ALU-urile funcționează la frecvență dublă (900 MHz pentru GeForce 8500 GT)
  • 16 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport FP de precizie IEEE 754 pe 32 de biți, MAD+MUL fără pierdere de ceas)
  • 8 unități de textură, suport pentru componente FP16 și FP32 în texturi
  • 8 blocuri de filtrare biliniare (comparativ cu G80, nu există o filtrare triliniară gratuită și o filtrare anizotropă mai eficientă din punct de vedere al vitezei)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile cardului de referință GeForce 8500 GT

  • Frecvența miezului 450 MHz
  • Frecvența procesorului universal 900 MHz
  • Frecvența efectivă a memoriei 800 MHz (2*400 MHz)
  • Tip de memorie DDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 12,8 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 3,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii este de 3,6 gigatexeli pe secundă.
  • Consum de energie până la 40 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600)
  • conector SLI
  • Bus PCI-Express 16x
  • Ieșire TV, ieșire HDTV, suport opțional HDCP
  • Preț recomandat 89-129 USD

Arhitectura G84 si G86

Deja din specificații este clar că G84 este ceva între un sfert și o treime din flagship-ul liniei G80. În ceea ce privește numărul de procesoare universale, este un sfert, iar în ceea ce privește numărul de unități ROP și controlere de memorie, este o treime. Este mai dificil cu unitățile de textură; nu pare să fie un sfert, dar nici jumătate, despre asta vom vorbi mai jos. G86, la rândul său, este în general ceva interesant - în ceea ce privește puterea de calcul este doar 1/8 din G80, iar în ceea ce privește ROP este tot același 1/3. Evident, NVIDIA nu se grăbește să lanseze cipuri low-end care sunt rapide din punct de vedere computațional.

Întrebarea principală aici este: acest trimestru și 1/8 vor fi suficiente pentru a concura cu soluțiile actuale și cu viitoarele cipuri AMD? NVIDIA a redus prea mult numărul de blocuri? Mai mult, nu se poate spune că ambele cipuri sunt prea mici ca număr de tranzistori... G84 are aproape jumătate din tranzistoarele G80, iar G86 are aproape o treime. Se pare că soluția este un compromis; dacă ar fi lăsat jumătate din blocurile G80, cipul ar fi fost prea scump de produs și ar fi fost un concurent de succes pentru propriul GeForce 8800 GTS.

În viitorul apropiat, cel mai probabil, pe baza tehnologiei 65 nm va fi posibil să se realizeze cipuri mai productive pentru intervalele de preț medii și mai mici, dar deocamdată asta s-a întâmplat. Ne vom uita la performanța noilor cipuri în testele sintetice și de joc, dar putem spune deja că G84 și G86 ar putea să nu fie prea rapide din cauza numărului mic de ALU; cel mai probabil vor fi aproximativ la egalitate cu soluțiile actuale. de preturi similare.

Nu ne vom opri prea mult asupra arhitecturii G84 și G86; sunt puține modificări în comparație cu G80; tot ce s-a spus în recenzia GeForce 8800, ajustată pentru caracteristicile cantitative, rămâne valabil. Dar totuși, vom descrie principalele puncte care merită atenția noastră și vom prezenta câteva diapozitive dedicate specificațiilor arhitecturale ale noilor cipuri.

G80 este format din opt unități de calcul universale (procesoare shader); NVIDIA preferă să vorbească despre 128 de procesoare. Unitatea de execuție a comenzilor, aparent, este o întreagă unitate de procesor în care sunt grupate 4 TMU-uri și 16 ALU-uri. Fiecare dintre blocuri la un moment dat poate executa o parte dintr-un vertex, pixel sau geometrie shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și calcule fizice. Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele computaționale shader, există șase unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Această arhitectură este capabilă să se scaleze în ambele direcții, ceea ce s-a făcut în noile soluții. Am menționat deja această soluție frumoasă, care implementează principalul avantaj al arhitecturii unificate - echilibrul automat și eficiența ridicată a utilizării resurselor disponibile în articolul despre GeForce 8800. De asemenea, sa presupus că soluția de nivel mediu ar consta din jumătate din unitățile de calcul, iar soluția ar fi bazată pe două procesoare shader și un ROP va deveni bugetar. Din păcate, în timp ce GeForce 8800 avea opt procesoare, alcătuind 32 de TMU și 128 de ALU, noile cipuri și-au redus numărul mai mult decât ne așteptam inițial. Aparent, circuitul G84 arată astfel:

Adică totul a rămas neschimbat, cu excepția numărului de blocuri și controlere de memorie. Există câteva modificări minore ale blocurilor de textură care sunt vizibile în această imagine, dar despre asta vom vorbi mai târziu. Curios, unde s-au dus atâtea tranzistoare dacă în G84 rămâneau doar 32 de procesoare? G84 are aproape jumătate din tranzistori în comparație cu G80, cu un număr semnificativ redus de canale de memorie, ROP-uri și procesoare shader. Iar G86 are o mulțime de tranzistori, cu doar 16 procesoare...

De asemenea, este interesant cât de bine va fi echilibrată încărcarea în aplicațiile reale între execuția vertex-urilor, pixelilor și geometry shader, deoarece numărul de unități de execuție universale a devenit acum semnificativ mai mic. Mai mult decât atât, arhitectura unificată în sine pune noi provocări pentru dezvoltatori; atunci când o folosesc, aceștia vor trebui să se gândească la cum să folosească în mod eficient puterea comună dintre vertex, pixel și geometrie shaders. Să dăm un exemplu simplu, concentrându-ne pe calculele pixelilor. În acest caz, o creștere a încărcării blocurilor de vârf într-o arhitectură tradițională nu va duce la o scădere a performanței, dar într-o arhitectură unificată va provoca o modificare a echilibrului și o scădere a cantității de resurse pentru calculele pixelilor. Ne vom uita cu siguranță la problema performanței, iar acum vom continua să studiem schimbările în arhitectura G84 și G86.

Procesor Shader și TMU/ALU

Schema unităților shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător; pentru G84 și G86 schema nu s-a schimbat, iar performanța lor este ușor de recalculat. ALU-urile din cipuri funcționează, de asemenea, la o frecvență dublă și sunt scalare, ceea ce permite o eficiență ridicată. Nu există diferențe de funcționalitate, acuratețea tuturor ALU-urilor este FP32, există suport pentru calcule în format întreg, iar implementarea respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Dar modulele de textură s-au schimbat în comparație cu cele folosite în G80; NVIDIA asigură că s-au făcut modificări arhitecturale în noile cipuri pentru a crește performanța procesoarelor unificate. În G80, fiecare motor de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ciclu de ceas. Se pretinde că în noile cipuri primul număr a fost dublat și este capabil să dubleze numărul de mostre de textură. Adică, modulele de textură G84 și G86 au următoarea configurație (pentru comparație, diagrama bloc G80 este afișată în stânga):

Potrivit NVIDIA, acum fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF). G80 a avut patru module TA și opt TF, ceea ce a făcut posibilă furnizarea de filtrare triliniară „gratuită” cu un consum redus de tranzistor sau reducerea la jumătate a vitezei în timpul filtrării anizotrope, ceea ce este util în special pentru acceleratoarele de nivel superior, unde filtrarea anizotropă este aproape întotdeauna utilizate de utilizatori. Vom verifica corectitudinea acestor informații în partea practică; asigurați-vă că vă uitați la analiza testelor sintetice corespunzătoare, deoarece acestea contrazic aceste date.

Toate celelalte funcționalități ale unităților de textură sunt aceleași, sunt acceptate formatele de textură FP16/FP32 și altele.Numai dacă pe G80 FP16 filtrarea texturii a fost și la viteză maximă din cauza numărului dublat de unități de filtrare, acest lucru nu mai este cazul la mijloc. - și soluții de nivel scăzut (din nou, cu condiția ca modificările de mai sus să existe efectiv).

Blocuri ROP, scrieri framebuffer, anti-aliasing

Blocurile ROP, dintre care au fost șase în G80 și două în noile cipuri, nu s-au schimbat:

Fiecare bloc procesează patru pixeli (16 subpixeli), pentru un total de 8 pixeli pe ceas pentru culoare și Z. În modul numai Z, sunt procesate de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. La fel ca și G80, există suport complet pentru formatele de buffer de cadre FP32 și FP16, împreună cu antialiasing.

Noua metodă de anti-aliasing cunoscută de la GeForce 8800 este Coverage Sampled Antialiasing (CSAA), care a fost descrisă în detaliu în materialul corespunzător:

Pe scurt, esența metodei este că culorile și adâncimea eșantionului sunt stocate separat de informațiile despre locația lor; un pixel poate avea 16 eșantioane și doar 8 valori de adâncime calculate, ceea ce economisește lățimea de bandă și ciclurile de ceas. CSAA vă permite să scăpați de transmiterea și stocarea unei singure culori sau valorii Z per subpixel, rafinând valoarea medie a unui pixel de ecran cu informații mai detaliate despre modul în care acel pixel se suprapune marginile triunghiurilor. Drept urmare, noua metodă ne permite să obținem un mod anti-aliasing de 16x, care este vizibil de calitate mai mare decât MSAA 4x, cu costuri de calcul comparabile cu acesta. Și în rarele cazuri în care CSAA nu funcționează, rezultatul este un MSAA normal într-un grad mai mic, mai degrabă decât nici un anti-aliasing.

PureVideo HD

Să trecem la cele mai interesante schimbări. Se pare că G84 și G86 au inovații care le deosebesc chiar și de G80! Aceasta se referă la procesorul video încorporat, care în noile cipuri a extins suportul pentru PureVideo HD. Se afirmă că aceste cipuri ușurează complet procesorul central al sistemului atunci când decodează toate tipurile de date video comune, inclusiv cel mai „greu” format H.264.

G84 și G86 folosesc un nou model de procesor video programabil PureVideo HD, mai puternic decât cel folosit în G80 și care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps; face toată munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să jucați toate HD-DVD-urile și discurile Blu-ray existente chiar și pe computerele cu un singur nucleu de putere medie.

Procesorul video din G84/G86 este format din mai multe părți: a doua generație de procesor video (VP2), care îndeplinește sarcinile de IDCT, compensarea mișcării și eliminarea artefactelor de blocare pentru formatele MPEG2, VC-1 și H.264, care acceptă decodarea hardware. a celui de-al doilea flux; procesor de flux (BSP), care efectuează sarcini de decodare statistică CABAC și CAVLC pentru formatul H.264, iar acestea sunt unele dintre cele mai consumatoare de timp calcule; Motorul de decodare a datelor protejat AES128, al cărui scop este clar din numele său - decriptează datele video utilizate în protecția împotriva copierii pe discuri Blu-ray și HD-DVD. Iată cum arată diferențele în gradul de suport hardware pentru decodarea video pe diferite cipuri video:

Sarcinile efectuate de cipul video sunt evidențiate cu albastru, iar sarcinile efectuate de procesorul central cu verde. După cum puteți vedea, dacă generația anterioară a ajutat procesorul doar cu unele sarcini, atunci noul procesor video folosit în ultimele cipuri face toate sarcinile în sine. Vom verifica eficacitatea soluțiilor în materiale viitoare privind studiul eficienței decodării video hardware; NVIDIA oferă următoarele cifre în materiale: atunci când se utilizează un procesor modern dual-core și decodificarea datelor software, redarea Blu-ray și HD -Discurile DVD consumă până la 90-100% din timpul procesorului, cu decodarea hardware pe un cip video din generația anterioară pe același sistem până la 60-70%, iar cu noul motor pe care l-au dezvoltat pentru G84 și G86 doar 20% . Aceasta, desigur, nu arată ca decodarea hardware completă revendicată, dar este totuși foarte, foarte eficientă.

La momentul anunțului, noile caracteristici apărute în PureVideo HD funcționează doar în versiunea pe 32 de biți a Windows Vista, iar suportul pentru PureVideo HD în Windows XP va apărea abia în vară. În ceea ce privește calitatea redării video, post-procesare, deinterlacing etc., NVIDIA și-a îmbunătățit performanța chiar și în GeForce 8800, iar noile cipuri nu sunt diferite în acest sens.

CUDA, non-game and physics computing

Articolul despre GeForce 8800 a menționat că performanța de vârf crescută a aritmeticii flotante în noile acceleratoare și flexibilitatea arhitecturii unificate shader au devenit suficiente pentru calcularea fizicii în aplicațiile de jocuri și sarcini chiar mai serioase: modelare matematică și fizică, economice și statistice. modele și calcule, recunoaștere a imaginii, procesare a imaginilor, grafică științifică și multe altele. În acest scop, a fost lansat un API special orientat spre calcul, care este convenabil pentru adaptarea și dezvoltarea programelor care transferă calculele la GPU CUDA (Compute Unified Device Architecture).

Mai multe informații despre CUDA sunt scrise în articolul despre G80; ne vom concentra pe o altă tendință la modă recent - suportul pentru calcule fizice pe GPU. NVIDIA numește tehnologia sa similară Quantum Effects. Se declară că toate cipurile video de nouă generație, inclusiv G84 și G86 luate în considerare astăzi, sunt potrivite pentru calcule de acest fel, permițând transferarea unei părți din sarcină de la CPU la GPU. Exemplele specifice includ simulări de fum, foc, explozii, dinamica părului și îmbrăcămintei, blană și lichide și multe altele. Dar deocamdată vreau să scriu mai multe despre altceva. Faptul că până acum ni se arată doar poze din aplicații de testare cu un număr mare de obiecte fizice calculate prin cipuri video și nu există încă nici măcar un indiciu de jocuri cu astfel de suport.

Suport pentru interfețe externe

După cum ne amintim, GeForce 8800 a fost oarecum surprins de o altă inovație neașteptată - un cip suplimentar care acceptă interfețe externe în afara celei principale. În cazul plăcilor video de top, aceste sarcini sunt gestionate de un cip separat numit NVIO, care integrează: două RAMDAC-uri de 400 MHz, două Dual Link DVI (sau LVDS), HDTV-Out. Chiar și atunci am presupus că un cip extern separat era puțin probabil să supraviețuiască în segmentele mijlocii și inferioare și asta este de fapt ceea ce s-a întâmplat. În G84 și G86, suportul pentru toate aceste interfețe este încorporat în cipul însuși.

GeForce 8600 GTS are două ieșiri Dual Link DVI-I cu suport HDCP; aceasta este prima placă video de pe piață cu capabilități similare (HDCP și Dual Link împreună). În ceea ce privește HDMI, suportul pentru acest conector este implementat integral în hardware și poate fi implementat de producători pe carduri special concepute. Dar suportul GeForce 8600 GT și 8500 GT pentru HDCP și HDMI este opțional, dar ele pot fi implementate de producători individuali în produsele lor.

Detalii: G92, familia GeForce 8800

Specificații G92

  • Nume de cod al cipului G92
  • tehnologie 65 nm
  • 754 milioane de tranzistori (mai mult de G80)
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Frecvența de bază 600 MHz (GeForce 8800 GT)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,5 GHz pentru GeForce 8800 GT)
  • 112 (aceasta este pentru GeForce 8800 GT, dar probabil 128 în total) ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport pentru precizie FP pe 32 de biți în standardul IEEE 754, MAD+MUL fără pierderi de ceas)
  • 56 (64) unități de adresare a texturii cu suport pentru componente FP16 și FP32 în texturi (vezi explicația de mai jos)
  • 56 (64) unități de filtrare biliniare (cum ar fi G84 și G86, fără filtrare triliniară gratuită și filtrare anizotropă mai eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, HDTV) sunt integrate pe cip (spre deosebire de cele plasate pe un cip NVIO suplimentar extern în GeForce 8800)

Specificațiile plăcii de referință GeForce 8800 GT 512MB

  • Frecvența miezului 600 MHz
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 249 USD

Specificațiile cardului de referință GeForce 8800 GT 256MB

  • Frecvența miezului 600 MHz
  • Frecvența procesorului universal 1500 MHz
  • Număr de procesoare universale 112
  • Număr de blocuri de textură 56, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,4 GHz (2*700 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 256 megabytes
  • Lățimea de bandă a memoriei este de 44,8 gigaocteți pe secundă.
  • Rata de umplere maximă teoretică este de 9,6 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 33,6 gigatexeli pe secundă.
  • Consum de energie de până la 110 W
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • RRP 199 USD

Specificațiile cardului de referință GeForce 8800 GTS 512MB

  • Frecvența miezului 650 MHz
  • Număr de procesoare universale 128
  • Frecvența efectivă a memoriei 2,0 GHz (2*1000 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 64,0 gigaocteți pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 41,6 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP
  • Preț recomandat 349-399 USD

Arhitectura chip G92

Din punct de vedere arhitectural, G92 nu este foarte diferit de G80. Din câte știm, putem spune că G92 este flagship-ul liniei (G80), transferat la un nou proces tehnologic, cu mici modificări. NVIDIA indică în materialele sale că cipul are 7 unități de shader mari și, în consecință, 56 de unități de textură, precum și patru ROP-uri largi, numărul de tranzistori din cip ridică suspiciuni că nu spun ceva. Soluțiile anunțate inițial nu implică toate blocurile care există fizic în cip; numărul lor în G92 este mai mare decât cel activ în GeForce 8800 GT. Deși complexitatea crescută a cipului se explică prin includerea unui cip NVIO anterior separat, precum și a unui procesor video de nouă generație. În plus, numărul de tranzistori a fost influențat și de unitățile TMU mai complexe. De asemenea, este probabil ca cache-urile să fi fost mărite pentru a crește eficiența utilizării magistralei de memorie pe 256 de biți.

De data aceasta, pentru a concura cu cipurile AMD corespunzătoare, NVIDIA a decis să lase un număr destul de mare de blocuri în cipul mid-end. Presupunerea noastră din revizuirea G84 și G86 a fost confirmată că cipuri mult mai puternice pentru gama de prețuri medii vor fi lansate pe baza tehnologiei de 65 nm. Există puține modificări arhitecturale în cipul G92 și nu ne vom opri asupra acestui lucru în detaliu. Tot ce s-a spus mai sus despre soluțiile din seria GeForce 8 rămâne în vigoare; vom repeta doar câteva dintre principalele puncte dedicate specificațiilor arhitecturale ale noului cip.

Pentru noua soluție, NVIDIA oferă următoarea diagramă în documentele sale:

Adică, dintre toate modificările, doar un număr redus de blocuri și unele modificări în TMU, care sunt descrise mai jos. După cum sa indicat mai sus, există îndoieli că acesta este cazul fizic, dar oferim o descriere bazată pe ceea ce scrie NVIDIA. G92 este format din șapte unități de calcul universale (procesoare shader), NVIDIA vorbește în mod tradițional despre 112 procesoare (cel puțin în primele soluții GeForce 8800 GT). Fiecare dintre blocuri, în care sunt grupate 8 TMU-uri și 16 ALU-uri, poate executa o parte dintr-un vertex, pixel sau geometry shader peste un bloc de 32 de pixeli, vârfuri sau alte primitive și poate efectua și alte calcule (negrafice). Fiecare procesor are propriul cache de nivel 1, care stochează texturi și alte date. Pe lângă unitatea de control și procesoarele compute shader, există patru unități ROP care efectuează detectarea vizibilității, scrierea în frame-buffer și MSAA, grupate cu controlere de memorie, cozi de scriere și un cache de nivel al doilea.

Procesoare de uz general și TMU-uri

Diagrama unităților shader și o evaluare a performanței lor de calcul de vârf a G80 a fost prezentată în articolul corespunzător; pentru G92 nu s-a schimbat; performanța lor este ușor de recalculat pe baza modificărilor frecvenței de ceas. ALU-urile din cipuri funcționează la o frecvență mai mare decât dublă, sunt scalare, ceea ce permite o eficiență ridicată. Încă nu se știe despre diferențele funcționale, dacă acuratețea calculelor FP64 este disponibilă în acest cip sau nu. Cu siguranță există suport pentru calcule în format întreg, iar implementarea tuturor calculelor respectă standardul IEEE 754, care este important pentru calcule științifice, statistice, economice și de altă natură.

Unitățile de textura din G92 nu sunt aceleași cu cele din G80, ele urmează soluția TMU din G84 și G86, cărora li s-au făcut modificări arhitecturale pentru a crește performanța. Să ne reamintim că în G80 fiecare unitate de textură ar putea calcula patru adrese de textură și poate efectua opt operații de filtrare a texturii pe ceas, iar în G84/G86 TMU-urile sunt capabile de două ori mai multe mostre de textură. Adică, fiecare dintre blocuri are opt module de adresare a texturii (determinând adresa exactă pentru eșantionare prin coordonate) TA și exact același număr de module de filtrare biliniară (TF):

Să nu credeți că cele 56 de blocuri ale GeForce 8800 GT în aplicații reale vor fi mai puternice decât cele 32 de blocuri ale GeForce 8800 GTX. Cu filtrarea triliniară și/sau anizotropă activată, aceasta din urmă va fi mai rapidă, deoarece pot lucra mai mult la filtrarea probelor de textură. Vom verifica aceste informații în partea practică analizând rezultatele testelor sintetice corespunzătoare. Toate celelalte funcționalități ale blocurilor de textură nu s-au schimbat; sunt acceptate formatele de textură FP16, FP32 și altele.

Blocuri ROP, scrieri framebuffer, anti-aliasing

Nici blocurile POR în sine nu s-au schimbat, dar numărul lor s-a schimbat. G80 a avut șase ROP-uri, iar în noua soluție există patru dintre ele, pentru a reduce costul producției de cipuri și PCB-uri pentru plăcile video. Această reducere poate fi, de asemenea, pentru a evita crearea unei concurențe prea mari cu soluțiile existente de top.

Fiecare bloc procesează patru pixeli sau 16 sub-pixeli, pentru un total de 16 pixeli pe ceas pentru culoare și Z. Modul numai Z procesează de două ori mai multe mostre pe ceas. La MSAA 16x, cipul poate produce doi pixeli pe ciclu de ceas, la 4x × 8 etc. Ca și în cazul G80, formatele cadru tampon FP32 și FP16 sunt pe deplin acceptate împreună cu antialiasing.

Noua metodă de antialiasing, Coverage Sampled Antialiasing (CSAA), cunoscută din cipurile anterioare din serie, este acceptată. O altă inovație este că GeForce 8800 GT a actualizat algoritmul de antialiasing al transparenței. Utilizatorului i s-au oferit două opțiuni: multisampling (TRMS) și supersampling (TRSS), prima a avut performanțe foarte bune, dar nu a funcționat eficient în toate jocurile, iar a doua a fost de înaltă calitate, dar lentă. GeForce 8800 GT introduce o nouă metodă de eșantionare multiplă a suprafețelor translucide, care îi îmbunătățește calitatea și performanța. Acest algoritm oferă aproape aceeași îmbunătățire a calității ca și supraeșantionarea, dar are performanțe ridicate - doar cu câteva procente mai proaste pentru modul fără anti-aliasing al suprafețelor translucide activat.

PureVideo HD

Una dintre schimbările așteptate la G92 a fost procesorul video încorporat de a doua generație, cunoscut de la G84 și G86, care a primit suport extins pentru PureVideo HD. Se știe deja că această versiune a procesorului video ușurează aproape complet CPU atunci când decodifică toate tipurile de date video, inclusiv formatele „grele” H.264 și VC-1.

La fel ca G84/G86, G92 folosește un nou model de procesor video programabil PureVideo HD, care include așa-numitul motor BSP. Noul procesor acceptă decodarea formatelor H.264, VC-1 și MPEG-2 cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, realizând munca de decodare a datelor CABAC și CAVLC în hardware, ceea ce vă permite să redați toate cele existente. Discuri HD-DVD și Blu-ray chiar și pe computere cu un singur nucleu de putere medie. Decodarea VC-1 nu este la fel de eficientă ca H.264, dar este suportată în continuare de noul procesor.

Puteți citi mai multe despre procesorul video de a doua generație în partea dedicată cipurilor G84 și G86. Performanța soluțiilor video moderne a fost parțial testată în cel mai recent material privind studiul eficienței decodării video hardware.

PCI Express 2.0

Printre inovațiile reale ale modelului G92 se numără suportul pentru magistrala PCI Express 2.0. A doua versiune de PCI Express dublează lățimea de bandă standard, de la 2,5 Gb/s la 5 Gb/s, rezultând că conectorul x16 poate transfera date la viteze de până la 8 GB/s în fiecare direcție, spre deosebire de 4 GB/s pentru versiunea 1.x. Este foarte important ca PCI Express 2.0 să fie compatibil cu PCI Express 1.1, iar plăcile video vechi vor funcționa pe plăcile de bază noi, iar plăcile video noi cu suport pentru a doua versiune vor rămâne funcționale în plăcile fără suportul acesteia. Cu condiția să existe suficientă putere externă și fără creșterea lățimii de bandă a interfeței, desigur.

Pentru a asigura compatibilitatea cu soluțiile existente PCI Express 1.0 și 1.1, specificația 2.0 acceptă rate de transfer de 2,5 Gbps și 5 Gbps. Compatibilitatea cu versiunea inversă PCI Express 2.0 permite ca soluțiile vechi de 2,5 Gb/s să fie utilizate în sloturi de 5,0 Gb/s care vor funcționa la viteze mai mici, iar un dispozitiv proiectat conform specificațiilor versiunii 2.0 poate suporta atât viteze de 2,5 Gb/s, cât și 5 Gb/s. În teorie, compatibilitatea este bună, dar în practică pot apărea probleme cu unele combinații de plăci de bază și plăci de expansiune.

Suport pentru interfețe externe

După cum era de așteptat, cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe situate în afara celei principale (două RAMDAC de 400 MHz, două DVI Dual Link (sau LVDS), HDTV-Out), în acest caz a fost inclus în cipul în sine, suportul pentru toate aceste interfețe este încorporat în G92 însuși.

Plăcile video GeForce 8800 GT au de obicei două ieșiri Dual Link DVI-I cu suport HDCP. În ceea ce privește HDMI, suportul pentru acest conector este implementat pe deplin; acesta poate fi implementat de producători pe carduri special concepute, care pot fi lansate puțin mai târziu. Deși prezența unui conector HDMI pe o placă video este complet opțională, acesta poate fi înlocuit cu succes de un adaptor de la DVI la HDMI, care este inclus cu majoritatea plăcilor video moderne.

Spre deosebire de plăcile video din seria RADEON HD 2000 de la AMD, GeForce 8800 GT nu conține un cip audio încorporat necesar pentru a suporta transmisia audio DVI folosind un adaptor HDMI. Această capacitate de a transmite semnale video și audio printr-un singur conector este solicitată în primul rând pe cardurile de gamă medie și inferioară care sunt instalate în carcase medii mici, iar GeForce 8800 GT este cu greu potrivită pentru acest rol.

Detalii: G94, familia GeForce 9600

Specificații G94

  • Nume de cod al cipului G94
  • tehnologie 65 nm
  • 505 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 256 de biți, patru controlere independente de 64 de biți
  • Frecvența de bază 650 MHz (GeForce 9600 GT)
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,625 GHz pentru GeForce 9600 GT)
  • 64 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 32 de unități de adresare a texturii cu suport pentru componentele FP16 și FP32 în texturi
  • 32 de unități de filtrare biliniare (ca și în G84 și G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrare triliniară gratuită și filtrare anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 4 blocuri ROP largi (16 pixeli) cu suport pentru moduri de antialiasing de până la 16 mostre per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 64 de mostre MSAA (+ 64 Z) per ceas, în modul numai Z 128 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)

Specificațiile cardului de referință GeForce 9600 GT

  • Frecvența miezului 650 MHz
  • Frecvența procesorului universal 1625 MHz
  • Număr de procesoare universale 64
  • Număr de blocuri de textură 32, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 1,8 GHz (2*900 MHz)
  • Tip de memorie GDDR3
  • Capacitate de memorie 512 megabytes
  • Lățimea de bandă a memoriei 57,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 10,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 20,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Consum de energie de până la 95 W
  • Preț recomandat 169-189 USD

Arhitectura G94

Din punct de vedere arhitectural, G94 se deosebește de G92 doar prin caracteristicile cantitative; are un număr mai mic de unități de execuție: ALU și TMU. Și nu există multe diferențe față de G8x. După cum a fost scris în materialele anterioare, linia de cipuri G9x este o linie G8x ușor modificată, transferată la o nouă tehnologie de proces cu modificări arhitecturale minore. Noul cip mid-end are 4 unități mari de shader (64 ALU-uri în total) și 32 de unități de textură, precum și patru ROP-uri largi.

Deci, există puține modificări arhitecturale în cip, aproape toate sunt descrise mai sus și tot ceea ce a spus anterior pentru soluțiile anterioare rămâne valabil. Și aici vă prezentăm doar diagrama principală a cipului G94:

Unitățile de textură din G94 sunt exact aceleași ca în G84/G86 și G92, ele pot selecta de două ori mai multe eșantioane filtrate biliniar din texturi comparativ cu G80. Dar 32 de unități de textură ale GeForce 9600 GT în aplicațiile reale nu vor funcționa mai repede decât 32 de unități ale GeForce 8800 GTX doar din cauza frecvenței de operare mai mari a GPU-ului. Acest lucru poate fi observat numai atunci când filtrarea triliniară și anizotropă sunt dezactivate, ceea ce este extrem de rar, doar în acei algoritmi care folosesc eșantioane nefiltrate, de exemplu, în maparea paralaxă.

Un alt avantaj al lui G9x și GeForce 9600 GT în special, NVIDIA ia în considerare o anumită tehnologie nouă de compresie implementată în unitățile ROP, care, conform estimărilor acestora, funcționează cu 15% mai eficient decât cea folosită în cipurile anterioare. Aparent, acestea sunt exact aceleași modificări arhitecturale la G9x, concepute pentru a asigura o eficiență mai mare a magistralei de memorie pe 256 de biți în comparație cu cea pe 320/384 de biți despre care am scris mai devreme. Desigur, în aplicațiile reale nu va exista o diferență atât de mare; chiar și conform NVIDIA în sine, creșterea de la inovații în ROP este cel mai adesea de doar aproximativ 5%.

În ciuda tuturor modificărilor din arhitectura G9x care adaugă complexitate cipului, despre care vom vorbi mai jos, numărul de tranzistori din cip este destul de mare. Probabil, această complexitate a GPU-ului se explică prin includerea unui cip NVIO anterior separat, a unui procesor video de nouă generație, a complicațiilor blocurilor TMU și ROP, precum și a altor modificări ascunse: modificări ale dimensiunilor cache-ului etc.

PureVideo HD

G94 are același procesor video de a doua generație cunoscut de la G84/G86 și G92, care oferă suport îmbunătățit pentru PureVideo HD. Descarcă aproape complet CPU atunci când decodifică cele mai comune tipuri de date video, inclusiv H.264, VC-1 și MPEG-2, cu rezoluții de până la 1920x1080 și rate de biți de până la 30-40 Mbps, făcând munca de decodare în întregime în hardware. Și deși decodarea VC-1 de la NVIDIA nu este la fel de eficientă ca H.264, o mică parte a procesului utilizează puterea procesorului central, dar vă permite totuși să redați toate HD DVD-urile și discurile Blu-Ray existente chiar și pe computerele medii. . Puteți citi mai multe despre procesorul video de a doua generație în recenziile noastre despre G84/G86 și G92, link-uri către care sunt oferite la începutul articolului.

Ei bine, vom observa îmbunătățirile software aduse PureVideo HD, care au fost programate să coincidă cu lansarea GeForce 9600 GT. Cele mai recente inovații în PureVideo HD includ decodarea dual-stream, modificări dinamice ale contrastului și saturația culorilor. Aceste modificări nu sunt exclusive pentru GeForce 9600 GT, iar în noile versiuni de drivere, începând cu ForceWare 174, sunt introduse pentru toate cipurile care acceptă accelerarea hardware completă folosind PureVideo HD. Pe lângă placa video pe care o luăm în considerare astăzi, această listă include: GeForce 8600 GT/GTS, GeForce 8800 GT și GeForce 8800 GTS 512.

Îmbunătățirea dinamică a contrastului este destul de comună în electronicele de larg consum, televizoarele și playerele video și poate îmbunătăți imaginile cu o expunere sub-optimă (combinație de viteză a obturatorului și diafragmă). Pentru a face acest lucru, după decodificarea fiecărui cadru, histograma acestuia este analizată, iar dacă cadrul are un contrast slab, histograma este recalculată și aplicată imaginii. Iată un exemplu (în stânga este imaginea inițială, în dreapta este cea procesată):

Același lucru este valabil și pentru îmbunătățirea dinamică a saturației culorilor introdusă în PureVideo HD. Electrocasnicele folosesc, de asemenea, niște algoritmi de îmbunătățire a imaginii de foarte mult timp, spre deosebire de monitoarele de computer, care reproduc totul așa cum este, ceea ce în multe cazuri poate face ca imaginea să fie prea plictisitoare și lipsită de viață. Echilibrul automat al componentelor de culoare din datele video, calculat și pentru fiecare cadru nou, îmbunătățește percepția umană asupra imaginii prin ajustarea ușoară a saturației culorilor acesteia:

Decodificarea dual-stream vă permite să accelerați decodarea și post-procesarea a două fluxuri video diferite simultan. Acest lucru poate fi util în moduri de ieșire, cum ar fi imagine în imagine, care sunt utilizate în unele discuri Blu-Ray și HD DVD (de exemplu, a doua imagine poate arăta regizorul filmului comentându-și scenele prezentate în fereastra principală ), edițiile filmelor RĂZBOI și Resident Evil: Extinction sunt echipate cu astfel de capabilități.

O altă inovație utilă în cea mai recentă versiune de PureVideo HD este capacitatea de a rula simultan shell-ul Aero în sistemul de operare Windows Vista în timp ce redați videoclipuri accelerate de hardware în modul ferestre, ceea ce nu era posibil anterior. Nu pot spune că acest lucru îi îngrijorează foarte mult pe utilizatori, dar este o oportunitate bună.

Suport pentru interfețe externe

Suportul pentru interfețele externe pe GeForce 9600 GT este similar cu GeForce 8800 GT, cu excepția, probabil, a suportului DisplayPort integrat. Cipul NVIO suplimentar disponibil pe plăcile GeForce 8800, care acceptă interfețe externe în afara celei principale din G94, a fost inclus și în cip în sine.

Placile video GeForce 9600 GT de referinta au doua iesiri DVI Dual Link cu suport HDCP. Suportul HDMI și DisplayPort este implementat în hardware pe cip, iar aceste porturi pot fi implementate de partenerii NVIDIA pe carduri special concepute. Mai mult, așa cum asigură NVIDIA, spre deosebire de G92, suportul DisplayPort este acum încorporat în cip și nu sunt necesare transmițătoare externe. În general, conectorii HDMI și DisplayPort de pe o placă video sunt opționali; aceștia pot fi înlocuiți cu adaptoare simple de la DVI la HDMI sau DisplayPort, care sunt uneori incluse cu plăcile video moderne.

Detalii: familiile G96, GeForce 9400 și 9500

Specificații G96

  • Nume de cod al cipului G96
  • tehnologie 65 nm
  • 314 milioane de tranzistori
  • Arhitectură unificată cu o serie de procesoare partajate pentru procesarea în flux a nodurilor și pixelilor, precum și a altor tipuri de date
  • Suport hardware pentru DirectX 10, inclusiv modelul shader Shader Model 4.0, generarea geometriei și înregistrarea datelor intermediare din shader (ieșire flux)
  • Bus de memorie pe 128 de biți, două controlere independente de 64 de biți
  • Frecvența miezului 550 MHz
  • ALU-urile funcționează la o frecvență mai mult decât dublă (1,4 GHz)
  • 32 ALU-uri scalare în virgulă mobilă (formate întregi și flotante, suport IEEE 754 FP de precizie pe 32 de biți, MAD+MUL fără pierderi de ceas)
  • 16 unități de adresare a texturii cu suport pentru componentele FP16 și FP32 în texturi
  • 16 unități de filtrare biliniare (ca și în cazul G92, aceasta oferă un număr crescut de probe biliniare, dar fără filtrarea triliniară gratuită și filtrarea anizotropă eficientă)
  • Posibilitatea de ramuri dinamice în pixeli și vertex shaders
  • 2 blocuri ROP largi (8 pixeli) cu suport pentru moduri de antialiasing de până la 16 eșantioane per pixel, inclusiv cu formatul cadru tampon FP16 sau FP32. Fiecare bloc constă dintr-o serie de ALU configurabile în mod flexibil și este responsabil pentru generarea și compararea Z, MSAA și blending. Performanță maximă a întregului subsistem până la 32 de mostre MSAA (+ 32 Z) per ceas, în modul numai Z 64 de mostre pe ceas
  • Înregistrați rezultatele de la până la 8 cadre tampon simultan (MRT)
  • Toate interfețele (două RAMDAC, două Dual DVI, HDMI, DisplayPort) sunt integrate pe cip

Specificațiile cardului de referință GeForce 9500 GT

  • Frecvența miezului 550 MHz
  • Număr de procesoare universale 32
  • Număr de blocuri de textură 16, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2/GDDR3
  • Capacitate memorie 256/512/1024 megabytes
  • Viteza teoretică de eșantionare a texturii de până la 8,8 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Specificațiile cardului de referință GeForce 9400 GT

  • Frecvența miezului 550 MHz
  • Frecvența procesorului universal 1400 MHz
  • Numărul de procesoare universale 16
  • Număr de blocuri de textură 8, blocuri de amestecare 8
  • Frecvența efectivă a memoriei 1,6 GHz (2*800 MHz)
  • Tip de memorie GDDR2
  • Capacitate memorie 256/512 megabytes
  • Lățimea de bandă a memoriei 25,6 gigaocteți pe secundă.
  • Rata maximă de umplere teoretică este de 4,4 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 4,4 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • conector SLI
  • Bus PCI Express 2.0
  • Suport TV-Out, HDTV-Out, HDMI și DisplayPort cu HDCP

Arhitectura G96

Din punct de vedere arhitectural, G96 este exact jumătate din cipul G94, care, la rândul său, diferă de G92 doar prin caracteristicile cantitative. G96 are jumătate din numărul tuturor unităților de execuție: ALU, TMU și ROP. Noul cip video este conceput pentru soluții din cel mai mic interval de preț și are două unități mari de shader (32 ALU în total) și 16 unități de textură, precum și opt ROP-uri. De asemenea, are o magistrală de memorie redusă, de la 256 de biți la 128 de biți, în comparație cu G94 și G92. Toate capabilitățile hardware rămân neschimbate, singurele diferențe sunt în performanță.

Detalii: G92b, familia GeForce GTS 200

Specificațiile plăcii video de referință GeForce GTS 250

  • Frecvența de bază 738 MHz
  • Frecvența procesorului universal 1836 MHz
  • Număr de procesoare universale 128
  • Număr de blocuri de textură 64, blocuri de amestecare 16
  • Frecvența efectivă a memoriei 2200 (2*1100) MHz
  • Tip de memorie GDDR3
  • Capacitate memorie 512/1024/2048 megabytes
  • Lățimea de bandă a memoriei 70,4 GB/s
  • Rata maximă de umplere teoretică este de 11,8 gigapixeli pe secundă.
  • Viteza teoretică de eșantionare a texturii de până la 47,2 gigatexeli pe secundă.
  • Doi conectori DVI-I Dual Link, acceptă rezoluții de ieșire de până la 2560x1600
  • Conector SLI dual
  • Bus PCI Express 2.0
  • Suport TV-out, HDTV-Out, HDCP, HDMI, DisplayPort
  • Consum de energie de până la 150 W (un conector cu 6 pini)
  • Versiune cu două sloturi
  • RRP 129 USD/149 USD/169 USD

În general, această „nouă” placă video bazată pe cipul G92 de 55 nm nu este diferită de GeForce 9800 GTX+. Lansarea noului model poate fi parțial justificată prin instalarea nu a 512 megaocteți de memorie video, cum ar fi 9800 GTX+, ci a unui gigabyte, care afectează foarte mult performanța în moduri grele cu setări de calitate maximă, rezoluții înalte cu anti- full-screen. aliasing activat. Există și opțiuni de doi gigabyte, dar acesta este mai mult un avantaj de marketing decât unul real.

În astfel de condiții, versiunile mai vechi ale GeForce GTS 250 ar trebui să fie într-adevăr vizibil mai rapide decât GeForce 9800 GTX+ datorită capacității crescute de memorie. Iar unele dintre cele mai moderne jocuri nu vor beneficia nici măcar de cele mai mari rezoluții. Totul ar fi bine, dar unii producători de carduri au lansat GeForce 9800 GTX+ cu un gigaoctet de memorie chiar mai devreme...

Producția de cipuri video G92b folosind standarde tehnologice de 55 nm și o simplificare vizibilă a designului PCB a permis NVIDIA să creeze o soluție similară GeForce 9800 GTX din punct de vedere al caracteristicilor, dar cu un preț mai mic și un consum redus de energie și disipare a căldurii. Și acum, pentru a furniza energie GeForce GTS 250, pe placă este instalat un singur conector de alimentare PCI-E cu 6 pini. Acestea sunt toate diferențele principale față de 9800 GTX+.

NVIDIA GeForce 9800 GT

4 (80%) 2 voturi

Placa video NVIDIA GeForce 9800 GT se bazează pe o tehnologie de proces de 65 nm și se bazează pe procesorul grafic G92-270 (G92). Cardul acceptă Directx 10. NVIDIA a plasat 512 megaocteți de memorie GDDR3, care este conectată folosind o interfață de memorie de 256 de biți.
GPU-ul funcționează la 600 MHz. Numărul de nuclee CUDA este de 112, cu o viteză de 1800 Mbps și un throughput de 57,6 Gbps.

Consumul de energie al plăcii video este de 105 W, iar sursa de alimentare recomandată este de 400 W.

NVIDIA GeForce 9800 GT acceptă Microsoft DirectX 10 și OpenGL 3.3.

Caracteristicile plăcii video NVIDIA GeForce 9800 GT

Tehnologii si capacitati:
CUDA:da
SLI:da
PhysX:da
Viziune 3D:da
jocuri 3D:da
DirectX:10
OpenGL:3.3
Obosi:PCI-Express 2.0 x16
Suport OS:Microsoft Windows 7-10, Linux, FreeBSDx86

Notă:: Tabelul prezintă caracteristicile de referință ale plăcii video; acestea pot diferi de la un producător la altul.

Descărcați drivere pentru placa video NVIDIA GeForce 9800 GT:

Selectați sistemul de operare:

Pentru Windows 10: Descărcați 32 de biți 342.01 WHQL Descărcați 342.01 pe 64 de biți WHQL
Pentru Windows 7/8/8.1: Descărcați 32 de biți 342.01 WHQL Descărcați 342.01 pe 64 de biți WHQL

Informații despre șofer:

Versiunea driverului:340.52 WHQL
Publicat:29 iulie 2014
Limba driverului:Rusă
Mărimea:220 MB
Setul de instrumente CUDA:6.5
Informații despre șofer:Note de lansare (v340.52) (PDF)

Experiență GeForce

Descărcați driverul pentru placa video NVIDIA GeForce 9800 GT de pe site-ul oficial!

Sau utilizați programul GeForce Experience - acesta va selecta automat driverul necesar pentru placa dvs. video.

Se descarcă driverul pentru placa video NVIDIA GeForce 9800 GT. Realizat de pe site-ul oficial!

Recenzii video ale plăcii video NVIDIA GeForce 9800 GT:

Este posibil ca administrația site-ului să nu împărtășească opiniile autorilor recenziilor video!

Întrebări și răspunsuri frecvente referitoare la placa video NVIDIA GeForce 9800 GT: Întrebare: Ce serie este aceasta placa video?Răspuns: Desktop Întrebare: Ce DirectX acceptă?Răspuns: Placa video acceptă DirectX 10 Întrebare: Care este consumul de energie al plăcii video?Răspuns: Consumul maxim de energie este de 105 W Întrebare: Ce sursă de alimentare este necesară pentru o placă video?Răspuns: Alimentare recomandată de 400 W Întrebare: Există conectori de alimentare suplimentari?Răspuns: Două cu 6 pini Întrebare: Care este temperatura maxima admisa?Răspuns: Nu mai mult de 105℃ Întrebare: De unde pot descărca driverul?Răspuns:

În cele mai multe cazuri, atunci când utilizați o placă video, nu există probleme în găsirea și instalarea software-ului necesar. Este fie furnizat împreună cu dispozitivul, fie instalat automat folosind "Manager de dispozitiv".

Dificultățile încep atunci când suntem forțați să căutăm singuri șoferi. Nu toți producătorii înțeleg aspirațiile utilizatorilor și adesea ne confundă cu termeni și nume de parametri de neînțeles. Acest articol vă va ajuta să aflați cum să aflați seria de produse a unei plăci video Nvidia.

Pe site-ul oficial Nvidia, în secțiunea de căutare manuală a driverelor, vedem o listă derulantă în care trebuie să selectați o serie (generație) de produse.

În această etapă apar dificultăți pentru începători, deoarece această informație nu este clar prezentă nicăieri. Să ne uităm în detaliu la modul de a determina cărei generații îi aparține placa video instalată pe computer.

Definiția modelului

Mai întâi trebuie să aflați modelul adaptorului video, pentru care puteți utiliza atât instrumentele de sistem Windows, cât și programele terțe, de exemplu.

Odată ce am stabilit ce fel de placă video este în computerul nostru, nu va fi dificil să aflăm generația acesteia. Să trecem prin numerele de serie, începând cu cele mai moderne.

Episodul 20

A douăzecea serie de plăci video este construită pe cipuri cu arhitectura Turing. La momentul actualizării acestui material (vezi data), linia este formată din trei adaptoare. Acest RTX 2080Ti, RTX 2080Și RTX 2070.

Episodul 10

A zecea serie de produse include adaptoare grafice bazate pe arhitectură Pascal. Aceasta include GT 1030, GTX 1050 - 1080Ti. Inclus și aici Nvidia Titan X (Pascal) și Nvidia Titan Xp.

Episodul 900

Seria 900 include o linie de dispozitive din generația anterioară Maxwell. Acest GTX 950 – 980Ti, și GTX Titan X.

Episodul 700

Aceasta include adaptoare pe cipuri Kepler. Din aceasta generatie (daca te uiti de sus in jos) incepe varietatea modelelor. Acestea sunt birouri GT 705 – 740(5 modele), gaming GTX 745 – 780Ti(8 modele) și trei GTX Titan, Titan Z, Titan Black.

Episodul 600

De asemenea, o „familie” destul de prolifică cu numele Kepler. Acest GeForce 605, GT 610 – 645, GTX 645 – 690.

Episodul 500

Acestea sunt plăci video de arhitectură Fermi. Gama de modele este formată din GeForce 510, GT 520 – 545 și GTX 550Ti – 590.

Episodul 400

GPU-urile din linia 400 sunt, de asemenea, bazate pe cipuri Fermiși sunt reprezentate de astfel de plăci video ca GeForce 405, GT 420 – 440, GTS 450Și GTX 460 – 480.

Episodul 300

Arhitectura acestei serii se numește Tesla, modelele sale: GeForce 310 și 315, GT 320 – 340.

Episodul 200

Aceste GPU-uri au și un nume Tesla. Cardurile incluse în linie sunt: GeForce 205 și 210, G210, GT 220 – 240, GTS 240 și 250, GTX 260 – 295.

Episodul 100

Seria a 100-a de plăci video Nvidia este încă construită pe microarhitectură Tesla si include adaptoare G100, GT 120 – 140, GTS 150.

Episodul 9

A noua generație de GPU GeForce se bazează pe cipuri G80Și G92. Gama de modele este împărțită în cinci grupe: 9300, 9400, 9500, 9600, 9800 . Diferențele dintre nume constau doar în adăugarea de litere care caracterizează scopul și umplerea internă a dispozitivului. De exemplu, GeForce 9800 GTX+.

Episodul 8

Această linie folosește aceleași jetoane G80, și sortimentul corespunzător de carduri: 8100, 8200, 8300, 8400, 8500, 8600, 8800 . După numere există denumiri de litere: GeForce 8800 GTX.

Episodul 7

Seria a șaptea construită pe procesoare G70Și G72, include plăci video GeForce 7200, 7300, 7600, 7800, 7900Și 7950 cu litere diferite.

Episodul 6

Generația 6 de carduri verzi funcționează pe arhitectură NV40 si include adaptoare GeForce 6200, 6500, 6600, 6800și modificările acestora.

5 FX

Rigla 5 FX pe baza de microcipuri NV30Și NV35. Compoziția modelelor este următoarea: FX 5200, 5500, PCX 5300, GeForce FX 5600, 5700, 5800, 5900, 5950, realizat în diferite opțiuni de configurare.

Modele de plăci video cu litera M

Toate plăcile video cu o literă la sfârșitul numelui "M", sunt modificări ale GPU-ului pentru dispozitive mobile (laptop-uri). Aceasta include: 900M, 800M, 700M, 600M, 500M, 400M, 300M, 200M, 100M, 9M, 8M. De exemplu, o hartă GeForce 780M aparține seriei a șaptea.

Aceasta se încheie scurtul nostru tur al generațiilor și modelelor de adaptoare grafice Nvidia.

Placa video 9800 GT de la NVIDIA este o continuare logică a plăcii 8800GT. Cele două produse tehnologice au parametri aproape identici. Principala diferență între 9800GT și modelul anterior a fost suportul pentru tehnologia HybridPower. Nu există alte îmbunătățiri. GPU-ul cardului este etichetat G92-270. Modelul 8800 a avut unul asemanator.Microcipul are revizia A2, ca si pana acum. Caracteristicile frecvenței de ceas ale plăcii video 9800 GT au rămas la același nivel: 601/1512 MHz.

Specificații 9800 GT

Din punct de vedere tehnic, placa 9800 GT nu a suferit modificări majore de la modelul 8800.

Parametrii plăcii video:

  • GPU: G92.
  • Memorie video: 512 MB.
  • Bus de memorie: 256 biți.
  • Frecvența GPU: 601/1512 MHz.
  • Blocuri de textura: 56.
  • Blocuri POR: 16.
  • Frecvența efectivă la care funcționează memoria plăcii video: 1800 MHz.
  • Procesoare universale (nuclee): 112.
  • Tehnologii unice acceptate: Hybrid Power.
  • Bus de sistem și alte interfețe de comunicare: PCI-E 2.0x16/2xDVI/S-Video. HDMI este acceptat cu un adaptor.

Ce sarcini poate rezolva placa video 9800 GT?

Placa video prezentată se descurcă bine cu jocurile din generația anterioară. Dacă utilizatorul nu urmărește produse noi, atunci 9800 GT i se va potrivi fără îndoială. Caracteristicile cardului vă permit să rulați cu ușurință jocuri precum The Witcher 2, S.T.A.L.K.E.R, Crysis 2, Dead Space 3 și altele. Fallout New Vegas, apropo, rulează și el fără probleme cu această placă. Dar nu va mai fi posibilă lansarea celei de-a patra versiuni a proiectului legendar.

De asemenea, placa video nu va suporta împușcători și simulatoare de mașini moderne lansate după 2013. Există excepții, dar foarte rar. Utilizatorul se simte destul de confortabil atunci când lucrează cu informații grafice și video, vizionează filme la înaltă definiție. Dacă o persoană nu este un fotograf profesionist sau un designer 3D care are nevoie de viteză maximă, atunci placa video 9800 GT este destul de potrivită pentru el.

Avantajele și dezavantajele unei plăci video

Placa în cauză are o serie de avantaje care fac ca utilizarea sa să fie încă relevantă. Deși această soluție are și dezavantaje.

Ce avantaje are 9800 GT? Caracteristicile modelului indică faptul că există multe dintre ele.

  • Placa video acceptă modul SLI. Puteți cumpăra 4 plăci deodată și le puteți combina într-un grup, obținând astfel o creștere semnificativă a performanței.
  • Placa oferă suport pentru tehnologia PhysX. Servește pentru a reproduce efecte speciale suplimentare în jocuri. Este de remarcat faptul că acest lucru reduce semnificativ performanța generală a plăcii video. Pentru a echilibra acest efect, producătorul recomandă utilizarea unui accelerator PhysX suplimentar dedicat, care va completa placa principală.
  • Folosind utilități speciale, puteți îmbunătăți performanța standard a Nvidia 9800 GT, crescând-o cu 5-15%. Indicatorul specific depinde de dorințele utilizatorului și de capacitățile sistemului de răcire al cardului. Când faceți overclock, trebuie să monitorizați cu atenție temperatura de funcționare a dispozitivului pentru a preveni supraîncălzirea excesivă și, ca urmare, defecțiunea.

Defecte:

  • este o soluție depășită;
  • are eficiență limitată în calculul de uz general;
  • redarea lină a discurilor Blu-Ray și a videoclipurilor de calitate HD postate pe Internet va fi influențată semnificativ de puterea procesorului central (pe lângă procesorul plăcii video);
  • performanta scazuta 9800 GT, specificațiile plăcii nu permit rularea jocuri publicate după 2013;
  • consum relativ mare de energie;
  • Performanță insuficientă a plăcii video atunci când lucrați cu efecte PhysX suplimentare.

Înainte de lansarea plăcii video 9800 GT, mulți analiști și jurnaliști credeau că știrile despre apariția acestui adaptor grafic sunt fictive. După lansarea oficială, informațiile au devenit mai clare. Mulți au dat în avans laurii primatului acestei plăci video ca navă de vârf, dar inginerii NVIDIA au atribuit din nou un nou număr vechilor soluții arhitecturale.

GeForce 9800 GT. Caracteristicile plăcii video

Acceleratorul grafic este o copie aproape completă a predecesorului său - iar unele teste arată că generația anterioară rămâne mai productivă. Noul produs este echipat cu același procesor - G92, chiar și procesul tehnic nu s-a schimbat. A rămas 65 nm, deși mulți credeau că 9800 GT va folosi 55 nm. Frecvențele GPU nu s-au schimbat.

Pe pagina oficială a site-ului web care prezintă GeForce 9800 GT, caracteristicile sunt următoarele:

  • GPU: G92. 112 procesoare universale, 64 de unități de textură.
  • Memorie video: GDDR3, volumul său este de 512 MB.
  • Lățimea magistralei de memorie: 256 biți.
  • Frecvența GPU: 600 MHz.
  • Frecvența unității shader: 1500 MHz.
  • Frecvența memoriei: 1800 (900) MHz.
  • Porturi: 2xDVI-I, ieșire TV.

Singurul lucru care distinge placa video în cauză de 8800 GT este suportul pentru tehnologia HybridPower. Vă permite să comutați între grafica integrată și o placă discretă în modul automat, ceea ce face posibilă reducerea consumului de energie și

Această actualizare nu poate fi considerată importantă pentru GeForce 9800 GT; nu modifică caracteristicile și, în plus, HybridPower nu poate funcționa decât dacă este îndeplinită o condiție. Placa de baza trebuie sa suporte si aceasta tehnologie si in acelasi timp sa aiba un nucleu grafic integrat.

Echipamente

Placa video vine intr-o cutie destul de mare, care este decorata cu predominanta culorilor albastre.

În interiorul acestuia puteți găsi următoarele:

  • Placa video în sine.
  • Setați S-Video-lalea.
  • Cablu de alimentare suplimentar.
  • Disc laser cu drivere și programe.
  • Unele revizuiri includ jocul Civilization IV.
  • Manualul utilizatorului.

Textele imprimate pe ambalaj sunt în principal publicitare. Cu toate acestea, printre odele laudative aduse tehnologiilor utilizate în produsul GeForce 9800 GT, caracteristicile tehnice indică direct faptul că acceleratorul grafic se bazează pe 8800 GT. O astfel de onestitate este de invidiat.

Prezența unui număr mare de adaptoare și cabluri de alimentare indică faptul că NVIDIA îi pasă de clienții săi. Dacă trebuie să conectați echipamente non-standard sau mai multe monitoare, nu va trebui să cumpărați componente suplimentare; trebuie doar să le scoateți din cutie.

Proiecta

Se poate observa că atunci când comparăm GeForce 8800 GT și GeForce 9800 GT, caracteristicile lor coincid mult mai mult decât designul lor. Desigur, în termeni generali o placă seamănă cu alta, dar este imposibil să spunem că sunt identice.

Ambele plăci video au aceleași dimensiuni, locația conectorului de alimentare, contactele SLI acoperite cu un dop de cauciuc, precum și poziția GPU-ului și a memoriei IC. Cipurile sunt fabricate de SAMSUNG, iar timpul de eșantionare este de 1 ns.

Locația lanțurilor rămase este complet diferită. Mai mult, inginerii au decis să nu economisească bani și au folosit dispozitive de cea mai înaltă calitate. Puteți vedea condensatoare solide pe placa video. Durata de viață a unor astfel de produse este mult mai lungă decât a celor electrolitice tradiționale. Bobinele de sufocare cu miez de ferită au, de asemenea, timpi de funcționare mai lungi decât cele standard.

Chiar dacă specialiștii au făcut tot posibilul cu instalarea semiconductoarelor, numărul de porturi pentru conectarea dispozitivelor de ieșire în mod clar nu ajunge la reprezentanții de top. Există doi conectori DVI-I și o ieșire TV. Dar acest dezavantaj este compensat de toate adaptoarele necesare.

Sistem de răcire

La o inspecție mai atentă a modelului 9800 GT, performanța sa nu pare impresionantă. Cu toate acestea, există un element pe acceleratorul grafic care poate da un avans multor alte plăci video - acesta este radiatorul. În primul rând, trebuie menționat că sistemul de răcire instalat a fost produs de celebra companie germană Zalman, care este unul dintre liderii pieței.

Este realizat cat se poate de simplu, dar functioneaza foarte silentios si cat mai eficient. Miezul pe care se aplică pasta termică atinge suprafața GPU-ului. Prin el sunt trecute o pereche de tuburi de șase milimetri; forma lor este similară cu litera „U”. Sunt fabricate din cupru. Deasupra tuburilor sunt plăci subțiri de aluminiu.

Întregul design este completat în mod logic de un șurub de viteză redusă cu un diametru de 8 cm.Viteza sa de rotație este selectată automat în funcție de nivelul de încărcare a nucleului grafic. Singurul dezavantaj al sistemului de răcire este că ascunde al doilea slot PCI EXPRESS. Dacă trebuie să instalați simultan două plăci video în computer, va trebui să vă gândiți la înlocuirea radiatorului.

Overclockare

GT, care are specificații modeste, poate fi overclockat folosind software-ul inclus. Aplicația GamerHUD poate schimba frecvențele în timp ce sistemul de operare rulează fără reporniri inutile. În plus, programul vă permite să manipulați tensiunea furnizată GPU-ului, cu toate acestea, utilizarea acestei caracteristici nu este recomandată, astfel încât procesorul video să nu se defecteze.

După overclocking, placa video GeForce 9800 GT continuă să funcționeze stabil, ale cărei caracteristici de frecvență au fost mărite la 700 MHz pentru GPU, 1700 MHz pentru unitatea de shader și 2000 MHz pentru memorie. Temperatura dupa overclock creste usor, fapt pentru care putem multumi sistemului de racire.