El 2020, Intel tornarà al negoci dels gràfics discrets i s’espera que llanci una nova GPU per als jugadors. Ho podem veure de dues maneres: els gràfics Intel s’estan convertint o, miraculosament, en el cul de les bromes de PC de nova generació, i entren en un mercat dominat per només dos jugadors des del canvi de mil·lenni.

Aquí teniu una breu cronologia de com es va concretar aquest llançament recent a la vista del públic:

12 de juny de 2018: Brian Krzanich, antic conseller delegat d’Intel, va dir als inversors en una reunió especial que Intel fa anys que desenvolupa discretament una arquitectura de GPU discreta "Arctic Sound" i que es publicarà el 2020.

8 de gener de 2019: Gregory Bryant, vicepresident d'usuaris veterans d'ordinadors durant el CES, explica que la propera GPU es produirà en el procés d'Intel de 10 nm.

21 de març de 2019: Intel ofereix dos dissenys a l’escenari per a les seves GPU. Estilísticament, són similars als discs SSD Optane i, per mida, tenen capacitat de refrigeració de gamma mitjana.




1 de maig de 2019: Jim Jeffers, enginyer en cap i gerent de l'equip de visualització i renderització, va anunciar les capacitats de traçat de raigs Xe a FMX19. A més, Intel va continuar allunyant les capacitats dels competidors.




Hi ha moltes filtracions i murmuris sobre l’espai tecnològic entre aquestes dates i podem recopilar quantitats titàniques d’informació estudiant els fonaments de l’arquitectura Intel. Aquest és el tema d’aquest article.

desenvolupament

Sense voler arriscar-se, Intel va decidir que tot el seu equip gràfic seria un expert robat a AMD i Nvidia. Vam saber per primera vegada que Intel fabricaria GPU discretes: van contractar el gestor d’arquitectura gràfica i el gestor de negocis gràfics d’AMD, Raja Koduri, Ser vicepresident sènior d’informàtica bàsica i visual a Intel el 2017.




Després va venir Jim Keller, l'arquitecte principal de l'arquitectura Zen d'AMD, al paper de vicepresident sènior d'enginyeria del silici. Intel va convertir més tard a Chris Hook, director sènior de màrqueting global de productes a AMD, un venedor de GPU independent. A continuació, Darren McPhee, antic director de màrqueting de productes d’AMD; L'ex periodista tecnològic Damien Triolet es va convertir en comercialitzador d'AMD; Tom Peterson, director tècnic de màrqueting i arquitecte de xips a Nvidia; i finalment, Heather Lennon, responsable de màrqueting i comunicacions gràfiques d’AMD.




Per descomptat, només l’obra pública més gran. L’equip gràfic d’Intel té 4.500 equips. I no tindríeu tanta gent i gent amb tant de talent sense fer almenys alguna cosa vagament interessant.




Arquitectònic

Recompte bàsic

Tot i que Xe pertany al futur, no hi ha tecnologia separada dels productes que van sorgir en el passat i del desenvolupament que la va donar lloc, generacions ben documentades. La primera ronda de productes Xe utilitzarà una arquitectura desenvolupada a partir de l'actual "Gen11", però encara estretament relacionada i basada en les declaracions d'Intel al CES. Per tant, podem recopilar informació interessant de la investigació d'Intels. paper blanc Gen11.

Com recordeu el nostre Comparació entre Navi i TuringTotes les arquitectures gràfiques consten de parts cada vegada més complexes. 16 nuclis CUDA agrupats per a Nvidia blocsquatre d'ells un multiprocessador de transmissió, una parella conjunt de renderització de textures (TPC) i un d’ells en té quatre o sis conjunt de representació gràfica (GPC). Per tant, cada GPC conté 512 o 768 nuclis CUDA.




Com es mostra a la taula següent, el nombre de GPC i TPC per GPC determina el nombre de nuclis per a cada dau. Recordeu que és possible que algunes GPU a la venda tinguin alguns d’aquests nuclis desactivats. Per exemple, un RTX 2070 Super utilitza un dau TU104 que permet limitar el 83% dels nuclis a 2560 nuclis CUDA.

  6 clústers de processament de gràfics 3 clústers de processament de gràfics
768 CUDA per GPC (6 TPC per GPC) 768 x 6 = 4608 CUDA (TU102) 768 x 3 = 2304 CUDA (TU106)
512 CUDA per GPC (4 TPC per GPC) 512 x 6 = 3072 CUDA (TU104) 512 x 3 = 1536 CUDA (TU116)

Apliquem el mateix concepte a l'arquitectura d'Intel.

Els nuclis d'Intel no són similars als CUDA de Nvidia, però són similars als processadors de flux d'AMD, així que anem a discutir-ne els termes. Cada processador de flux és un Unitat de lògica aritmètica pot realitzar una operació de coma flotant o enter per hora. Intel unitats lògiques aritmètiques Anomenem-los l’equivalent a quatre nuclis, ja que poden realitzar quatre operacions per hora.

Intel comença emparellant els dos unitats lògiques aritmètiques a algú unitat executiva (vuit nuclis) seguits d’un llesca inferior (64 nuclis), llavors vuit d’ells estan més plens llesca (512 colors).

Els processadors d'Intel de nova generació inclouen un segment integrat, però, com us podeu imaginar, la matriu discreta Xe es construirà a partir de diverses llesques. Bàsicament, això significa que Intel només pot produir patrons amb recompte de nuclis en múltiples de 512, com Nvidia. El recompte bàsic d’un dau és el nombre de llesques multiplicat per 512.

Nombre de llesques 2 3 4 5 6 7 8
Recompte bàsic 1024 1536 2048 2560 3072 3584 4096
A * iDG2HP128   iDG2HP256       iDG2HP512

Recordeu, suposem que Intel mantindrà la configuració bàsica de la secció Gen11, perquè és evident que potser no tindran temps de redissenyar completament els gràfics gràfics fins a l’any vinent. El Gen11 és molt adequat per ser integrat i discret amb el disseny, per descomptat, però alguns elements haurien de canviar, com ara el backend de renderització que, si no es modifica, obstruirà un disseny de diverses llesques.

Arquitectura possible de 2048 nuclis (quatre talls) Xe

Proves

Convenientment, Intel ha proporcionat un potent paquet d’evidències per donar suport a aquesta hipòtesi. un conductor contenia erròniament els noms de diversos productes no publicats llançats a finals de juliol; "IDG2HP512", "iDG2HP256" i "iDG2HP128;" vam interpretar els codis com a "gràfics discrets Intel [model] de dues potències elevades" seguit del nombre d'unitats d'execució.

Cada unitat d'execució té vuit nuclis, de manera que obtenim "512" amb quatre talls i 4096 nuclis, "256" amb dos talls i 2048 nuclis i "128" amb dos talls i 1024 nuclis. Aquestes configuracions admeten perfectament la nostra anàlisi.

Intel també va anunciar que explora maneres de combinar llesques. A principis del 2018, Intel va demostrar un prototip de GPU discreta que contenia dues llesques Gen9 combinades en un sol dau, i el va implementar amb el nou Iris Plus Graphics 650 integrat, combinant dues llesques Gen9.5 en un sol dau. També estan experimentant amb un enfocament chiplet mitjançant EMIB (pont de connexió multi-encastat incrustat), que es va utilitzar per primera vegada al llac Kaby G.

Disseny arquitectònic EMIB

EMIB combina essencialment dos o més motlles físics en un motlle virtual per a un estalvi massiu de costos i una lleugera penalització de rendiment, "combinant de manera efectiva múltiples patrons heterogenis en un sol paquet". Com a Nvidia del 2017 Treball de recerca perquè "els motlles molt grans tenen una eficiència molt baixa a causa d'un gran nombre de defectes de fabricació irreparables".

En crear una gran quantitat de patrons petits i combinar-los, Intel redueix la probabilitat d'errors en produir-los i fa que sigui més barat eliminar-los. Tot i que l’EMIB no està completament preparat per a la distribució massiva, Intel a l’abril aprovat Espero amb interès Anandtech, ja que aviat pretenen utilitzar EMIB per donar suport a la seva GPU.

Velocitat del rellotge

Temps del gràfic. Hem trobat una estimació raonable dels números base, així que anem a analitzar-ho en el pitjor dels casos per crear una base. És a dir, fa coincidir el recompte bàsic amb la velocitat de rellotge dels millors gràfics integrats d'Intel disponibles a 1150 MHz. Per combinar la velocitat i el recompte de nuclis, representarem els TFLOP, una mesura teòrica del rendiment basada en aquestes dues variables. Tot i que TFLOPS és un indicador de rendiment excel·lent en una GPU de generació produïda pel fabricant, val la pena assenyalar que és menys fiable comparar els dos fabricants.

TFLOPS de 1,2 GHz

Tot i que Intel és competitiva pel que fa al recompte de nuclis, no poden competir a 1150 MHz. Afortunadament, no és el cas en què ens trobem. Almenys sabem que poden superar les velocitats integrades perquè estan limitades per la sortida tèrmica de la CPU, cosa que no és un problema quan no hi ha CPU. En segon lloc, els nous xips Intel de Xe utilitzaran els 10 nm més ràpids i superiors.

Es creu que el procés d'Intel de 10 nm és equivalent a 7 nm de TSMC com a màxim, que pot situar-se a 1800 MHz quan es juga en un Radeon 5700XT ben refrigerat. Intel té una llarga història de compressió dels seus processos a velocitats més altes que els seus competidors. Tot i això, es tracta de les llargues i llargues GPU d’Intel de primera generació, de manera que el pessimisme prudent ofereix més precisió: diguem que Intel pot gestionar almenys 1700 MHz.

TFLOPS a 1,7 GHz

A aquestes velocitats potencialment més realistes, Intel sembla una mica competitiva al front de TFLOPS. Tingueu en compte, però, que aquestes estimacions de velocitat no pretenen ser fiables, especialment si es compara amb els càlculs del recompte de nuclis.

En poques paraules: és probable que les GPU discretes Xe apareguin aproximadament al mateix preu per nucli que Nvidia a 512 vegades core i velocitats competitives d’1,7 GHz.

Programari

Les GPU tenen molt més que el maquinari. Nvidia contracta famosos més enginyers de programari que enginyers de maquinari. Donar suport a tots els jocs suposa una inversió costosa i que requereix molt de temps, cosa que forma part del motiu pel qual els nous entrants al mercat de les GPU de jocs pràcticament desapareixen. A excepció d'Intel, definitivament no són nous en el programari, tot i que són nous en el joc de maquinari independent. Imagineu-vos un traductor entre jocs i maquinari per a controladors; només el maquinari canvia, de manera que convertir els controladors integrats existents a un sistema discret és un procés senzill.

Aquests controladors no estan tan ben protegits, i això és el que Intel critica des de fa molt de temps. El temps mitjà entre els darrers deu llançaments del controlador va ser de vint-i-cinc dies per a Intel, divuit dies per a Nvidia i només deu dies per a AMD. Afortunadament, hi ha moltes possibilitats que Intel pugi els mitjons cap amunt per a la Xe, tenint en compte quants controladors són més importants per a les GPU discretes per a les GPU integrades.

Però no està gens malament. Intel va avançar-se l'any passat i va obrir el camí a Nvidia i AMD amb el seu nou Centre de Comandament que proporciona un control molt millor i més indolor sobre les GPU i els jocs que la GeForce Experience de Nvidia. Ofereix optimització de jocs amb el que fa cada configuració i el seu impacte en el rendiment, configuració ràpida de múltiples pantalles amb sincronització de freqüència d’actualització i rotació, precisió del color de la pantalla i ajustos d’estil i control del controlador. I un detall trivial però agradable, Intel també admet asíncron, de manera que tots els productes Xe admetran els monitors i ecosistemes FreeSync des de la porta.

Mercat

Quan la posició al mercat dels productes és incerta, poc importa l’arquitectura o l’ecosistema. En sabem molt poc. Costaran 100 o 1.000 dòlars? Un model, dos o deu? Recentment se li va preguntar si Xe podia dirigir-se al mercat Raja Koduri va respondre:

“No tothom comprarà una targeta de $ 500 a 600, però també hi ha prou gent per comprar-les; és un gran mercat. Per tant, no ens preocupem realment per l’estratègia que perseguim, el rang de rendiment, la gamma de costos i tot, perquè finalment la nostra arquitectura ha d’arribar al corrent principal a partir dels 100 dòlars, com va dir el públic. A gràfics cars de centre de dades amb memòries HBM i tot.

Hem d’encertar-ho tot; per on acabes de començar Primer? El segon? Tercer? I l'estratègia que hem tingut aproximadament en un període de temps: anomenem-la 2-3 anys perquè sigui la pila completa. "

I aquí està: Intel llançarà diverses GPU. No és precisament una informació valuosa, però s’espera que Intel voldrà mantenir les seves cartes a prop del pit. I com que és l'única paraula oficial sobre aquest tema, ara hauríem de recórrer a una font alternativa: el controlador filtrat.

Imatge: construcció conceptual Intel Cristiano Siqueira

Les tres GPU, anomenades controladors Intel per als primers controladors, tenen 1024, 2048 i 4096 nuclis. Això els farà competitius amb el RTX 1650, RTX 2060 i RTX 2080 Ti a preus de 150 $, 350 $ i 1000 $, respectivament. Intel pot optar per superar Nvidia amb velocitats més altes o un valor inferior a preus més baixos, o simplement confiar en altres funcions per igualar-les i diferenciar-les.

El controlador també proporciona una perspectiva a llarg termini amb dues targetes de "desenvolupador". El grup, juntament amb els altres tres, és un "iDG1LPDEV" que evoluciona cap a una targeta "Intel discrete graphics [model] 1 low power developer" (targeta de gràfics discrets Intel [model] 1), que podria indicar que s'estan provant les GPU portàtils de baix consum. També hi ha una llista separada de "iATSHPDEV" que mostra el nom de codi "Arctic Sound" per a l'arquitectura de Xe, però no es pot verificar com a GPU discreta.

Si hi ha alguna cosa que cal recordar ... el que publicarà Intel és desconegut i l’especulació no implica consells de compra. D’altra banda, les coses són prometedores. És molt prometedor.

Dreceres de compres: