Tot i les millores contínues i les actualitzacions incrementals amb cada nova generació, els processadors no han experimentat canvis en la indústria durant molt de temps. La transició dels tubs de buit als transistors va ser enorme. La transició de components individuals a circuits integrats va ser enorme. No obstant això, canvis de paradigma similars en aquesta escala no es van produir després.

Sí, els transistors s’han reduït, els xips són més ràpids i el rendiment ha millorat cent vegades, però comencem a veure disminuir els rendiments ...

Aquesta és la quarta i última entrega de la nostra sèrie de disseny de CPU, que us proporciona una visió general del disseny i fabricació de processadors d’ordinadors. Començant de dalt a baix, hem analitzat com es compila el codi de l'ordinador en llenguatge ensamblador i com es tradueix en instruccions binàries que la CPU pot interpretar. Hem revisat com es dissenyen els processadors i les instruccions de funcionament. Després vam examinar les diverses estructures que formen una CPU.

Aprofundint una mica més, vam veure com es construïen aquestes estructures i com funcionen junts milions de transistors en un processador. Vam veure com els processadors estan físicament fets de silici brut. Hem après els conceptes bàsics dels semiconductors i l’aspecte que té un xip a l’interior. Aquí teniu un directori de la sèrie si us heu perdut algun d’aquests:

Passem a la quarta part. Com que les empreses no comparteixen les seves investigacions ni els detalls de la tecnologia disponible, és difícil entendre exactament el que està passant a la CPU del vostre ordinador. Però el que podem fer és mirar la investigació actual i cap a on va la indústria.




Un dels representants famosos de la indústria de processadors és Moore's Law. Això explica com el nombre de transistors en un xip es duplica aproximadament cada 18 mesos. Això és cert des de fa molt de temps, però comença a desaccelerar-se. Els transistors són tan petits que ens apropem al límit que permetrà la física. Sense una nova tecnologia avançada, haurem d’explorar diferents maneres d’aconseguir augments de rendiment futurs.




120 anys de llei de Moore




Una conseqüència directa d’aquest bloqueig és que les empreses comencen a augmentar el nombre de nuclis en lloc de la freqüència per millorar el rendiment. Aquesta és la raó per la qual veiem que els processadors octa-core es converteixen en xips de doble nucli de 10 GHz. Més enllà d’afegir més llavors, no queda molt marge per créixer.




En una nota completament diferent, Informàtica quàntica És una zona que promet molt marge per al creixement futur. No sóc un expert en això, i com que la tecnologia encara s'està creant, ja no hi ha molts "experts" reals. La computació quàntica, la representació o similars per dissipar qualsevol mite no és una cosa que proporcionarà 1.000 fps a la vida real. De moment, el principal avantatge dels ordinadors quàntics és que permeten algorismes més avançats que abans no eren possibles.




Un dels prototips Quantum Computer d’IBM

En un ordinador convencional, un transistor que representa 0 o 1 està obert o tancat. superposició és possible, cosa que significa que el bit pot ser 0 i 1 alhora. Amb aquesta nova capacitat, els informàtics podran desenvolupar nous mètodes computacionals i resoldre problemes per als quals actualment no tenim capacitats computacionals. Els ordinadors quàntics no són tan diferents com són més ràpids, sinó un model computacional nou que ens permet resoldre diferents tipus de problemes.

La tecnologia per a això encara es troba a una o dues dècades del corrent principal, així que quines són algunes de les tendències que estem començant a veure en els processadors reals ara mateix? Hi ha dotzenes d’àrees d’investigació activa, però tractaré sobre algunes àrees que són més efectives al meu parer.




La tendència creixent que estem influint informàtica heterogènia. Aquesta és una manera d’incloure diversos elements informàtics diferents en un sol sistema. La majoria de nosaltres l’utilitzem als nostres sistemes com a GPU dedicada. La CPU és molt personalitzable i pot realitzar una gran varietat de càlculs a una velocitat raonable. Una GPU, en canvi, està especialment dissenyada per realitzar càlculs gràfics com la multiplicació de matrius. Això és realment bo i ordres de magnitud més grans que una CPU en aquestes instruccions. Podem accelerar la càrrega de treball carregant alguns càlculs gràfics de la CPU a la GPU. És fàcil per a qualsevol programador optimitzar el programari canviant d'algorisme, però l'optimització del maquinari és molt més difícil.

Tot i això, les GPU no són l’única àrea en què els acceleradors són habituals. La majoria dels telèfons intel·ligents tenen desenes d’acceleradors de maquinari dissenyats per accelerar tasques molt específiques. Aquest estil informàtic, Sea of ​​Accelerator i els exemples inclouen processadors de criptografia, processadors d’imatges, acceleradors d’aprenentatge automàtic, codificadors / descodificadors de vídeo, processadors biomètrics i molt més.

A mesura que les càrregues de treball s’especialitzen, els dissenyadors de maquinari afegeixen cada cop més acceleradors als seus xips. Proveïdors de núvols com AWS han començat a proporcionar targetes FPGA perquè els desenvolupadors accelerin les seves càrregues de treball al núvol. Tot i que els elements informàtics tradicionals, com ara processadors i GPU, tenen una arquitectura interna fixa, l’FPGA és flexible. És gairebé com un maquinari programable que es pot configurar segons les necessitats del vostre equip.

Si voleu fer reconeixement d’imatges, podeu aplicar aquests algoritmes al maquinari. Si voleu simular el rendiment d'un nou disseny de maquinari, podeu provar-lo a l'FPGA abans de construir-lo realment. Un FPGA ofereix més rendiment i eficiència energètica que les GPU, però encara menys que un ASIC (circuit integrat específic de l’aplicació). Altres empreses com Google i Nvidia desenvolupen ASIC d’aprenentatge automàtic a mida per agilitzar el reconeixement i l’anàlisi d’imatges.

Preses a la vista que mostren l’estructura de diversos processadors mòbils habituals

Veient el tret final d'alguns processadors bastant nous, podem veure que la major part de l'espai de la CPU no és en realitat el nucli en si. Tots els tipus d’acceleradors capturen una quantitat creixent. Això, a més de l'enorme avantatge d'estalvi d'energia, va ajudar a accelerar càrregues de treball molt específiques.

Històricament, si volíeu afegir processament de vídeo a un sistema, només hi afegiríeu un xip per fer-ho. Tot i això, això és força ineficient. Quan un senyal ha de passar d'un xip d'un cable físic a un altre xip, es necessita una gran quantitat d'energia per bit. Per si sola, una petita porció d'un Joule pot no semblar massa, però pot ser de 3-4 magnitud més eficient per comunicar-se en lloc de deixar el xip dins del mateix xip. Gràcies a la integració d'aquests acceleradors a les CPU, hem vist créixer els xips de potència ultra baixa.

Els acceleradors no són perfectes. A mesura que afegim més als nostres dissenys, els xips es tornen menys flexibles i comencen a sacrificar el rendiment general per obtenir el màxim rendiment en determinades càrregues de treball. En algun moment, tot el xip es converteix en una col·lecció d’acceleradors i ja no és una CPU útil. L'equilibri entre el rendiment específic i el rendiment global sempre està afinat. Aquesta desconnexió entre el maquinari generalitzat i les càrregues de treball específiques, manca d’expertesa.

Tot i que alguns poden pensar que podríem situar-nos al capdamunt d’una bombolla GPU / Machine Learning, probablement podem esperar que es carreguin més càlculs en acceleradors personalitzats. A mesura que el núvol i la IA continuen creixent, les GPU semblen ser la nostra millor solució per aconseguir l'enorme quantitat d'informàtica necessària fins ara.

Un altre àmbit on els dissenyadors busquen més rendiment és la memòria. Tradicionalment, llegir i escriure valors ha estat un dels majors colls d'ampolla per als processadors. Les memòries cau ràpides i grans poden ajudar-vos, però llegir des de la memòria RAM o el vostre disc SSD pot trigar desenes de milers de cicles de rellotge. Per tant, els enginyers sovint consideren l’accés a la memòria més car que la pròpia informàtica. Si el vostre processador vol afegir dos números, primer ha de calcular les adreces de memòria on s’emmagatzemen els números, esbrinar quina jerarquia de memòria té dades, llegir les dades als registres, fer el càlcul, calcular-ne l’adreça. Introduïu l'objectiu i escriviu el valor on sigui necessari. Per a instruccions senzilles que només poden trigar un o dos cicles a completar-se, això és extremadament ineficient.

Una nova idea que ha viscut moltes investigacions, Càlcul de la memòria de proximitat. En lloc de treure petits trossos de dades de la memòria per portar-los al processador ràpid per al càlcul, els investigadors donen la volta a aquesta idea. Intenten incorporar petits processadors directament als controladors de memòria de la vostra memòria RAM o SSD. En apropar el càlcul a la memòria, hi ha un enorme potencial d’estalvi energètic i de temps, ja que les dades no s’han de transferir tant. Les unitats de càlcul poden accedir directament a les dades que necessiten perquè es troben a la memòria. Aquesta idea encara es troba en els seus inicis, però els resultats són prometedors.

Un dels obstacles que cal superar amb la informàtica de memòria propera són les limitacions del procés de producció. Cobert Al capítol 3El procés de fabricació de silicona és molt complex amb desenes de passos. Aquests processos normalment s’especialitzen per produir elements lògics ràpids o elements d’emmagatzematge dens. Si heu intentat crear un xip de memòria mitjançant un procés de fabricació optimitzat computacionalment, tindríeu una densitat molt baixa al xip. Si intenteu construir un processador mitjançant el procés de generació d’emmagatzematge, tindreu un rendiment i un temps molt baixos.

Exemple d’integració 3D que mostra connexions verticals entre capes de transistors.

Coneguda com una possible solució a aquest problema Integració 3D. Els processadors tradicionals tenen una capa de transistors molt gran, però això té les seves limitacions. Com el seu nom indica, la integració 3D és el procés d’apilar diverses capes de transistors una sobre l’altra per augmentar la densitat i reduir la latència. Les columnes verticals basades en diferents processos de fabricació es poden utilitzar per enllaçar les capes. Aquesta idea es va proposar fa molt de temps, però la indústria ha perdut interès a causa de les enormes dificultats en la seva implementació. Recentment, hem vist la tecnologia d’emmagatzematge 3D NAND i s’ha convertit en un espai de treball.

A més dels canvis físics i arquitectònics, una tendència que afectarà tota la indústria dels semiconductors és centrar-se més en la seguretat. Fins fa poc, la seguretat dels nostres processadors es considerava una mica més tardana. Això és similar a com es dissenyen Internet, el correu electrònic i molts altres sistemes que confiem gairebé sense tenir en compte la seguretat. S'ha obert qualsevol seguretat disponible actualment per fer-nos sentir més segurs. Amb els processadors, això ha tornat, sobretot per picar empreses com Intel.

Els errors Spectre i Meltdown són potser l’exemple més famós de dissenyadors que afegeixen funcions que acceleren molt el processador, tot i que no entenen del tot els riscos de seguretat implicats. El disseny actual del processador posa molt més èmfasi en la seguretat com a part important del disseny. Amb l’augment de la seguretat sovint es produeix un èxit de rendiment, però tenint en compte els danys que poden causar aquests errors de seguretat principals, és segur dir que estem millor centrant-nos en la seguretat i en el rendiment.

Abans d’aquesta sèrie vam tractar tècniques com High Level Synthesis, que compta amb algorismes avançats que permeten als dissenyadors especificar primer els seus dissenys en un llenguatge de programació d’alt nivell i després determinar la configuració de maquinari òptima per realitzar aquesta funció. A mesura que els cicles de disseny són cada vegada més cars amb cada generació, els enginyers busquen maneres d’accelerar el seu desenvolupament. Espereu que aquesta tendència en el disseny de maquinari alimentat per programari continuï creixent en les seves capacitats a la carretera.

Tot i que és impossible predir el futur, les idees innovadores i les àrees de recerca que hem esmentat aquí haurien de servir de full de ruta que podem esperar en els futurs dissenys de processadors. El que podem dir amb seguretat és que ens acostem al final de les millores periòdiques del procés de producció. Per continuar millorant el rendiment de cada generació, els dissenyadors hauran de trobar solucions encara més sofisticades.

Esperem que aquesta sèrie de quatre parts us hagi despertat l’interès pel disseny, fabricació, validació i molt més del processador. Hi ha material sense fi, i cadascun d’aquests articles podria omplir un curs universitari de gamma alta si intentem cobrir-los tots. Amb sort, heu après alguna cosa nova i coneixeu millor com són els ordinadors complexos a tots els nivells. Si teniu suggeriments sobre temes en els quals voleu que busquem, sempre estem oberts a suggeriments.

Crèdit masthead: Processador d'ordinador Dan74 amb il·luminació abstracta