fotó: Harrison Broadbent on Unsplash

ez a jelentés összefoglalja azokat a technológiai trendeket, amelyek a sötét Szilícium jelenségét okozzák, annak hatását a szerverekre, valamint a Hardavellas által 2011-ben közzétett kutatási cikk alapján. A szerver chipek nem lépik túl egy bizonyos határt. Ennek eredményeként a chip egyre nagyobb része ki van kapcsolva, sötét Szilícium néven ismert,amelyet nem engedhetünk meg magunknak. A speciális többmagos processzorok kihasználhatják a bőséges, kihasználatlan és korlátozott teljesítményű szerszámterületet azáltal, hogy különféle alkalmazás-specifikus heterogén magokat biztosítanak a szerver teljesítményének és energiahatékonyságának javítása érdekében.

az adatok exponenciális ütemben növekednek. Számítási energiát igényel a számítások feldolgozása és végrehajtása. Megfigyelték, hogy az adatok gyorsabban növekednek, mint Moore törvénye . Moore törvénye kimondja, hogy a számítógép teljesítménye, a CPU órajele és a chipenkénti tranzisztorok száma kétévente megduplázódik. Soha nem látott mennyiségű számítási energia szükséges ahhoz, hogy megbirkózzon ezzel a kihívással. Elég, hogy egy ötlet az energiaigény egy példa, hogy 1000m2 adatközpont 1,5 MW. Manapság többmagos processzorokat használnak ezen adatok feldolgozására. Úgy gondolják, hogy a rendszer teljesítménye közvetlenül arányos a rendelkezésre álló magok számával. Ez a meggyőződés azonban nem igaz, mert a teljesítmény nem követi Moore törvényét. A valóságban a teljesítmény sokkal lassabb, mint a várt eredmények bizonyos fizikai korlátok miatt, mint például a sávszélesség, a teljesítmény és a termikus korlátok, amint azt az 1.ábra mutatja.

1. ábra: fizikai korlátok

megfigyelhető, hogy a chipen kívüli sávszélesség lassan növekszik. Ennek eredményeként a magokat nem lehet elég gyorsan táplálni adatokkal. A tranzisztorok számának növekedése nem csökkenti elég gyorsan a feszültséget. A tranzisztorok 10-szeres növekedése csak 30% – os feszültségcsökkenést eredményezett az elmúlt évtizedben. Hasonlóképpen, a teljesítményt a hűtési korlátok korlátozzák, mivel a hűtés egyáltalán nem skálázódik. A többmagos forradalom táplálása érdekében a chipen lévő tranzisztorok száma exponenciálisan növekszik. Az összes tranzisztor egyidejű működtetése azonban chipenként exponenciálisan több energiát igényel, ami a korábban kifejtett fizikai korlátok miatt egyszerűen nem lehetséges. Ennek eredményeként a chip exponenciálisan nagy területe kihasználatlan marad, amelyet sötét szilíciumnak neveznek.

a sötét Szilícium terület exponenciálisan növekszik, amint azt a 2.ábrán látható trendvonal mutatja. Ebben a grafikonban a különböző munkaterhelések csúcsteljesítményének szerszámmérete az idővel van ábrázolva. Egyszerű szavakkal, a nagy chipen elérhető tranzisztorok csak töredékét használhatjuk, a többi tranzisztor pedig kikapcsolt állapotban marad.

2. ábra: Die size trend

most felmerül a kérdés, vajon pazaroljuk-e a chip ezen nagy, kihasználatlan sötét területét? Hardavellas et al. újrafelhasznált sötét szilícium chip multiprocesszorokhoz (CMP-k) speciális heterogén alkalmazás-specifikus magok tengerének felépítésével. Ezek a speciális magok dinamikusan csak néhány kiválasztott magot táplálnak, amelyeket kifejezetten az adott munkaterheléshez terveztek. Ezen alkalmazásmagok többsége továbbra is letiltja / sötét, ha nem használja.

a speciális magok előnyei: a speciális magok jobbak, mint a hagyományos magok, mert kiküszöbölik az általános költségeket. Például egy adat eléréséhez a helyi memóriából, az L2 gyorsítótárból és a fő memóriából 50 pJ, 256-1000 pJ és közel 16000 pj energia szükséges. Ezek az általános költségek az általános célú számítástechnikához tartoznak, míg egy gondosan megtervezett speciális mag kiküszöböli ezen általános költségek nagy részét. A speciális magok javítják a kiszolgálói munkaterhelések összesített teljesítményét és energiahatékonyságát a fizikai korlátok hatásának enyhítésével.

1.1 módszertan

a sötét Szilícium mértékének felméréséhez elengedhetetlen a nagyszámú tervezési paraméter együttes optimalizálása olyan CMP-k összeállításához, amelyek képesek elérni a csúcsteljesítményt, miközben a fizikai korlátokon belül maradnak. Ezért elsőrendű analitikai modelleket fejlesztünk ki a processzor fő összetevőinek optimalizálásával, mint például a tápfeszültség & küszöbfeszültség, az órajel frekvenciája, a gyorsítótár mérete, a memória hierarchiája és a magszám. Az analitikai modellek célja a csúcsteljesítmény-tervek levezetése és a processzor fizikai korlátainak leírása. A részletes paraméterezett modellek az ITRS* szabványok szerint készülnek. Ezek a modellek segítenek a multicores tervezési térének feltárásában. Vegye figyelembe, hogy ezek a modellek nem javasolják a processzorok csúcsteljesítményének eléréséhez szükséges magok abszolút számát vagy gyorsítótár méretét. Ehelyett analitikai modellek, amelyeket a technológiai méretezés elsőrendű hatásainak megragadására javasoltak, hogy feltárják a sötét szilíciumhoz vezető trendeket. Ezeknek a modelleknek a teljesítményét aggregált szerverátbocsátással mérik, a modellt pedig heterogén számítástechnikában önállóan vizsgálják.

az ilyen modellek felépítéséhez néhány tervezési konfigurációs választást tettünk a hardver, a sávszélesség, a technológia, a teljesítmény és a terület modellek számára, amint azt a következő részben részletesen ismertetjük.

2.1 hardver modell

a CMP-k háromféle magra épülnek, azaz általános célú (GPP), beágyazott (EMB) és specializált (SP). A GPP-k skalár sorrendben négyirányú többszálú magok, amelyek nagy teljesítményt nyújtanak szerver környezetben, 1,7-szer nagyobb sebességet érve el egyszálú magon keresztül . Az EMB magok teljesítménytudatos tervezési paradigmát képviselnek, teljesítményükben hasonlóak a GPP magokhoz. A speciális magok speciális hardverrel rendelkező CMP-k, pl. GPU, digitális jelfeldolgozókés terepen programozható kapu tömbök. Csak azok a hardverkomponensek fognak bekapcsolódni,amelyek a legjobban megfelelnek az adott munkaterhelésnek bármikor. Az SP magok felülmúlják a 20x GPP magokat, 10x kevesebb energiával.

2.2 technológiai modell

a CMP-ket 65nm, 45nm, 32nm és 20nm gyártási technológiákon modellezik az ITRS előrejelzéseit követve. A magas VTH küszöbfeszültségű tranzisztorok a legjobbak a szivárgási áram csökkentésének értékelésére. Ezért nagy Vth tranzisztorokat használnak a teljesítményfal hatásának enyhítésére . A teljes chiphez nagy teljesítményű tranzisztorokkal rendelkező CMP-k, a gyorsítótár LOP (alacsony működési teljesítmény) és a teljes chiphez tartozó lop tranzisztorok a modell jellemzőinek és viselkedésének feltárására szolgálnak.

2.3 Területmodell

a modell a szerszámterületet 310 mm2-re korlátozza. Az Interconnect és a system-on-chip komponensek a terület 28% – át foglalják el, a fennmaradó 72% pedig a magokra és a gyorsítótárra vonatkozik. A magterületeket úgy becsülhetjük meg, hogy az egyes magtípusokhoz az itrs szabványok szerint méretezzük a meglévő terveket. Az UltraSPARC T1 mag GPP magokhoz, az ARM11 pedig EMB és SP magokhoz van méretezve.

2.4 teljesítménymodell

Amdahl törvénye a teljesítménymodell alapja. 99% – os alkalmazási párhuzamosságot feltételez. Az egyetlen mag teljesítményét az uipc (felhasználói utasítások ciklusonként) összesítésével számítják ki. Az uipci-k kiszámítása a következő képlet által megadott memória-hozzáférési idő alapján történik:

AverageMemoryAccessTime = HitTime + MissRate × MissPenalty

UIPC arányos a teljes rendszer teljesítményét. A teljesítménymodell részletes képletei, levezetései és számításai a következő címen érhetők el:.

2,5 L2 gyorsítótár hibaszázaléka és adatkészlet-evolúciós modellek

a gyorsítótár hibaszázalékának becslése az adott munkaterheléshez fontos, mivel irányító szerepet játszik a teljesítményben. Az L2 gyorsítótár mérete 256 KB és 64 MB között van görbére illesztve empirikus mérésekkel a gyorsítótár kihagyási arányának becsléséhez. X-eltolódott a hatalom törvény
y = α (x + β )^γ biztosítja a legjobb illeszkedést az adatok csak 1,3% – os átlagos hibaarány. Miss-rate méretezés képletek vannak felsorolva a részleteket ebben a munkában .

2.6 chipen kívüli sávszélesség-modell

a Chip sávszélesség-követelményeit a chipen kívüli aktivitási sebesség, azaz az órafrekvencia és a mag teljesítményének becslésével modellezik. A chipen kívüli sávszélesség arányos az L2 kihagyási arányával, a magszámmal és az alaptevékenységgel. A maximális rendelkezésre álló sávszélességet a betétek és a maximális chipen kívüli órák számának összege adja. Modellünkben a 3D-halmozott memóriát NAGY L3 gyorsítótárként kezeljük, nagy kapacitása és nagy sávszélessége miatt. A 3D halmozott memória minden rétege 8 Gbit, 45 nm-es technológiával. Az egyes rétegek energiafogyasztása a legrosszabb esetben 3,7 Watt. 8 réteget modellezünk, összesen 8 Gbyte kapacitással és egy extra réteggel a vezérlési logikához. Hozzáadása 9 rétegek emeli a chip hőmérsékletét 10 C. mindazonáltal, figyelembe vesszük az energiaeloszlást e hatások ellensúlyozására. Becsléseink szerint a 3D-s halmozás 32% – kal javítja a memória hozzáférési idejét.5%, mert a magok és a 3D memória közötti kommunikáció nagyon hatékony.

2.7 teljesítménymodell

a teljes chipteljesítményt úgy számítják ki, hogy hozzáadják az egyes komponensek statikus és dinamikus teljesítményét, például a magot, a gyorsítótárat, az I/O-t, az összekapcsolást stb. Az ITRS adatait a hűtőbordákkal ellátott léghűtéses chipek maximális rendelkezésre álló teljesítményének kezelésére használjuk. Modellünk a maximális teljesítménykorlátokat veszi bemenetként, és elveti az összes CMPs-kialakítást, amely meghaladja a meghatározott teljesítménykorlátokat. A folyadékhűtési technológiák növelhetik a maximális teljesítményt azonban még nem sikerült termikus hűtési módszereket alkalmazni a magokban. Az N magok és az L2 gyorsítótár dinamikus teljesítményét a cikkben említett képletek segítségével számítják ki.

*https://en.wikipedia.org/wiki/International_Technology_Roadmap_for_Semiconductors

3. ábra: általános célú (GPP) chip Multiprocesszorok teljesítménye

3 elemzés

a tervezés után be kell mutatnunk analitikai modelljeink használatát. Az általános célú és speciális többmagos processzorok csúcsteljesítményét a következő két alszakaszban fogjuk megvizsgálni. Továbbá értékelni fogjuk ezeknek a terveknek a magszámát, és összehasonlító elemzéssel zárjuk le.

3.1 általános célú többmagos processzorok

kezdjük azzal, hogy a peak performance design-space exploration algoritmusunk előrehaladását a 3.ábrán látható eredményekkel magyarázzuk. A 3a ábra egy 20 nm-es GPP CMPs teljesítményét mutatja, amely Apache-t futtat nagy teljesítményű (HP) tranzisztorok használatával mind a magok, mind a gyorsítótár számára. A grafikon az összesített chip teljesítményét mutatja az L2 gyorsítótár méretének függvényében. Ez azt jelenti, hogy a szerszámterület egy része az L2 gyorsítótárnak van szentelve (az X tengelyen MB-ban ábrázolva).

terület görbe mutatja a teljesítményt a tervezés korlátlan teljesítmény és off-chip sávszélesség, de miután korlátozott on-chip die területen. Nagyobb a gyorsítótár kevesebb magot. Annak ellenére, hogy néhány mag elfér a fennmaradó szerszámterületen, mindegyik mag a legjobban teljesít a nagyobb gyorsítótár magas találati aránya miatt. A teljesítmény előnye az L2 gyorsítótár 64 MB-ig történő növelésével érhető el. Ezt követően meghaladja a magok számának további csökkentésének költsége.

teljesítménygörbe mutatja a teljesítmény a design fut a maximális frekvencia Korlátozott teljesítmény miatt léghűtés megszorítás, de korlátlan off-chip sávszélesség és terület. A teljesítménykorlátozás korlátozza az összesített chip teljesítményét, mivel a magok maximális frekvencián történő futtatása példátlan mennyiségű energiát igényel, ami csak nagyon kevés magra korlátozza a kialakítást.

a sávszélességi görbe a tervezés teljesítményét jelenti, amely korlátlan teljesítményen és lapkaterületen fut, korlátozott chipen kívüli sávszélességgel. Az ilyen kialakítás csökkenti a chipen kívüli sávszélesség nyomását a rendelkezésre álló nagyobb gyorsítótár méretének köszönhetően, és javítja a teljesítményt. A terület + teljesítmény görbe a teljesítmény és a terület korlátozott, de a chipen kívüli sávszélesség korlátlan teljesítményét képviseli. Az ilyen kialakítás együttesen optimalizálja a magok frekvenciáját és feszültségét azáltal, hogy kiválasztja a csúcsteljesítmény kialakítását az egyes L2 gyorsítótár méretekhez.

a csúcsteljesítmény-görbe a többmagos kialakítást képviseli, amely alkalmazkodik az összes fizikai korláthoz. A teljesítményt a chipen kívüli sávszélesség korlátozza az elején, de 24 MB után a teljesítmény lesz a fő teljesítménykorlátozó. A csúcsteljesítmény kialakítása a teljesítmény és a sávszélesség görbék metszéspontjában érhető el. A csúcsteljesítmény és a területgörbe közötti nagy különbség azt jelzi, hogy a GPP-ben lévő szilícium hatalmas területe nem használható több maghoz a teljesítménykorlátok miatt.

a 3b. ábra a magokhoz nagy teljesítményű (HP) tranzisztorokat, a gyorsítótárhoz pedig alacsony működési teljesítményt (LOP) használó konstrukciók teljesítményét mutatja. Hasonlóképpen, a 3C ábra az alacsony működési teljesítményű tervek teljesítményét mutatja mind a magok, mind a gyorsítótár számára. A HP tranzisztorokat használó tervek csak a 20 nm-es szerszámterületbe illeszkedő magok 20% – át tudják bekapcsolni. Másrészt a gyorsítótárhoz LOP tranzisztorokat használó tervek (3C ábra) nagyobb teljesítményt nyújtanak, mint a HP tranzisztorokat használó tervek, mivel nagyobb gyorsítótárakat tesznek lehetővé, amelyek körülbelül kétszerese a magok számának, azaz esetünkben 35-40% – os magok. A LOP eszközök nagyobb energiahatékonyságot eredményeznek, mivel alkalmasak mind a magok, mind a gyorsítótár megvalósítására.

ezért arra a következtetésre juthatunk, hogy az általános célú többmagos processzorok által kínált csúcsteljesítmény-tervezés nagy mennyiségű sötét szilíciumot eredményez, amikor a magokat és a gyorsítótárakat HP tranzisztorokkal építik. A LOP tranzisztorok használata azonban bizonyos mértékig csökkenti a sötét területet, amint azt korábban kifejtettük, és a 3.ábrán látható.

magszám-elemzés: a felhasznált magok számának elemzéséhez a 4a ábra a megfelelő technológia meghatározott szerszámterületére illeszkedő magok elméleti számát ábrázolja a csúcsteljesítmény-tervek magszámával együtt. A chip teljesítménykorlátozása miatt a HP-alapú tervek 2013 után lehetetlenné váltak. Bár a LOP-alapú tervek előrelépést jelentettek, a szerszámterület határa és a LOP-tervek közötti nagy rés azt jelzi, hogy a szerszámterület növekvő része sötét marad az alul kihasznált magok miatt.

3.2 specializált többmagos processzorok

most bemutatjuk a csúcsteljesítmény-terveket GPP, beágyazott (EMB) és specializált (SP) magokkal, amelyek 20 nm-es lapátterületű LOP tranzisztorokat használnak.

az SP magok extrém alkalmazását egy speciális számítástechnikai környezet figyelembevételével értékelik, ahol a többmagos chip több száz különféle alkalmazás-specifikus magot tartalmaz. Csak azok a magok aktiválódnak, amelyek a leghasznosabbak a futó alkalmazás számára. A chipen lévő többi mag kikapcsolt állapotban marad. Az SP magok kialakítása nagy teljesítményt nyújt kevesebb, de erősebb maggal. Megfigyelték, hogy az SP magok rendkívül energiahatékonyak, és jelentősen felülmúlják a GPP és EMB magokat.

Magszám Elemzés: A 4B ábra az említett magtípusok csúcsteljesítményű terveinek magszámainak összehasonlító elemzését mutatja. Ez azt mutatja, hogy a csúcsteljesítményű SP-tervek csak 16-32 magot használnak, a gyorsítótár pedig a die chip területének nagy részét foglalja el. Az alacsony magszámú SP-tervek 99,9% – os párhuzamossággal felülmúlják a többi mintát. Az SP magok nagy teljesítményű jellemzői tovább növelik az energiaburkolatot, mint más magtervek esetén lehetséges. Az SP multicores 2x-12x sebességet ér el az EMB és a GPP többmagos kialakításoknál, és végső soron korlátozza őket a korlátozott chipen kívüli sávszélesség. 3D-halmozott memóriát használnak a sávszélesség-korlátozások hatásának enyhítésére a teljesítményhatárokon túl. A 3D-halmozott memória használata kitolja a sávszélesség korlátozását, és nagy teljesítményű, korlátozott teljesítményű kialakításhoz vezet (4C ábra). A chipen kívüli sávszélesség szűk keresztmetszetének megszüntetése visszavezet minket a korlátozott teljesítményű rendszerhez, amelynek kihasználatlan szerszámterülete van (4B ábra). A chipen kívüli sávszélesség csökkentése a 3D memória speciális magokkal történő kombinálásával 3x-kal növeli a sebességet a 20 nm-es szerszámmérethez, és csökkenti a chipen lévő gyorsítótár méretére nehezedő nyomást. Másrészt a GPP és EMP chip Multiprocesszorok csak kevesebb, mint 35% – os teljesítménynövekedést érhetnek el.

4. ábra: Core Counts elemzés

4 A jelenlegi legkorszerűbb

a sötét Szilícium jelensége 2005-ben kezdődött. Ez volt az az idő, amikor a processzortervezők elkezdték növelni az alapszámot, hogy kihasználják Moore törvényének méretezését, nem pedig az egymagos teljesítmény javítását. Ennek eredményeként kiderült, hogy a Moore-törvény és a Dennard-skálázás a valóságban fordítva viselkednek. A Dennard skálázás azt állítja, hogy a tranzisztorok sűrűsége egységnyi területen állandó marad a méretének csökkenésével . Kezdetben a processzorok feladatait különböző területekre osztották a hatékony feldolgozás elérése és a sötét Szilícium hatásának minimalizálása érdekében. Ez a felosztás vezetett a lebegőpontos egységek fogalmához, majd később felismerték, hogy a processzor feladatainak speciális modulokkal történő felosztása és elosztása szintén segíthet a sötét Szilícium problémájának enyhítésében. Ezek a speciális modulok egy kisebb processzorterületet eredményeztek, hatékony feladat-végrehajtással, amely lehetővé tette számunkra, hogy egy adott tranzisztorcsoportot kikapcsoljunk egy másik csoport indítása előtt. Néhány tranzisztor hatékony használata egy feladatban lehetővé teszi számunkra, hogy a processzor másik részében továbbra is működő tranzisztorok legyenek. Ezek a koncepciók a System on Chip (SoC) és a system in Chip (Sic) processzorokra fejlődtek. Az Intel processzorok tranzisztorai a munkaterhelésnek megfelelően is be – /kikapcsolnak. A jelentésben tárgyalt speciális többmagos tervezés azonban további kutatásokat igényel annak érdekében, hogy felismerje annak hatását más SoC és SiC többmagos processzorokra, amelyek eltérő sávszélességi és hőmérsékleti követelményeket támasztanak.

5 kapcsolódó munka

ebben a részben megvitatjuk az irodalomban javasolt egyéb stratégiákat, technikákat vagy trendeket a sötét Szilícium jelenségéről.

Jorg Henkel et al. 2015-ben bevezette a sötét Szilícium új trendjeit. A bemutatott cikk a sötét Szilícium termikus aspektusaira összpontosít. Kiterjedt kísérletek bizonyítják, hogy a chip teljes energiaköltsége nem az egyetlen oka a sötét Szilícium mögött, a teljesítménysűrűség és a kapcsolódó hőhatások szintén nagy szerepet játszanak ebben a jelenségben. Ezért javasolnak egy termikus biztonságos energiát (TSP) a hatékonyabb energiaköltségvetés érdekében. Egy új javasolt trend kimondja, hogy a csúcshőmérséklet-korlátozás figyelembevétele csökkenti a szilícium sötét területét. Ezenkívül azt is javasolják, hogy a dinamikus Feszültségfrekvencia-skálázás növeli a rendszer teljes teljesítményét és csökkenti a sötét szilíciumot .

Anil et al. 2018-ban bemutatta az adBoost néven ismert futásidejű erőforrás-gazdálkodási rendszert. Sötét Szilícium-tudatos futásidejű alkalmazás-térképezési stratégiát alkalmaz a hőtudatos teljesítménynövelés elérése érdekében a többmagos processzorokban. Előnyös a sötét Szilícium mintázása (PAT). A PAT egy leképezési stratégia, amely egyenletesen osztja el a hőmérsékletet a chipen, hogy növelje a hasznosítható energiaköltséget. Alacsonyabb hőmérsékletet, nagyobb energiaköltséget kínál, és fenntartja a hosszabb ideig tartó fellendülést. A kísérletek azt mutatják, hogy 37 százalékkal jobb teljesítményt nyújt, mint más korszerű teljesítménynövelők .

Lei Yang et al. 2017-ben javaslatot tett egy termikus modellre, hogy megoldja azt az alapvető problémát, hogy meghatározza a chipen lévő többprocesszoros rendszer képességét a kívánt feladat futtatására a megbízhatóság fenntartása és minden mag biztonságos hőmérsékleti tartományban tartása mellett. A javasolt termikus modellt a chip hőmérsékletének gyors előrejelzésére használják. A minimális chip csúcshőmérséklet előrejelzésével megtalálja az optimális feladat-mag hozzárendelést. Ha a minimális chip csúcshőmérséklet valahogy meghaladja a biztonságos hőmérsékleti határértéket, egy újonnan javasolt heurisztikus algoritmus néven ismert hőmérséklet korlátozott feladatválasztás (TCTS) reagál a rendszer teljesítményének optimalizálására a chip biztonságos hőmérsékleti határán belül. A TCTS algoritmus optimalitása formálisan bizonyított, és a kiterjedt teljesítményértékelések azt mutatják, hogy ez a modell csökkenti a chip csúcshőmérsékletét 10 CAC-kal a többi hagyományos technikához képest. A rendszer teljes teljesítménye 19,8% – kal javul a biztonságos hőmérséklet-korlátozás mellett. Végül valódi esettanulmányt készítenek ennek a szisztematikai technikának a megvalósíthatóságának bizonyítására .

6 következtetés

a többmagos processzorok folyamatos méretezését a teljesítmény, a hőmérséklet és a sávszélesség korlátai korlátozzák. Ezek a korlátok korlátozzák a hagyományos többmagos kialakítást, hogy csak néhány tíztől alacsony száz magig terjedjen. Ennek eredményeként a processzor chip nagy része feláldozza annak érdekében, hogy a chip többi része továbbra is működjön. Megvitattunk egy technikát a fel nem használt szerszámterület (sötét Szilícium) újrahasznosítására speciális multicores felépítésével. A specializált (SP) multicores nagyszámú munkaterhelés-specifikus magot valósít meg, és csak azokat a speciális magokat kapcsolja be, amelyek szorosan megfelelnek a végrehajtó munkaterhelés követelményeinek. Részletes elsőrendű modellt javasolunk az SP multicores tervezésének elemzésére az összes fizikai korlátozás figyelembevételével. A modell teljesítményének elemzésére kiterjedt munkaterhelési kísérleteket végeznek más általános célú multicórusokkal összehasonlítva. Az SP multicores 2x-től 12X-ig felülmúlja a többi mintát. Bár az SP multicores vonzó kialakítású, a modern munkaterheléseket jellemezni kell, hogy azonosítsák azokat a számítási szegmenseket, amelyek jelöltként szolgálnak a speciális magok betöltésére. Ezenkívül a szoftverinfrastruktúra és a futásidejű környezet is szükséges ahhoz, hogy megkönnyítse a kód migrációját a megfelelő részletességgel.

1965. Moore törvénye. https://en.wikipedia.org/wiki/Moore%27s_law

1974. Dennard Scaling. https://en.wikipedia.org/wiki/Dennard_scaling

Pradip Bose. 2011. Elektromos Fal. Springer USA, Boston, MA, 1593-1608. https://doi.org/10.1007/978-0-387-09766-4_499

Nikolaos Hardavellas. 2009. Chip Multiprocesszorok a szerver munkaterheléséhez. felügyelők-Babak Falsafi és Anastasia Ailamaki (2009).

Nikolaos Hardavellas, Michael Ferdman, Anastasia Ailamaki és Babak Falsafi. 2010. Teljesítménymérés: az 1K-magos chipek végső akadálya. (2010).

Nikos Hardavellas, Michael Ferdman, Babak Falsafi és Anastasia Ailamaki. 2011. Sötét Szilícium felé a szerverekben. IEEE Micro 31, 4 (2011), 6-15.

Nikos Hardavellas, Ippokratis Pandis, Ryan Johnson, Naju Mancheril, Anastassia Ailamaki és Babak Falsafi. 2007. Adatbázis szerverek Chip Multiprocesszorokon: korlátozások és lehetőségek.. In CIDR, Vol. 7. Citeseer, 79-87.

J Enterprg Henkel, Heba Khdr, Santiago Pagani és Muhammad Shafique. 2015. Új trendek a sötét szilíciumban. 2015-ben 52. ACM / EDAC / IEEE Design Automation konferencia (DAC). IEEE, 1-6.

Mark D Hill és Michael R Marty. 2008. Amdahl törvénye A többmagos korszakban. Számítógép 41, 7 (2008), 33-38.

Mengquan Li, Weichen Liu, Lei Yang, Peng Chen és Chao Chen. 2018. Chip hőmérséklet optimalizálás sötét Szilícium sokmagos rendszerekhez. IEEE tranzakciók az integrált áramkörök és rendszerek számítógéppel segített tervezéséről 37, 5 (2018), 941-953.

Amir M Rahmani, Muhammad Shafique, Axel Jantsch, Pasi Liljeberg és munkatársai. 2018. adBoost: Thermal Aware teljesítmény növelése révén sötét Szilícium mintázat. IEEE Trans. Comput. 67, 8 (2018), 1062–1077.

Vélemény, hozzászólás?

Az e-mail-címet nem tesszük közzé.

lg