Itthon Előre gondolkodás Az Oracle, az nvidia, a kar reflektorfénybe helyezi a forró zsetonokat

Az Oracle, az nvidia, a kar reflektorfénybe helyezi a forró zsetonokat

Videó: Next Platform TV Exclusive: In-Depth with Jensen Huang, CEO, NVIDIA (November 2024)

Videó: Next Platform TV Exclusive: In-Depth with Jensen Huang, CEO, NVIDIA (November 2024)
Anonim

Noha a múlt héten a chip-izgalom az Intel Broadwell bejelentéséből származott, számos egyéb chipet is részletesen tárgyaltak az éves Hot Chips konferencián, amely inkább a szerverre és az adatközpontra tervezett chipekre összpontosított.

A show a csúcskategóriás chipekről ismert, az Intel, az Oracle és az IBM megvitatják legújabb bejegyzéseiket, de csak az Oracle Sparc M7 volt valóban új. Ehelyett a show nagy része az ARM-alapú termékekre összpontosított, beleértve az Nvidia közelgő 64 bites "Denver" verziójának, a Tegra K1 processzornak az első részleteit.

Az Oracle, az Intel és az IBM magas szintű célt szolgál kiszolgáló chipekkel

A csúcskategóriás chipek közül a leglátványosabb hír az Oracle volt, amely a SPARC processzorának következő generációját, az M7-et ismertette. Ennek a chipeknek 32 S4 SPARC magja van (mindegyik akár nyolc dinamikus szállal), 64 MB L3 gyorsítótár, nyolc DDR4 memóriavezérlő (processzoronként legfeljebb 2 TB, és 160 GBps memória sávszélességet a DDR4-2133 segítségével) és nyolc adatanalitikai gyorsítót csatlakoztathat. on-chip hálózat.

A chip nyolc klaszterbe van osztva, négy maggal, mindegyik megosztott L2 gyorsítótárral és egy particionált 8 MB L3 gyorsítótárral, több mint 192 GBps sávszélességgel a magfürt és a helyi L3 gyorsítótár között. Az M6-hoz képest (28 nm-es chip 12, 6 GHz-es SPARC S3 maggal) az M7 3-3, 5-szer jobb teljesítményt nyújt a memória sávszélességén, egész számán keresztül, OLTP, Java, ERP rendszereken és lebegőpontos átvitelnél. Stephen Phillips, az Oracle SPARC Architecture vezető igazgatója azt mondta, hogy a cél a teljesítmény fokozatos növelése, nem pedig a növekményes növekedés.

Az M7 mérete 8 ragasztó nélküli socketre méretezhető (akár 256 mag, 2000 szál és 16 TB memória), és egy ASIC kapcsolóval kezelheti a közti forgalmat SMP konfigurációban, akár 32 processzorig, így végeredményben 1024 maggal, 8192 szállal és 64TB memóriával rendelkező rendszerrel. Nagyon lenyűgöző. Az Oracle szerint a teszt különféle tesztjein 3–3, 5-szer jobb teljesítményt nyújt, mint a tavalyi SPARC M6-ban. A cég szerint ez az Oracle saját szoftverkötegéhez lesz optimalizálva, amelyet 20 nm-es folyamatban gyártanak, és a rendszerekben valamikor a következő évben elérhetők lesznek.

Az IBM további részleteket adott a Power8 sorozatáról, amelyet a tavalyi kiállításon jelentett be. A chipnek ez a verziója 12 magot tartalmazott, mindegyikben legfeljebb nyolc szál volt, magonként 512 KB SRAM 2. szintű gyorsítótárat (6 MB összes L2) és 96 MB megosztott beágyazott DRAM-ot, mint 3. szintű gyorsítótár. Ezt a hatalmas forgácsot, amelynek mérete 650 négyzetmilliméter 4, 2 milliárd tranzisztorral, az IBM 22 nm-es SOI folyamatán gyártják, és júniusban kezdte meg a szállítást.

Néhány hónappal ezelőtt az IBM bejelentette egy hat maggal rendelkező, 362 mm 2 méretű verziót. Az idei beszéd arról szól, hogy az IBM hogyan kombinálhatja a hatmagos verziók egy csomagját a 48 sávos PCIe Gen 3-mal. Az IBM szerint egy 24-magos és 192 szálakkal ellátott kétcsatlakozó verzió felülmúlja a két processzort Xeon Ivy Bridge szerver 24 maggal (48 szállal). Az IBM elsősorban nagy teljesítményű és speciális piacokon értékesíti az Erőt, így a legtöbb ember nem hasonlítja össze a kettőt, de érdekes. A Power architektúra általánosabbá tétele érdekében az IBM tavaly bejelentette az Open Power Consortium programot, és ebben az évben a vállalat azt állította, hogy teljes nyílt forráskódú szoftverekkel rendelkezik a platformon. De eddig egyetlen, az IBM kivételével nem jelentett be egy platformon alapuló szervert.

Az Intel az "Ivytown-ról", az Ivy Bridge szerververziójáról beszélt, amely magában foglalja az egy évvel ezelőtt bevezetett Xeon E5 és a februárban bemutatott Xeon E7 verzióit. Az idei beszéd arra összpontosított, hogy az Intelnek alapvetően egy architektúrája van, amely mindkét piacot lefedi, akár 15 magot lehetővé tevő chipekkel, két DDR3 memóriavezérlővel, három QPI linkkel és 40 PCI Gen 3 sávmal, amely moduláris padlón van elrendezve. terv, amely három különféle szerszámgá változtatható, mindegyiket különféle aljzatokhoz tervezték, összesen több mint 75 változattal. Ez két-, négy- és nyolccsatlakozó szerverekben használható speciális összeköttetések nélkül.

Ezek a chipek természetesen manapság teszik ki a szervervásárlások nagy részét, mivel az Intel adja a szerver egységek túlnyomó részét. De sok információt korábban az ISSCC fedött fel, és az Intel várhatóan nagyon rövid időn belül bemutatja az E5 család következő verzióját (E5-1600v3 és E5-2600 v3), amely az Haswell-építészet, Haswell-EP néven ismert. (A múlt héten a Dell új munkaállomásokat jelentett be ezen új chipek alapján.)

Az Intel megvitatta az Avoton néven ismert Atom C2000-et is, amelyet 2013 végén gyártottak. Ez a chip, valamint az Ivy Bridge és a Haswell chipek mind az Intel 22 nm-es folyamatán alapulnak.

Nvidia, AMD, alkalmazott mikrocél az új piacokon az ARM számára

A show legnagyobb meglepetése valószínűleg az ARM-alapú technológiára való összpontosítás volt, ideértve az ARM hangszóróinak kulcsszavait és az Nvidia részéről a Tegra K1 processzorának küszöbön álló „Denver” verzióját.

Az ARM CTO előadója Mike Muller az érzékelőktől a kiszolgálókig terjedő energiaszükségletekről beszélt, és arra összpontosított, hogy az ARM hogyan próbálta kibővíteni a vállalkozást. Muller emellett hangsúlyozta az ARM érzékelő chipeknek a tárgyak internetében történő használatát, ezt a témát a Qualcomm Rob Chandhok bemutatójában is visszhangzott. De egyik cég sem jelentett be új magokat vagy processzorokat.

Ehelyett a nagy hír az fronton az Nvidia volt, amely sokkal több információt adott a K1 processzor új verziójáról. Amikor a cég Denver-projektjét először bejelentették, úgy hangzott, hogy ez a chip a nagyteljesítményű számítástechnikai piacra irányul, de most úgy tűnik, hogy a társaság inkább olyan dolgokra összpontosított, mint a táblagépek és az autópiac. A Tegra K1 két verzióban kapható. Az első, amelyet az év elején jelentettek be, és amely most a vállalat Shield táblagépén szállítódik, négy 32 bites ARM Cortex-A15 maggal rendelkezik, valamint egy kis teljesítményű "társmagon" a 4 + 1 konfigurációban, amelyet az Nvidia bevezet. Tegra vonalát évekig.

A Denver verziója teljesen különbözik az Nvidia által kifejlesztett két új, 64 bites, saját tulajdonú maggal, és a vállalat valóban megcélozza a kapott teljesítménynövekedést. A mag hétirányú szuperskalár (azaz akár hét mikro-op-ot is képes végrehajtani egyidejűleg), és 128KB négyutas L1 utasítás-gyorsítótárral és 64KB-os négyirányú L1-gyorsítótárral rendelkezik. A chip két ilyen magot kombinál, valamint egy 2 MB-os 2. szintű gyorsítótárat, amely mindkét magot kiszolgálja, mivel a 192 „CUDA magot” (grafikus magokat) megosztja a 32 bites K1-vel. Mint ilyen, ez nagy eltérést jelent a 4 + 1 architektúrától.

Egy nagy változás magában foglalja azt, amit az Nvidia "dinamikus kódoptimalizálásnak" nevez, amelynek célja a gyakran használt ARM-kód átvitele és kifejezetten a processzor számára optimalizált mikrokódvá konvertálása. Ezt 128 MB gyorsítótárban tárolja (a hagyományos rendszer fő memóriájából kivágva). A cél az, hogy megrendelésen kívüli végrehajtást nyújtson anélkül, hogy annyi energiát igényelne, amennyit ez a technika általában használ. A koncepció nem új - a Transmeta évekkel ezelőtt kipróbálta a Crusoe chipjével -, de az Nvidia szerint ez most már jobban működik.

Az Nvidia számos referenciát mutatott be, amelyekben azt állította, hogy az új chip jelentősen jobb teljesítményt képes elérni, mint a meglévő négy- vagy nyolcmagos mobil CPU-k - kifejezetten hivatkozva a Qualcomm Snapdragon 800-ra (MSM8974), az Apple A7-re (néha Cyclone-ra), amelyet az iPhoneban használnak. 5s - és még néhány main PC processzor is. Az Nvidia azt mondta, hogy felülmúlja az Atom (Bay Trail) processzort, és hasonló az Intel 1, 4 GHz-es kétmagos Celeron (Haswell) processzorához. Természetesen inkább az eladó teljesítményszámait veszem figyelembe egy sóval: nemcsak az eladók választják meg a referenciaértékeket, egyáltalán nem egyértelmű, hogy ugyanazon órasebességekről vagy ugyanazon energiafogyasztásáról beszélünk.

Eközben a szervereket célzó chipekben az AMD többet beszélt az Opteron A1100-ról, amelyet "Seattle-nek" hívtak, azzal a vállalattal, hogy kijelenti, hogy jelenleg mintavételt végez, és a szervereken ez az év végén elérhető. Ez a chip nyolc 64 bites Cortex A57 CPU magot tartalmaz; 4 MB L2 gyorsítótár és 8 MB L3 gyorsítótár; két memóriacsatorna akár 128 GB-os DDR3 vagy DDR4 memória elhárításához; sok integrált I / O (8 sáv mindegyik PCIe Gen3 és 6 Gbps SATA, valamint két 10 Gbps Ethernet port); Cortex A5 "rendszervezérlő processzor" a biztonságos indításhoz; és egy gyorsítót a titkosítás és a dekódolás felgyorsítására. A GlobalFoundries 28 nm-es eljárásán gyártják. Az AMD még nem adott meg részleteket a chip frekvenciájáról, teljesítményéről vagy teljesítményéről, de megmutatta a chip alapdiagramját. (felett)

Az Applied Micro már régóta azt állítja, hogy az első ARM szerver chipje a piacon van, amelynek X-Gene 1 (Storm néven ismert) 8 2, 4 GHz-es ARMv8 magot tartalmaz, négy DDR3 memóriavezérlőt, PCIe Gen3 és 6 Gbps SATA-t, valamint 10 Gbps Ethernet-et.. Jelenleg ez a termelés a TSMC 40 nm-es folyamatán zajlik, mondja a cég.

A forró chipeken az Applied Micro elindította X-Gene 2 (Shadowcat) kialakítását, amely nyolc vagy 16 "továbbfejlesztett" maggal lesz elérhető, 2, 4–2, 8 GHz sebességgel, és hozzáad egy RoCE (RDMA-t a konvergált Ethernet-hez) gazdagépet. Csatorna-adapter, mint összekapcsolás, amelyet arra terveztek, hogy lehetővé tegye az alacsony késleltetésű kapcsolatokat a mikrokiszolgálók csoportjai között. Ezt a fürtökben való felhasználást úgy tervezték, hogy egyetlen kiszolgálóállvány akár 6480 szálat és 50 TB memóriát is támogathat, mindegyik egyetlen tárolókészlettel rendelkezik. A cég szerint az X-Gene 2 körülbelül 60 százalékkal jobb egészteljesítményt, kétszer jobb teljesítményt nyújt a Memcache-en, és körülbelül 25 százalékkal jobb Apache webszolgáltatást kínál. 28 nm-es eljárással gyártják, és jelenleg mintát vesz.

Az Applied Micro szerint az X-Gene 2 kitölti a rést a versengő mikroszerverek (Cavium ThunderX, Intel Atom C2000 "Avoton" és AMD Opteron A1100 "Seattle") és a teljes méretű Xeon szerverek között. Néhány részletet adott a következő generációról, az X-Gene 3-ról (Skylark), amelynek terve a jövőbeni mintavétel megkezdése. Ennek a chipnek 16 ARMv8 magja lesz, legfeljebb 3 GHz frekvencián, és 16 nm FinFet technológiával készülnek.

Az Oracle, az nvidia, a kar reflektorfénybe helyezi a forró zsetonokat