Itthon Előre gondolkodás 15. szuperszámítás: nagyobb változások a láthatáron

15. szuperszámítás: nagyobb változások a láthatáron

2024

Videó: Carlos Drummond de Andrade (November 2024)

Amikor áttekintem a múlt hónapban a supercomputing 15 (SC15) ausztrini konferencia bejelentéseit és előadásait, úgy tűnik, hogy noha a nagy teljesítményű számítástechnika kissé elnyomott lehet, ez egy olyan piac, amely az év nagy változásaira hajlamos. jön.

Ha a top500 listán, a világ leggyorsabb számítógépeinek évente kétszer felsorolt vezetõin tekintünk, akkor a hatodik egymást követõ alkalommal a Tianhe-2 vezetõje a Kína Nemzeti Védelmi Technológiai Egyeteme által épített szuperszámítógép. Az top500 listája szerint ez a gép 33, 86 petaflop / s (másodpercenként kvadrilliók számú) tartós teljesítményt nyújt a Linpack referenciaértéken és 54, 9 petaflop / s az elméleti csúcsteljesítményt. Ez az Intel Xeon és a Xeon Phi processzorokon alapul.

A második hely továbbra is a Titan, egy Cray XK7 rendszer, amely AMD Opteron CPU-kra és Nvidia K20x GPU-kra épül, a DOE Oak Ridge Nemzeti Laboratóriumában telepítve, 17, 59 petaflop / s tartós teljesítmény mellett a Linpack referenciaértéken.

Két új gép feltörte a top 10-et. A Lawrence Livermore Nemzeti Laboratórium (LLNL) Trinity számítógépe hatodik 8, 1 petaflop / s-tal, míg a Hazel-Hen rendszer a németországi Höchstleistungsrechenzentrum Stuttgartban (HLRS) a nyolcadik lett 5, 6 petaflop / s-tal. Mindkettő Cray XC gép, Intel Xeon processzorokon alapszik, amelyek az Aries összeköttetésben vannak.

Nagyobb változások történnek a listánál tovább, különösen a kínai rendszerek számának jelentős növekedésével, amely 109-re nőtt, szemben az előző listában mindössze 37-rel. Ez részben úgy tűnik, hogy több kínai rendszerből származik, amelyek futtatják a referenciaértékeket és benyújtják az eredményeket a listára. Ennek eredményeként az amerikai rendszerek száma 231-ről 200-ra esett vissza, ami a legalacsonyabb szám a jegyzék 1993-as elindítása óta; és az európai rendszerek száma 141-ről 108-ra csökkent.

Az egyik nagy trend a gyorsítókat vagy a közös feldolgozókat használó rendszerek számának növekedése, amely a jelenlegi listán szereplő 104 rendszerre emelkedett, a júliusi 90-ről. Ezeknek a rendszereknek a többsége Nvidia Tesla GPU-kat használ, majd az Intel Xeon Phi társprocesszorát követi, néhányuk kombinációval. Az Nvidia rámutatott, hogy ezek közül a rendszerek közül 70-ben, köztük a listán szereplő 24 új rendszerből 23-ban.

A kiállításon az Nvidia kiemelte a gyorsítók növekedését, különös tekintettel a jelenleg elérhető alkalmazások számára, amelyek optimalizáltak voltak a cég CUDA architektúrájához. A társaság szerint az első tíz nagy teljesítményű számítástechnikai alkalmazás 90% -a, és az 50 legjobb 70% -a most gyorsul. Az egyik érdekes alkalmazás az időjárási szimulációk futtatására szolgáló rendszerek, amelyek a nagyteljesítményű számítások fő alkalmazásai, mivel az időjárási előrejelzéseket mindenféle kormány készíti. Cray korábban rámutatott az ilyen gyorsítók használatára a svájci meteorológiai irodában (MeteoSwiss), és beszélt arról, hogy miként működik a svájci kutatókkal sok alkalmazás átírásakor. Az Nvidia rámutat arra, hogy a Nemzeti Óceáni és Légköri Hatóság (NOAA) gyorsítókat használ bizonyos időjárási előrejelzéseihez is.

Más alkalmazások között a Cray által ajánlott olaj- és gázipari alkalmazások, például a 3D geofizika használata a tározó szimulálására, valamint a pénzügyi szolgáltatások, például a kockázatértékelés. Az ilyen alkalmazások ritkán alkotják a világ leggyorsabb rendszereit, de azt jelzik, hogy a nagy teljesítményű számítástechnika szélesebb szerepet játszik a több vállalati alkalmazásban. Cray beszélt a nagyobb és részletesebb modellek folyamatos haladásáról az összes tudományos és mérnöki tudományterületen, valamint a hagyományos munkaterhelés és az elemzés egyesítéséről.

Szintén érdekelt a Linux Alapítvány bejelentése egy új, OpenHPC nevű erőfeszítésről, amelynek célja a HPC világában nyitottabb szabványok létrehozása. Érdekes ötlet, és úgy tűnik, hogy sok nagy játékos bejelentkezik.

A munkákban számos új rendszer létezik. Az IBM egy új, Summit nevű gépet épít az Oak Ridge National Laboratories-ban (ORNL) és egy másik, Sierra nevû gépet a Lawrence Livermore National Laboratory-ben (LLNL), mindkettõ az IBM Power architektúra CPU-k, Nvidia Tesla GPU-k és a Mellanox összekapcsolásain alapul. A csúcstalálkozó várhatóan 150–300 petaflop / s csúcsot, Sierra pedig 100 petaflop / s csúcsot eredményez.

Ezen felül az Intel és a Cray egy új gépet épít az Aurora néven, amely a Knights Hill Intel Xeon Phi processzorok alapján épül fel az Argonne Leadership Computing Facility-hez (az Argonne National Labs része), amelynek célja 2018-ban 150 petaflopi működése. Mindezek az Oak Ridge, Argonne és a Lawrence Livermore nemzeti laboratóriumok (CORAL) nevű Energiaügyi Minisztérium részét képezik, amelynek célja a nagy teljesítményű számítástechnika fejlesztésének felgyorsítása, különös tekintettel a FastForward 2 projektre.

Ennek ellenére még hosszú utat kell megtennünk az "exascale computing" felé.

Időközben számos processzor bejelentés volt, amelyek jó jövőbeni merülhetnek fel. Az Nvidia elsősorban a szuperszámítógépek használatát sürgette hiper skálázatos webes alkalmazásokhoz, különösen a gépi tanuláshoz. Bejelentett néhány, kissé alacsonyabb kategóriájú terméket: a Tesla M40 táblát 3072 CUDA maggal, amely szerint legfeljebb 7 egypontos pontosságú teraflop / s sebességgel képes végrehajtani, elsősorban a "mélyreható" képzésre, és az M4, alacsonyabb szintű tápegység 1024 maggal és 2, 2 egypontos pontosságú teraflop / s-mal, amelyek felhasználhatók a mély tanulás következtetéseire, valamint a kép- és videófeldolgozáshoz. Ezenkívül a társaság bejelentette egy új "hiperskálú csomag" alkalmazását, amely a legnagyobb számítástechnikai helyszíneket célozza meg. Mindkét új hardver termék a 28 nm-es technológiai technológián és a vállalat Maxwell architektúráján alapul.

A társaság bejelentette két, a Pascal néven ismert további építkezését, amelyek jövőre várhatóak, és a Volta, amelyek ezt követik. Az Intel arra összpontosított, hogy a HPC miként befolyásolja a tudományt, és engem érdekel az a leírás, hogy hogyan használja a saját szuperszámítógépét - amely jelenleg az 500 legjobban felsorolt 99 helyen van - a saját processzorok megtervezéséhez. Különösen a vállalat azt mondta, hogy millió processzorórát vesz igénybe, hogy csak a következő generációs processzorok számára készítse el a fotómaszkokat.

Az Intel tevékenységeinek nagy része a Knights Landing-re, a Xeon Phi chip következő verziójára összpontosult, amelyet gyorsítóként lehet használni, de indulhat is; és annak Omni-Path szövetét. Noha az Intel szerint az általános elérhetőség 2016 első felében lesz, néhány ügyfél korai hozzáféréssel rendelkezik a Knights Landinghez. Jelenleg a Cray egy nagy Knights Landing rendszert tesztel, előkészítve egy új Cori nevű szuperszámítógép szállítását a Nemzeti Energiakutatási Tudományos Számítástechnikai Központ (NERSC), valamint a Los Alamos Nemzeti Laboratórium és a Sandia Nemzeti Laboratóriumok számára a következő évben. A Bull, az Atos francia rendszerintegrátor egység, szintén megkapta a Knights Landing korai verzióit, hogy felkészüljenek a Tera 1000 rendszerre, amelyet épít a Francia Alternatív Energia és Atomenergia Bizottság számára. Az Argonne vezetői számítástechnikai eszköz Theta nevű rendszeren dolgozik, amelyet a következő évben szállítanak be, és a Sandia National Laboratories a Penguin Computing-szal együttműködik számos olyan rendszer frissítésén, amely a Xeon Phi társprocesszorok korábbi generációit használja.

Az Intel korábban elmondta, hogy a Knights Landing három különféle verziója lesz: egy alapvonalon futó processzor (önindulásra képes), egy integrált Omni-Path szövettel rendelkező gazdaprocesszor és egy PCIe gyorsító kártya. Maga a chip 36 csempeből áll, mindegyikben két CPU-mag (összesen 72 mag), négy vektor-feldolgozó egységből (magonként kettő), 1 MB megosztott L2 gyorsítótárból és egy gyorsítótárból, a koherencia fenntartása érdekében; és az Intel azt mondta, hogy a Knights Corner CPU skaláris teljesítményének körülbelül háromszorosának kell lennie, 3 teraflop / s dupla pontossággal és 6 teraflop / s egyetlen pontosságú csúcsteljesítménnyel. Ezenkívül egy új MCDRAM nevű memóriarendszert is használ, a csomagban lévő memóriát, amely meghaladja a rendelkezésre álló sávszélességet háromszor, a DDR4-hez viszonyítva, amely úgy tűnik, hogy a Hibrid Memóriakocka architektúra egyik változata, amelyről az Intel és a Micron beszélt. A kiállításon Cray prototípusrendszerét tartalmazta, amely egy indítható Knights Landing-et tartalmazott, és számos más gyártó bemutatta a Knights Landing számára tervezett rendszereket. A Xeon Phi ezt a verziót egy későbbi 10nm-es folyamatra épülő Knights Hill nevű verzió követi.

Ezen felül a Fujitsu egy kicsit többet beszélt a Flagship 2020 projektjéről, amely egy új maggal, az FX100 néven alapul, 32 maggal. Ez várhatóan nagyjából megnégyszerezi a lebegőpontos teljesítményt a jelenlegi FX10-hez képest, és mint a Knights Landing, a Fujitsu FX100 a Hibrid Memóriakocka architektúrájának változatát is használja. Ezen túlmenően a NEC Aurora kódszámú projekttel rendelkezik (amely nem kapcsolódik a CORAL projekthez), az SX-ACE chip követésének alapján, de nagyobb memória sávszélességgel. Ez 2017-re irányul.