Invia messaggio
Contattici
LEO

Numero di telefono : 13486085502

Una settimana enorme per il braccio – in Data Center anche

June 29, 2020

È stato una settimana enorme per il braccio e non solo perché Apple ha annunciato l'inizio del commutatore dalle unità di elaborazione di Intel x86 ai suoi propri ai chip basati a braccio in suoi computer del mackintosh. L'organizzazione senza scopo di lucro Top500 del posto di computer a alto rendimento inoltre ha annunciato questa settimana che per la prima volta nella storia, il supercomputer più veloce del mondo è alimentato dai chip del braccio.

Aggiunga i due più grandi sviluppi per il braccio nel centro dati ha annunciato questa settimana. Come probabilmente sapere ormai, la corsa per produrre il dispositivo di raffreddamento, server più efficienti ha preso un giro a partire dalla legge di Gordon Moore del co-fondatore di Intel e verso il sogno di Sophie Wilson. Ad ampère basato a Clara che computa, la partenza di Santa del chip del server del braccio costituita da presidente Renee James di ex-Intel che a marzo ha lanciato appena il suo CPU del braccio di Altra dei 80 centri, ha annunciato che il campionamento di un'unità di elaborazione massima di Altra dei 128 centri comincerà nel quarto trimestre. Messo a fuoco esattamente sui fornitori della nuvola del hyperscale, l'ampère ha progettato la parte per fare concorrenza al platino 8160 (lista suggerita $9.899) del Xeon di Intel e al Epyc 7742 ($6.950) di AMD sulla prestazione.

Inoltre questa settimana, Cambridge, ditta con sede in Gran-Bretagna conosciuta su fino all'anno scorso come Kaleao e ristrutturata il dicembre scorso come sistemi di bambù, ha detto che avrebbe liberato il suo primo server del braccio 1U, la serie di B1000N, nel terzo trimestre. Il server è progettato per gli ambienti a bassa potenza, quali i centri dati del bordo.

Improvvisamente il capo di prestazione

«L'emergenza» dell'architettura dell'unità di elaborazione del braccio nei centri dati dal nostro proprio conteggio ha luogo già facilmente per il suo quinto anno. Così tanto circa l'architettura e la costruzione dei centri dati moderni ha direttamente o derivato indirettamente dall'architettura dell'unità di elaborazione x86 ha creato originalmente per i pc. Ma l'evoluzione del braccio in questo spazio è stata lenta ma costante.

La prestazione di nuovo 128 centro dell'ampère Altra massimo sta tendendo al territorio del supercomputer. Là, platino del Xeon di Intel 8160 poteri nove sistemi nell'ultimo Top500.

«Ad un alto livello, stiamo consegnando così tanto la più prestazione che Intel è su una base per-CPU,» Jeff Wittich, il VP senior dell'ampère per i prodotti, ha detto. I numeri crudi non sono fuori ancora, ma Wittich sta reclamando il guadagno della prestazione 2.2x contro le simili unità di elaborazione x86 ed il chip di Intel dell'ampère della scelta per comparare la sua nuova parte a è stato i 8160.

Altra massimo sarà incavo-compatibile con 80 il centro Altra, che ha reclamato il più alto conteggio del centro del braccio. Wittich ha asserito che l'unità di elaborazione dei 128 centri manterrà la scalabilità lineare, significante che il prestazione-per-centro non diminuirà gradualmente come aumenti di conteggio del centro.

Computazione di ampèrebraccio chip.jpg di altra di ampère

Se il suo reclamo sostiene, che sarebbe uno sviluppo benvenuto dal maggio 2019. In uno studio ha pubblicato che mese [PDF], un'università di gruppo di Bristol ha comparato la prestazione di che cosa era poi il primo al supercomputer basato a braccio, un esploratore che di Cray XC50 il sistema ha definito Isambard e che alimentato dalle unità di elaborazione del braccio di Marvell ThunderX2, alle macchine di Cray alle simili specifiche, compreso una costruite sul platino di Xeon dei 28 centri 8176 unità di elaborazione.

Il gruppo di Bristol ha trovato che il chip di Marvell ha sofferto dalla rappresentazione in scala della discesa di efficienza, particolarmente dopo un conteggio di nodo di 16. A 64 nodi del server, riportare in scala l'efficienza per all'l'unità di elaborazione basata a braccio è caduto inferiore a 80 per cento, mentre i chip di Intel interamente sono restato superiore a 100 per cento.

Le prove dell'ampère al contrario sono basate sul centro e sui numeri di fili, non conteggi di nodo. Eppure, se che Wittich dicesse si rivelasse fondato, significherebbe che che arma gli ingegneri dell'unità di elaborazione hanno sormontato un impulso errato serio che potrebbe rendere i loro prodotti non competitivi nello spazio di HPC.

«Il nostro fuoco è stato nuvola, in modo da stiamo ottimizzando tutto per il nostro ambiente della nuvola,» Wittich ha detto il DCK. «Ma le molte cose che stiamo facendo là sarebbero ugualmente applicabili ad un supercomputer altamente evolutivo. Così vederemo l'interesse là di sicuro. C'è niente che lo precluda.»

L'ampère mira a portare Altra massimo in produzione in volume generale da ora alla metà del 2021.

Panda di azione furtiva

«Molte società là fuori già stanno mettendo le unità di elaborazione del braccio nei loro server. HPE, Supermicro, Lenovo hanno tutto quello ottenuto,» Tony Craythorne, CEO dei sistemi di bambù, ha rilevato. «Ma tutto che abbiano fatto letteralmente è inserito un chip del braccio l'architettura x86. Quello può dargli alcuni dei benefici del braccio — ridurrà il potere ed il raffreddamento — ma non vi darà c'è ne dei benefici di elaborazione, di ingresso/uscita e della capacità di capacità di lavorazione, dove il braccio presenta un vantaggio massiccio.»

Il suo punto era che il bambù stava presentando non appena un server con Intel o un'unità di elaborazione di AMD sostituita con il braccio, ma un'architettura completamente nuova sviluppato intorno a questo stile dell'unità di elaborazione. Mostrando alcuno dello sforzo con cui il suo nome è stato elaborato, chiama l'architettura progettata nodo parallelo del braccio, o il PANDA.

«Il nostro prodotto oggi può conservare un cliente fino a 50 per cento dei loro costi di acquisizione un minimo (e potrebbe andare ancora più alto), 75 per cento del loro consumo di energia e circa 80 per cento del loro spazio dello scaffale dovuto la densità che possiamo entrare in un fattore forma molto piccolo,» Craythorne ha detto il DCK.

Sebbene l'architettura di bambù stia progettanda per cui ha chiamato scalabilità «del mini-supercomputer», almeno a questa fase iniziale che riporta in scala gli inizio dalla parte bassa su. Ogni nodo di bambù del server può contenere una o due lama, con ogni lama che contiene quattro unità di elaborazione complete. Una scatola 1U contiene otto server Linux, ciascuno con la memoria dedicata e lo stoccaggio. Piani di bambù per produrre alla fine di quest'anno un prodotto 4U.

«Parte della ragione stiamo lanciandola come 1U [è] capiamo che questa tecnologia sia nuova,» Craythorne ha detto. «Tutti hanno un sistema legacy di Intel. Nessuno che va appena gettare quello fuori ed andare spendere $150-200,000 su un sistema 4U. Possono volere provarlo appena. Vogliono qualcosa che sia facile da comprare, facile vendere, a basso costo provare, in modo da possono poi vedere se sta andando lavorare per loro.»

«Da basso costo» Craythorne ha significato $9.995. Mentre un server a bassa potenza tipico 1U x86 può vendere per sotto $1.500, ciascuno «nodo» può contenere soltanto un singolo CPU del quadrato-centro. Il CEO di bambù ci ha detto che il suo gruppo ha usato il costo complessivo di AWS del calcolatore di proprietà per stimare il costo triennale di funzionamento dello scaffale di otto server di 2U Dell PowerEdge R740XD che ammontano a 16kW della capacità. La stima triennale di TCO di AWS era circa $560.000.

Sebbene il bambù abbia ancora sostenere un collaudo triennale reale, la società reclama uno scaffale similmente d'esecuzione dei server di B1008N incorrerebbe in circa $200.000 durante lo stesso periodo.

Ci sono pochi studi di TCO per i server del braccio con cui confrontare le proiezioni del bambù. 2014 un'analisi della prima cartuccia del server del 64 bit ARMv8 di Hewlett-Packard (ora HPE), il ProLiant M400, dall'analista Patrick Moorhead [PDF] può fissare almeno un certo precedente. Sebbene il M400 sia «una cartuccia» piuttosto che un 1U, una volta utilizzato in uno scenario di web server, Moorhead ha proiettato che TCO triennale del M400 sarebbe stato 35 per cento più basso di TCO di un server similmente d'esecuzione di 1U x86. La ricerca di Moorhead ha compreso l'input dai laboratori nazionali di Sandia.

Craythorne ha asserito che un B1008N potrebbe conservare i clienti fino a 50 per cento nei costi di acquisizione, almeno 75 per cento nel consumo di energia e 80 per cento dello spazio dello scaffale a causa di più alta densità del server. Sebbene dica la sua società aveva condotto la prova interna ed i grafici prodotti per indicare quelle prove hanno compreso i punti di riferimento pubblicamente conosciuti, il bambù ha ancora liberare i numeri duri, ma Craythorne ha detto che avrebbe agito in tal modo nell'immediato futuro.

Inoltre ha ammesso che quella parte di TCO di bambù potrebbe essere spesa sul ricompilare alcune applicazioni originalmente destinate affinchè x86 funzionasse sul braccio.

Ogni unità di elaborazione del braccio è un'implementazione di elaborazione dell'architettura che contiene la proprietà intellettuale conceduta una licenza a delle dalle tenute di braccio de proprietà di gruppo di Softbank e fabbricata solitamente da un produttore di terzi. Di conseguenza, quasi ogni unità di elaborazione del braccio può essere detta per avere sua propria architettura, almeno in quanto la parte non conceduta una licenza a è interessata. Il bambù chiama il suo proprio panda di versione. Naturalmente, essendo un PC nel suo passato distante, omette i porti spesso richiesti di espansione, lascianti due paia delle porte Ethernet di QSFP (una per ogni lama).

Sistemi di bambùserver di bambù inside.jpg del panda

«Questa è la parte fondamentale che molta gente lotta per capire circa il nostro prodotto,» ha ammesso Craythorne. In panda, il CPU è limitato al controllo e ad eseguire dell'applicazione, con accesso sia al DRAM che alla memoria non volatile (NVMe). Ma le mansioni di stoccaggio e della rete sono trattate esclusivamente da un coprocessore ed il commutatore di rete incorporato sostituisce un commutatore dello superiore de scaffale.

«Abbiamo un commutatore non bloccante L3 dentro ogna singolo lama con un bello pezzo della rete dentro la lama, «abbiamo notato Siobhan Ellis, il direttore del bambù di gestione del prodotto. Così fino ad un certo punto non dobbiamo inviare il traffico di rete fuori della lama.» Facoltativamente, entrambi i porti di QSFP su una lama possono essere collegati ad un commutatore, o un porto può essere collegato ad un commutatore ed all'altro alla porta affianco della lama. «Che riduce il numero dei commutatori esterni di che avete bisogno nello scaffale.»