O que é nvidia ampere?

Evan Mueller

Quando se trata de GPUs, a NVIDIA é um especialista líder. Estando no negócio desde 1993, a Nvidia produziu uma ampla gama de GPUs profissionais e de consumo de alta qualidade. As estimadas arquiteturas de seus processadores estão por trás do sucesso de seus produtos, especialmente de sua linha principal, o GeForce. As GPUs da NVIDIA foram além do espaço para jogos, expandindo sua presença em aprendizado profundo, IA (inteligência artificial) e análise acelerada. Nvidia se infiltrou no mercado de data center há uma década, começando com os chips Fermi. As iterações subsequentes foram feitas e a empresa divulgou continuamente as GPUs que atendem a demanda insaciável por velocidade de processamento mais rápida nos data centers. As GPUs da NVIDIA evoluíram ao longo dos anos, e os projetos de arquitetura impulsionam principalmente a evolução.

Arquitetura de Ampere da NVIDIA

A competição é seriamente apertada entre os fabricantes de GPU, mas a NVIDIA não segura nada para conquistar o primeiro lugar. De fato, a Nvidia dominou o mercado de IA na última década. Em 2020, as notícias da primeira GPU de 7nm (8nm para peças de consumo) da NVIDIA com 54 bilhões de transistores compactados em um dado tão pequeno feito um buzz. Codinome Ampere Após o matemático francês André-Marie Ampère, A arquitetura de processador da NVIDIA aumenta uma melhoria maciça em relação aos seus antecessores, Turing e Volta, prometendo mais funcionalidades, melhor eficiência e maior desempenho em níveis mais baixos de potência. Ampere está por trás da segunda geração de GPUs RTX da NVIDIA, a série RTX 30, e é considerada duas vezes mais rápida que seus colegas da série RTX 20. A arquitetura ampere também é a força por trás da NVIDIA A100 Data Center GPUs.

Especificações de Ampere

Ampere é a primeira GPU de 7nm/8nm da NVIDIA, a segunda geração de rastreamento de raios do consumidor, e tem a terceira geração de núcleos tensores. A Ampere é a arquitetura subjacente das GPUs GA100, GA102 e GA104, incorporada no GeForce RTX 3090, RTX 3080, RTX 3070 e, mais recentemente, o RTX 3060. A NVIDIA também está programada para liberar o RTX 3050 nos meses seguintes. Enquanto isso, a GPU Enterprise GA100 fornece 20x mais poder de computação do que as gerações anteriores de GPUs de data center. Aqui está uma visão geral das GPUs profissionais e de consumo baseadas em amperes da NVIDIA [1]:

GPU	GA100	GA102	GA102	GA104
Placa de vídeo	Nvidia A100	GeForce RTX 3090	GeForce RTX 3080	GeForce RTX 3070
Processo (NM)	TSMC N7	Samsung 8n	Samsung 8n	Samsung 8n
Transistores (bilhões)	54	28.3	28.3	17.4
Tamanho da matriz (mm^2)	826	628.4	628.4	392.5
Configuração do GPC	8 × 16	7 × 12	6 × 12	6 × 8
SMS	108	82	68	46
Núcleos CUDA	6912	10496	8704	5888
Núcleos RT	Nenhum	82	68	46
Núcleos tensores	432	328	272	184
Relógio de Boost (MHz)	1410	1700	1710	1730
Velocidade VRAM (GBPS)	2.43	19.5 (gddr6x)	19 (gddr6x)	14 (GDDR6)
VRAM (GB)	40 (48 max)	24	10	8
Largura do ônibus	5120 (6144 Max)	384	320	256
ROPS	128	112	96	96
Tmus	864	656	544	368
GFLOPS FP32	19492	35686	29768	20372
Rt tflops	N / D	69	58	40
Tensor Tflops FP16 (Sparsity)	312 (628)	143 (285)	119 (238)	81 (163)
Largura de banda (GB/s)	1555	936	760	448
TBP (Watts)	400 (250 pcie)	350	320	220

Nvidia A100

A NVIDIA A100 é a primeira GPU que usou a arquitetura de ampere. O chip corporativo é direcionado a data centers e projetado para tarefas intensivas em GPU, como aprendizado profundo e IA. Construído usando o processo de 7nm da TSMC, ele abriga uma quantidade enorme de 54 bilhões de transistores. Ele superou as gerações anteriores de GPUs corporativas com um aumento de 20x no desempenho com 6.912 núcleos de CUDA, 432 unidades de mapeamento de textura, 160 ROPs, núcleos de tensor de terceira geração e um VRAM de 40 GB com largura de banda de memória que se destaca em 1.6tb/s. DGX A100 é o primeiro sistema de IA do mundo com um aglomerado de oito A100 e um preço alto de US $ 199.000.

GEFORCE RTX 30 Series

Além de dominar o mercado corporativo, a Nvidia sempre tem os consumidores, especialmente jogadores e criadores, em mente. A arquitetura de ampere também é adotada nas placas gráficas de consumo da NVIDIA. A segunda geração do GeForce RTX carrega as GPUs baseadas em amperes, aumentando o desempenho para o dobro do que a geração anterior.

Na maioria dos aspectos, a Ampere tem mais do que o dobro do poder de processamento de Turing. Ele dobrou o desempenho do shader de Turing com o dobro do número de núcleos fp32 cuda. Especificamente, possui 30 shader-tflops, 2.7x mais do que o de Turing, que é apenas 11 shader-tlops. Da mesma forma, o núcleo do tensor de Turing mede 89 Tensor-Tflops, mas a Ampere mais que dobrou essa taxa com seus 238 tensores-tlops. Para não esquecer suas taxas principais de rastreamento, que é 58 rt-tflops, 1.7x mais rápido que os 34 rt-tlops de Turing e, para fazer com que as GPUs funcionem ainda mais rápido, o chip ampere se conecta à memória mais rápida do mundo, o Micron G6x.

A série RTX 30 é feita usando o processo personalizado da Samsung 8n Nvidia com 28 bilhões de transistores para GA102 e 17 bilhões de transistores para GA104. O Titan Class RTX 3090 é alimentado pela GPU GA102 e oferece desempenho de cartão de consumo extremamente poderoso. Ao contrário das gerações anteriores, o RTX 3090 está aberto a terceiros para design personalizado.

O RTX 3080 também está usando uma GPU GA102, oferecendo o dobro do desempenho do RTX 2080 e uma impressionante proezas para jogos em 4K. RTX 3070, alimentado por GA104 GPU, está em pé de igualdade com o RTX 2080 TI pela metade do preço. O RTX 3060 lançado recentemente também nunca deixa de impressionar com seu desempenho impressionante impulsionado por núcleos aprimorados de rastreamento de raios, núcleos tensores, novos multiprocessadores de streaming e memória G6 de alta velocidade.

Apesar do aumento maciço do desempenho, as novas GPUs RTX não são pesadas no bolso. As placas gráficas muito mais rápidas são facilmente acessíveis quando se trata de preços. O carro -chefe da NVIDIA GeForce, RTX 3080, começa em US $ 699, o RTX 3070 é vendido a US $ 499 e o RTX 3060 tem um preço de US $ 329. O RTX 3090 de ponta custa US $ 1.499; Ainda consideravelmente baixo custo, considerando seu desempenho no nível do titão.

Apenas alguns meses após o seu lançamento, supostamente houve uma escassez de placas gráficas baseadas em amperes, e não é surpresa com a performance impressionante de Ampere a um preço razoável. Para aqueles que consideram uma atualização da GPU, agora é a melhor hora para colocar suas mãos nas GPUs baseadas em amperes da NVIDIA.

Fontes

[1] Walton, Jarred. “NVIDIA RTX 30-Série Ampere Architecture Deep Dive: tudo o que sabemos”. https: // www.Tomshardware.COM/RECURSOS/NVIDIA-AMAMPER-ARCHITETTION-DEPE DIVE. 13 de outubro de 2020.

Pitão

Etiquetas do eixo marítimo

Os “eixos.função set () ”, funções da biblioteca matplotlib ou as funções“ set_xlabel () ”e“ set_yla...

Salvatore Watsica

Pitão

Pandas Read_CSV multiprocessamento

Para melhorar a velocidade de carregamento de dados, incluindo seus benefícios e limitações, o “PD.A...

Carl Hintz DDS

Docker

Qual é a diferença entre Docker e Podman?

Docker usa uma arquitetura cliente-servidor, enquanto o Podman é um motor de contêiner com daemon me...

Carl Hintz DDS