Quando se trata de GPUs, a NVIDIA é um especialista líder. Estando no negócio desde 1993, a Nvidia produziu uma ampla gama de GPUs profissionais e de consumo de alta qualidade. As estimadas arquiteturas de seus processadores estão por trás do sucesso de seus produtos, especialmente de sua linha principal, o GeForce. As GPUs da NVIDIA foram além do espaço para jogos, expandindo sua presença em aprendizado profundo, IA (inteligência artificial) e análise acelerada. Nvidia se infiltrou no mercado de data center há uma década, começando com os chips Fermi. As iterações subsequentes foram feitas e a empresa divulgou continuamente as GPUs que atendem a demanda insaciável por velocidade de processamento mais rápida nos data centers. As GPUs da NVIDIA evoluíram ao longo dos anos, e os projetos de arquitetura impulsionam principalmente a evolução.
Arquitetura de Ampere da NVIDIA
A competição é seriamente apertada entre os fabricantes de GPU, mas a NVIDIA não segura nada para conquistar o primeiro lugar. De fato, a Nvidia dominou o mercado de IA na última década. Em 2020, as notícias da primeira GPU de 7nm (8nm para peças de consumo) da NVIDIA com 54 bilhões de transistores compactados em um dado tão pequeno feito um buzz. Codinome Ampere Após o matemático francês André-Marie Ampère, A arquitetura de processador da NVIDIA aumenta uma melhoria maciça em relação aos seus antecessores, Turing e Volta, prometendo mais funcionalidades, melhor eficiência e maior desempenho em níveis mais baixos de potência. Ampere está por trás da segunda geração de GPUs RTX da NVIDIA, a série RTX 30, e é considerada duas vezes mais rápida que seus colegas da série RTX 20. A arquitetura ampere também é a força por trás da NVIDIA A100 Data Center GPUs.
Especificações de Ampere
Ampere é a primeira GPU de 7nm/8nm da NVIDIA, a segunda geração de rastreamento de raios do consumidor, e tem a terceira geração de núcleos tensores. A Ampere é a arquitetura subjacente das GPUs GA100, GA102 e GA104, incorporada no GeForce RTX 3090, RTX 3080, RTX 3070 e, mais recentemente, o RTX 3060. A NVIDIA também está programada para liberar o RTX 3050 nos meses seguintes. Enquanto isso, a GPU Enterprise GA100 fornece 20x mais poder de computação do que as gerações anteriores de GPUs de data center. Aqui está uma visão geral das GPUs profissionais e de consumo baseadas em amperes da NVIDIA [1]:
GPU | GA100 | GA102 | GA102 | GA104 |
---|---|---|---|---|
Placa de vídeo | Nvidia A100 | GeForce RTX 3090 | GeForce RTX 3080 | GeForce RTX 3070 |
Processo (NM) | TSMC N7 | Samsung 8n | Samsung 8n | Samsung 8n |
Transistores (bilhões) | 54 | 28.3 | 28.3 | 17.4 |
Tamanho da matriz (mm^2) | 826 | 628.4 | 628.4 | 392.5 |
Configuração do GPC | 8 × 16 | 7 × 12 | 6 × 12 | 6 × 8 |
SMS | 108 | 82 | 68 | 46 |
Núcleos CUDA | 6912 | 10496 | 8704 | 5888 |
Núcleos RT | Nenhum | 82 | 68 | 46 |
Núcleos tensores | 432 | 328 | 272 | 184 |
Relógio de Boost (MHz) | 1410 | 1700 | 1710 | 1730 |
Velocidade VRAM (GBPS) | 2.43 | 19.5 (gddr6x) | 19 (gddr6x) | 14 (GDDR6) |
VRAM (GB) | 40 (48 max) | 24 | 10 | 8 |
Largura do ônibus | 5120 (6144 Max) | 384 | 320 | 256 |
ROPS | 128 | 112 | 96 | 96 |
Tmus | 864 | 656 | 544 | 368 |
GFLOPS FP32 | 19492 | 35686 | 29768 | 20372 |
Rt tflops | N / D | 69 | 58 | 40 |
Tensor Tflops FP16 (Sparsity) | 312 (628) | 143 (285) | 119 (238) | 81 (163) |
Largura de banda (GB/s) | 1555 | 936 | 760 | 448 |
TBP (Watts) | 400 (250 pcie) | 350 | 320 | 220 |
Nvidia A100
A NVIDIA A100 é a primeira GPU que usou a arquitetura de ampere. O chip corporativo é direcionado a data centers e projetado para tarefas intensivas em GPU, como aprendizado profundo e IA. Construído usando o processo de 7nm da TSMC, ele abriga uma quantidade enorme de 54 bilhões de transistores. Ele superou as gerações anteriores de GPUs corporativas com um aumento de 20x no desempenho com 6.912 núcleos de CUDA, 432 unidades de mapeamento de textura, 160 ROPs, núcleos de tensor de terceira geração e um VRAM de 40 GB com largura de banda de memória que se destaca em 1.6tb/s. DGX A100 é o primeiro sistema de IA do mundo com um aglomerado de oito A100 e um preço alto de US $ 199.000.
GEFORCE RTX 30 Series
Além de dominar o mercado corporativo, a Nvidia sempre tem os consumidores, especialmente jogadores e criadores, em mente. A arquitetura de ampere também é adotada nas placas gráficas de consumo da NVIDIA. A segunda geração do GeForce RTX carrega as GPUs baseadas em amperes, aumentando o desempenho para o dobro do que a geração anterior.
Na maioria dos aspectos, a Ampere tem mais do que o dobro do poder de processamento de Turing. Ele dobrou o desempenho do shader de Turing com o dobro do número de núcleos fp32 cuda. Especificamente, possui 30 shader-tflops, 2.7x mais do que o de Turing, que é apenas 11 shader-tlops. Da mesma forma, o núcleo do tensor de Turing mede 89 Tensor-Tflops, mas a Ampere mais que dobrou essa taxa com seus 238 tensores-tlops. Para não esquecer suas taxas principais de rastreamento, que é 58 rt-tflops, 1.7x mais rápido que os 34 rt-tlops de Turing e, para fazer com que as GPUs funcionem ainda mais rápido, o chip ampere se conecta à memória mais rápida do mundo, o Micron G6x.
A série RTX 30 é feita usando o processo personalizado da Samsung 8n Nvidia com 28 bilhões de transistores para GA102 e 17 bilhões de transistores para GA104. O Titan Class RTX 3090 é alimentado pela GPU GA102 e oferece desempenho de cartão de consumo extremamente poderoso. Ao contrário das gerações anteriores, o RTX 3090 está aberto a terceiros para design personalizado.
O RTX 3080 também está usando uma GPU GA102, oferecendo o dobro do desempenho do RTX 2080 e uma impressionante proezas para jogos em 4K. RTX 3070, alimentado por GA104 GPU, está em pé de igualdade com o RTX 2080 TI pela metade do preço. O RTX 3060 lançado recentemente também nunca deixa de impressionar com seu desempenho impressionante impulsionado por núcleos aprimorados de rastreamento de raios, núcleos tensores, novos multiprocessadores de streaming e memória G6 de alta velocidade.
Apesar do aumento maciço do desempenho, as novas GPUs RTX não são pesadas no bolso. As placas gráficas muito mais rápidas são facilmente acessíveis quando se trata de preços. O carro -chefe da NVIDIA GeForce, RTX 3080, começa em US $ 699, o RTX 3070 é vendido a US $ 499 e o RTX 3060 tem um preço de US $ 329. O RTX 3090 de ponta custa US $ 1.499; Ainda consideravelmente baixo custo, considerando seu desempenho no nível do titão.
Apenas alguns meses após o seu lançamento, supostamente houve uma escassez de placas gráficas baseadas em amperes, e não é surpresa com a performance impressionante de Ampere a um preço razoável. Para aqueles que consideram uma atualização da GPU, agora é a melhor hora para colocar suas mãos nas GPUs baseadas em amperes da NVIDIA.
Fontes
[1] Walton, Jarred. “NVIDIA RTX 30-Série Ampere Architecture Deep Dive: tudo o que sabemos”. https: // www.Tomshardware.COM/RECURSOS/NVIDIA-AMAMPER-ARCHITETTION-DEPE DIVE. 13 de outubro de 2020.