Aceleração da GPU
A aceleração da GPU é o uso da GPU como um componente suplementar da CPU para processar grandes volumes de dados. A CPU é o cérebro de qualquer sistema e pode lidar com multitarefa e processamento de dados usando um ou mais núcleos que lidam com a execução de dados. A CPU é poderosa o suficiente para lidar com operações complexas, mas luta com o processamento de alto volume; Assim veio a GPU. A GPU também é composta por núcleos para execução de dados, mas contém um número enorme de núcleos, embora seus núcleos sejam mais simples e não tão poderosos quanto os núcleos da CPU. Ao contrário da CPU, que depende de seu poder de computação, as GPUs dependem do número de núcleos para processar dados. Enquanto as CPUs executam o processamento em série de dados, as GPUs são utilizadas para processamento paralelo, o que os torna ótimos para cálculos simples e repetitivos.
As GPUs de alto desempenho são aproveitadas em jogos e renderização de imagens, que requerem o cálculo rápido de um pequeno conjunto de equações. Dois conceitos importantes usados na aceleração da GPU são overclocking da CPU e aceleração de hardware. A CPU não é poderosa o suficiente para lidar com tarefas altamente computacionais e precisa descarregar o cálculo de alto volume para a GPU. É aqui que entra a aceleração do hardware, onde os aplicativos são configurados para descarregar tarefas para a GPU. Por outro lado, o overclock é a prática de empurrar o ciclo do relógio da CPU além da recomendação do fabricante para melhorar seu desempenho.
Os sistemas acelerados por GPU geralmente são encontrados em data centers onde grandes volumes de dados estão sendo processados. Esses sistemas requerem GPUs projetados especificamente para lidar com aplicativos intensivos computacionalmente. Como o principal fabricante de GPUs, a NVIDIA estendeu seus braços aos sistemas de data center com Nvidia Tesla.
Nvidia Tesla
Ciência, pesquisa, engenharia e muitos outros campos geralmente exigem alta computação para grandes volumes de dados, mas estes eram impossíveis nas abordagens anteriormente disponíveis. A Nvidia abriu o caminho para cientistas e engenheiros realizarem computação de alto desempenho em suas estações de trabalho com o poder das GPUs Tesla.
A Nvidia desenvolveu uma arquitetura paralela para GPUs Tesla e projetou produtos Tesla para atender aos requisitos de HPC. Nvidia Tesla apresenta gerente de execução de threads e cache de dados paralelos. O primeiro lida com a execução de milhares de threads de computação, enquanto o último permite compartilhamento mais rápido de dados e entrega de resultados. O NVIDIA TESLA GPUS otimiza a produtividade de data centers que dependem fortemente de alta taxa.
O uso do NVIDIA TESLA GPUS não apenas melhora significativamente o desempenho do sistema, mas também ajuda a reduzir o custo operacional das infraestruturas, reduzindo o número de nós do servidor que, consequentemente, resulta em uma redução do orçamento para software e serviços. O custo operacional também é significativamente menor com os produtos da Tesla implantados, pois menos equipamentos precisarão ser instalados e reduzindo bastante o consumo de energia.
Nvidia Tesla GPUS
A NVIDIA tem como alvo o mercado de computação de alto desempenho com a linha de produtos Tesla. A primeira geração de Nvidia Tesla GPUS foi lançada em maio de 2007. Essas GPUs foram baseadas no chip G80 e na microarquitetura Tesla da empresa e usavam memória GDDR3. A extremidade inferior C870 era um módulo PCIE interno com um chip G80 e 76.8 GB/s de largura de banda. O D870 no meio da camada teve duas fichas G80 e duas vezes a largura de banda do C870 e foi projetada para os computadores de casca. O S870 de ponta mais sofisticado foi projetado para computação servidores com quatro chips G80 e quatro vezes a largura de banda do C870.
As gerações seguintes utilizaram a microarquitetura atual da NVIDIA no momento de seu lançamento e tiveram uma largura de banda mais alta do que a geração anterior. A última geração antes da marca ser aposentada foi o acelerador Tesla V100 e T4 GPU, lançado em 2018.
O Tesla V100 é baseado na microarquitetura Volta e usa o chip GV100, que combina núcleos CUDA com núcleos tensores. O V100 está equipado com 5120 núcleos CUDA e 640 núcleos tensores e oferece 125 teraflops de desempenho de aprendizado profundo. O V100 pode substituir centenas de servidores somente CPU e exceder os requisitos do HPC e aprendizado profundo. Está disponível em configurações de 32 GB e 16 GB.
O T4 GPU Accelerator é o único Tesla GPU baseado em Turing e foi o último a ser lançado sob a marca Tesla. A GPU Tesla G4 combina núcleos de rastreamento de raios e tecnologia NVIDIA RTX para renderização de imagens aprimorada. É composto por 2560 núcleos CUDA e 320 núcleos tensores e suporta até 16 GB de memória GDDR6. A GPU T4 também é eficiente em termos de energia, usando apenas 70 watts.
Aposentadoria e rebranding da marca
Tesla não é um nome incomum. Não é apenas famoso por causa de Nikola Tesla, mas também por causa da marca popular de carros. Para evitar confusão com a marca de automóveis, a Nvidia decidiu aposentar a marca Tesla para seus aceleradores de GPU em 2019. Começando com os lançamentos de 2021, a Nvidia Tesla foi renomeada como GPUs do NVIDIA Data Center.
A Tesla obteve um enorme sucesso na indústria de data center, tornando o impossível possível com seu desempenho superior e tecnologia econômica. Apesar do rebranding, a NVIDIA instila as características de Tesla em seus aceleradores de GPU. As novas gerações são concomitadas à microarquitetura da NVIDIA e usam o chip e a memória mais recentes para melhor desempenho e maior largura de banda, mantendo o consumo de energia baixo. Tesla esculpiu o nome da Nvidia em sistemas de data center, tornando a NVIDIA não apenas uma marca confiável em jogos, mas também no mercado de HPC.