As séries Killer GeForce RTX 4090 e 4080 da NVIDIA tratam do avanço de jogos de PC com maior fidelidade

Entre toda a fanfarra e chiado na conferência virtual de tecnologia de GPU da NVIDIA (GTC) esta semana, a potência da plataforma de IA e jogos da Califórnia finalmente anunciou suas placas gráficas PC Gaming de próxima geração baseadas em sua arquitetura GPU Ada Lovelace. Batizado com o nome de um matemático inglês e pioneiro da computação, o Lovelace da NVIDIA é de fato uma enorme placa de silício com um mais-de-tudo abordagem de design, construída em um processo de fabricação de chips 4N TSMC de ponta. No entanto, sua arquitetura de chip base também foi projetada com inovações em seus vários mecanismos de silício, em um esforço para escalar o desempenho além das limitações da Lei de Moore, na qual a densidade do transistor está atingindo um ponto de retornos cada vez menores a cada novo nó fab parece.

Aprimoramentos de silício de força bruta GeForce RTX 4090 e 4080

De fato, há poucas dúvidas de que a GPU Lovelace da NVIDIA é muito mais robusta do que sua arquitetura Ampere de geração anterior e, de fato, a nova GeForce RTX 4090 tem 16.384 núcleos CUDA e 24 GB de memória GDDR6X, contra 10.752 núcleos CUDA (mesma memória) em um RTX 3090. , a nova GeForce RTX 4080 12GB tem 7.680 núcleos CUDA, contra uma RTX 3080 a 8960, enquanto uma placa RTX 4080 16GB tem 9.728 núcleos, menos que uma RTX 3080 Ti a 10.240 núcleos CUDA. Essas especificações da série RTX 4080 e a marca do modelo podem ser um ponto de discórdia para alguns que estão apenas contando núcleos, mas a escala de desempenho aqui simplesmente não é linear, especialmente quando você considera que essas novas placas da série GeForce RTX 40 têm clocks de aumento ao norte de 2,5 GHz, enquanto a geração anterior atingiu 1,75 GHz.

Além dessas contagens de núcleos, velocidades e feeds, existem vários novos aprimoramentos e inovações que a NVIDIA aponta para ganhos de desempenho de Ada Lovelace e, finalmente, o que dará início a novos níveis de fidelidade de imagem e imersão para os jogadores, sendo os principais o novo núcleo de Ray Tracing inovações, bem como os núcleos Tensor de 4ª geração que agora são reivindicados em 2X a taxa de transferência TFLOP. Além disso, Lovelace também suportará codificação/decodificação de vídeo AV1 em hardware, muito parecido com a série Arc da Intel, que deve ser um benefício para o desempenho de streaming de jogos com sobrecarga muito menor em algum momento no futuro.

A inovação de reordenamento da execução do sombreador aumenta o desempenho do Ray Tracing, proporcionando melhores efeitos de RT

Ray Tracing (RT) é uma técnica de renderização gráfica para efeitos de iluminação e reflexão com fidelidade visual muito mais alta e precisa do que a rasterização tradicional, embora também tenha uma sobrecarga computacional muito maior. Antes do advento do traçado de raios, a rasterização tradicional era um processo muito ordenado e determinístico. O RT não permite essa coerência natural e partes de uma cena renderizada em 3D, portanto, não podem ser renderizadas simultaneamente, causando travamentos no pipeline.

Esse problema limita bastante os efeitos de rastreamento de raios em mecanismos de jogos modernos. No entanto, o arco de GPU Ada Lovelace da NVIDIA suporta uma nova técnica, chamada Shader Execution Reordering (SER), que adiciona um estágio no pipeline RT que agrupa e reordena o trabalho para que os raios que estão executando o mesmo programa possam ser executados juntos com mais eficiência (veja a ilustração acima ).

A NVIDIA afirma que o SER pode oferecer uma melhoria de até 2X por cento no desempenho de renderização RT e destacou especificamente uma nova versão do jogo Cyberpunk 2077 com novos níveis mais altos de efeitos RT, incluindo um modo Overdrive que permite operações de 635 RT por pixel (acima) para ótimos visuais. Por fim, deve-se notar que os desenvolvedores de jogos precisam coordenar com a NVIDIA as melhores práticas de otimização e classificação de carga de trabalho RT, portanto, a NVIDIA tem uma API disponível para desenvolvedores para ajudar a otimizar seus mecanismos de jogo e técnicas de renderização com esse recurso.

Upscaling de imagem DLSS 3 e o supercomputador de IA por trás de sua experiência de jogo

A tecnologia DLSS ou Deep Learning Super-Sampling da NVIDIA é uma técnica de recuperação de desempenho que oferece bons ganhos de desempenho para jogadores que desejam aumentar a fidelidade visual com ray tracing ou aumentar o FPS (Frames Per Second) para uma jogabilidade de maior resolução em placas GeForce. A tecnologia usa aprendizado de máquina para renderizar quadros de resolução mais alta inferidos de modelos pré-treinados nos datacenters da NVIDIA, enquanto permite que o restante do pipeline gráfico seja executado em resolução mais baixa para maior desempenho e menor latência, mas com saída de qualidade de imagem semelhante ao padrão mais alto nativo. imagem de resolução. Embora a AMD e a Intel também tenham técnicas de upscaling competitivas (FSR e XeSS), o DLSS está agora em sua terceira iteração e foi bem recebido e implantado por desenvolvedores de jogos, com 200 títulos de jogos e aplicativos que atualmente utilizam a tecnologia.

Onde o novo DLSS 3 da NVIDIA (suportado apenas em placas da série RTX 40) difere de sua geração anterior DLSS 2, é que a arquitetura ficou tão rápida com a nova arquitetura da NVIDIA que a GPU agora pode gerar quadros inteiros em tempo real por muito tempo. desempenho superior, mantendo uma excelente qualidade de imagem. Com o DLSS 3, a NVIDIA deu exemplos da IA ​​renderizando metade dos quadros em uma sequência e 7 de 8 pixels, com o upscaling envolvido e a geração de quadros combinada.

Sem se aprofundar muito nas ervas daninhas, as placas GeForce RTX 40 conseguem isso em parte devido a um Acelerador de Fluxo Óptico muito mais rápido que calcula o movimento de pixels em uma cena. Este acelerador tem uma compreensão de como a iluminação e as sombras devem renderizar adequadamente à medida que um objeto se move e, em seguida, alimenta todas essas informações nos mecanismos Tensor AI no chip (diagrama acima), para tomar uma decisão sobre a melhor forma de gerar o quadro. A tecnologia também pode ajudar a melhorar o desempenho em mecanismos de jogos que normalmente são mais vinculados à CPU, por meio dessa técnica de geração de vários quadros.

A NVIDIA mostrou demonstrações do Cyberpunk e do Microsoft Flight Simulator com a tecnologia, para ganhos de desempenho impressionantes de 2X com grande fidelidade visual. A NVIDIA também terá um plug-in DLSS 3 AI simplificado para facilitar a integração do desenvolvedor de jogos, e os mecanismos de jogo Unity e Unreal também oferecerão suporte nativo à tecnologia. Além disso, a empresa observou que, além de Cyberpunk e MS Flight Sim, haverá 35 títulos de jogos no lançamento que suportarão DLSS 3, com mais chegando, no que a NVIDIA afirma ser a absorção mais rápida de sua tecnologia.

Expectativas de desempenho e conclusões da GeForce RTX 4090 e RTX 4080

Perdoe o gráfico abaixo, que é um pouco um gráfico de olho aqui no mecanismo da Forbes. Independentemente disso, a NVIDIA foi bastante direta sobre as expectativas de desempenho para a nova série GeForce RTX 40, mostrando uma reunião GeForce RTX 4080 de US$ 899 ou às vezes superando com folga a GeForce RTX 3090 Ti da geração anterior, que tinha um preço sugerido de US$ 1.999 no lançamento. A empresa também mostrou desempenho em jogos de última geração como Cyberpunk 2077, que suportam DLSS 3, com níveis de desempenho muito mais altos.

No geral, como você pode ver no gráfico acima, as placas da série GeForce RTX 4090 e 4080 podem ter um desempenho até 2X – 4X mais rápido (RTX 4090) do que a poderosa GeForce RTX 3090 Ti. No entanto, o gráfico acima mostra todas as comparações de desempenho de DLSS (esquerda, até 2X) e DLSS 3 (direita, até 4X). Será muito interessante ver como o desempenho muda com o DLSS desligado no jogo tradicional, embora se possa argumentar por que se incomodar em desativá-lo, desde que um jogo suporte a tecnologia.

A nova família de placas GeForce RTX 40 iniciais da NVIDIA está listada acima com seus respectivos preços. Velocidades, feeds e configurações à parte, a empresa lançou uma oferta de produto extremamente potente aqui, que alega trazer um grande aumento de desempenho por dólar de 3X em média para suas placas RTX 4080 e 4X para suas placas RTX 4090, em comparação com seus geração anterior. É importante notar que essas reivindicações de desempenho são feitas com sua nova tecnologia DLSS 3 em jogo, no entanto, novamente será interessante ver como o desempenho se altera em geral, com DLSS ativado e desativado, bem como ray tracing ativado jogos e cargas de trabalho de jogos de rasterização tradicionais.

Pensamentos sobre Ada Lovelace e o futuro dos jogos do CEO da NVIDIA

Por último, mas certamente não menos importante, tive a chance de me encontrar com o CEO da NVIDIA, Jensen Huang, em conferência esta semana, e perguntei a ele sobre a vantagem da mudança do processo de fabricação de chips 8N da Samsung para o TSMC 4N para esta geração. Jensen observou que sua equipe de design percebeu um “Cerca de 15%” aumento apenas do processo, enquanto o restante dos ganhos de desempenho do RTX 40 vem da inovação em silício, como SER (Shader Execution Re-Ordering) e DLSS. Huang observou que, embora o processo 4N da TSMC seja muito mais avançado, “infelizmente o custo sobe mais de 15%”, e essa densidade de transistores dimensionada por si só não é suficiente e não faz mais o trabalho, porque “A Lei de Moore está morta.” Além disso, Jensen observou, “e não é porque a TSMC está tentando capturar mais lucro. Isso não é verdade. O custo deles subiu. Você pode dizer que o tempo de ciclo aumentou porque o número de etapas do processo aumentou.”

Huang passou a explicar que “A maneira como resolvemos isso, Dave, com Ada é arquitetura. O benefício composto de várias arquiteturas diferentes e a grande alavanca, a alavanca gigante, era a inteligência artificial e os núcleos tensores. Essa é a alavanca gigante… E então acho que temos que superar a fraqueza de que estamos no fim da Lei de Moore, não desistindo, mas criando técnicas muito mais inteligentes, e graças a Deus a inteligência artificial veio na hora certa.”

Você tem que admirar a paixão de Jensen pela empresa, seus produtos e o campo florescente da IA. Há pouca dúvida de que a inteligência artificial é uma “grande alavanca”, como observa Huang. A IA está se tornando difundida agora em tantas áreas da tecnologia, e gerar visuais de alta fidelidade para jogos de PC é uma evolução natural, com certeza.

Leave a Comment