NVIDIA L40S
Bezprecedensowa wydajność AI i grafiki dla centrum danych.
Odkryj przełomową wydajność w obsłudze wielu obciążeń z GPU NVIDIA L40S. Łącząc potężne obliczenia AI z najlepszą w swojej klasie akceleracją grafiki i mediów, GPU L40S jest zaprojektowany do obsługi następnej generacji obciążeń w centrach danych — od generatywnej AI i wnioskowania oraz treningu dużych modeli językowych (LLM) po grafikę 3D, renderowanie i wideo.
Serwery NVIDIA OVX™ z nowymi GPU NVIDIA, które przyspieszą trening i wnioskowanie, a także obciążenia związane z intensywną grafiką, wkrótce będą dostępne od Dell, Hewlett Packard Enterprise, Lenovo, Supermicro i innych producentów.
Przeczytaj komunikat prasowyTFLOPS¹
TFLOPS
TFLOPS
Sprzętowe wsparcie dla strukturalnej rzadkości oraz zoptymalizowany format TF32 zapewniają natychmiastowe zyski wydajności dla szybszego szkolenia modeli AI i nauki o danych. Przyspiesz możliwości grafiki wspieranej AI za pomocą DLSS, umożliwiając zwiększenie rozdzielczości z lepszą wydajnością w wybranych aplikacjach.
Zwiększona przepustowość oraz jednoczesne możliwości śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie dla projektowania produktów, architektury, inżynierii oraz przepływów pracy w budownictwie. Zobacz realistyczne projekty w akcji dzięki sprzętowemu przyspieszeniu rozmycia ruchu i oszałamiającym animacjom w czasie rzeczywistym.
Przyspieszona przepustowość operacji zmiennoprzecinkowych pojedynczej precyzji (FP32) oraz poprawiona efektywność energetyczna znacząco zwiększają wydajność dla przepływów pracy, takich jak rozwój modeli 3D i symulacje inżynierii wspomaganej komputerowo (CAE). Wykorzystaj ulepszone możliwości matematyki 16-bitowej (BF16) dla obciążeń o mieszanej precyzji.
Silnik Transformatorów znacznie przyspiesza wydajność AI i poprawia wykorzystanie pamięci zarówno podczas treningu, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji architektury Ada Lovelace, Silnik Transformatorów inteligentnie skanuje warstwy architektury sieci neuronowych transformatorów i automatycznie przekształca precyzje między FP8 i FP16, aby zapewnić szybszą wydajność AI i przyspieszyć trening oraz wnioskowanie.
The NVIDIA L40S GPU is a powerful solution for NVIDIA Omniverse and 3D content creation, offering exceptional performance and versatility in data center environments. Built on the Ada Lovelace architecture, it features third-generation RT cores for enhanced real-time ray tracing and fourth-generation Tensor Cores that support AI-driven features, significantly improving the quality and speed of 3D workflows. As the engine of NVIDIA Omniverse in the data center, the L40S delivers stunning real-time ray tracing and AI-accelerated capabilities, making it ideal for extended reality (XR) and virtual production tasks. With 48GB of GDDR6 memory, it can handle complex 3D models, high-resolution textures, and large-scale simulations with ease, enabling creative professionals to work on intricate designs and render photorealistic scenes more efficiently. The L40S’s support for Universal Scene Description (OpenUSD)-based 3D workflows within the Omniverse ecosystem enhances collaboration and streamlines production pipelines. Its performance in Omniverse applications is described as „stunning,” positioning it as a top-tier solution for organizations looking to leverage cutting-edge technologies in virtual world creation, 3D visualization, and immersive content production.
Procesor graficzny NVIDIA L40S to potężny procesor NVIDIA Omniverse i tworzenia treści 3D, oferujący wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany w oparciu o architekturę Ada Lovelace, zawiera rdzenie RT trzeciej generacji zapewniające ulepszone śledzenie promieni w czasie rzeczywistym oraz rdzenie Tensor czwartej generacji, które obsługują funkcje oparte na sztucznej inteligencji, znacznie poprawiając jakość i szybkość przepływów pracy 3D. Jako silnik NVIDIA Omniverse w centrum danych, L40S zapewnia oszałamiające możliwości śledzenia promieni w czasie rzeczywistym i akceleracji sztucznej inteligencji, dzięki czemu idealnie nadaje się do zadań w rozszerzonej rzeczywistości (XR) i wirtualnej produkcji. Dzięki 48 GB pamięci GDDR6 z łatwością radzi sobie ze złożonymi modelami 3D, teksturami o wysokiej rozdzielczości i symulacjami na dużą skalę, umożliwiając kreatywnym profesjonalistom pracę nad skomplikowanymi projektami i wydajniejsze renderowanie fotorealistycznych scen. Obsługa przez monitor L40S procesów 3D opartych na uniwersalnym opisie scen (OpenUSD) w ekosystemie Omniverse usprawnia współpracę i usprawnia procesy produkcyjne. Jego wydajność w aplikacjach Omniverse określa się jako „oszałamiającą”, co stawia go jako najwyższej klasy rozwiązanie dla organizacji chcących wykorzystać najnowocześniejsze technologie do tworzenia wirtualnego świata, wizualizacji 3D i produkcji treści immersyjnych.
Procesor graficzny NVIDIA L40S to potężne rozwiązanie do obciążeń związanych ze szkoleniem i wnioskowaniem AI, oferujące wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany na architekturze Ada Lovelace, zawiera 18 176 rdzeni CUDA i 568 rdzeni Tensor czwartej generacji, zapewniając do 5 razy lepszą wydajność zmiennoprzecinkową pojedynczej precyzji (FP32) w porównaniu do A100. Jego zaawansowany silnik transformatorowy inteligentnie zarządza precyzją między FP8 a FP16, znacznie zwiększając wydajność sztucznej inteligencji zarówno na potrzeby uczenia, jak i wnioskowania modeli opartych na transformatorach. Dzięki 48 GB pamięci GDDR6 L40S może skutecznie obsługiwać złożone zadania AI i modele z dużymi językami. W przypadku szkolenia AI osiem procesorów graficznych L40S w głównym serwerze pozwala na 0,8-krotny wzrost wydajności w porównaniu z systemem 8-GPU A100 dla modeli MLPerf. W zadaniach wnioskowania L40S wykazuje imponujące możliwości, często dorównujące lub przekraczające wydajność A100 w różnych testach MLPerf. To sprawia, że L40S szczególnie dobrze nadaje się do wdrażania i uruchamiania wyrafinowanych modeli sztucznej inteligencji w środowiskach produkcyjnych, oferując organizacjom wydajne i wydajne rozwiązanie dla ich obciążeń związanych ze sztuczną inteligencją.
Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie obciążeń graficznych i wizualizacyjnych, co czyni go potężnym rozwiązaniem do profesjonalnych zastosowań w takich dziedzinach, jak projektowanie wspomagane komputerowo (CAD), produkcja wirtualna i wizualizacja naukowa. Zbudowany na architekturze Ada Lovelace, zawiera rdzenie RT trzeciej generacji, które znacznie zwiększają wydajność śledzenia promieni w czasie rzeczywistym, zapewniając oszałamiającą wierność wizualną i fotorealistyczne renderowanie. 48 GB pamięci GDDR6 modelu L40S pozwala z łatwością obsługiwać złożone modele 3D, tekstury o wysokiej rozdzielczości i duże zbiory danych, umożliwiając profesjonalistom pracę nad skomplikowanymi projektami i wizualizacjami bez wąskich gardeł wydajności. Rdzenie Tensor czwartej generacji obsługują funkcje graficzne wzmocnione sztuczną inteligencją, takie jak DLSS (Deep Learning Super Sampling), które mogą zwiększyć wydajność i jakość obrazu w obsługiwanych aplikacjach. W połączeniu z oprogramowaniem NVIDIA RTX Virtual Workstation (vWS), L40S może zasilać wirtualne stacje robocze o wysokiej wydajności z centrum danych, zapewniając elastyczny dostęp do wymagających aplikacji graficznych z dowolnego urządzenia. To sprawia, że NVIDIA L40S jest doskonałym wyborem dla organizacji, które chcą ulepszyć swoje możliwości wizualizacji, poprawić efektywność przepływu pracy i dostarczać wysokiej jakości treści wizualne w różnych branżach.
Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie kodowania wideo i przesyłania strumieniowego, co czyni go potężnym rozwiązaniem do strumieniowego przesyłania transmisji, produkcji wideo i transkrypcji. Zbudowany na architekturze Ada Lovelace, L40S posiada trzy silniki kodowania i dekodowania wideo, co znacznie zwiększa jego zdolność do jednoczesnej obsługi wielu strumieni wideo wysokiej jakości. Kluczowym postępem jest dodanie obsługi kodowania i dekodowania AV1, która zapewnia przełomową wydajność i niższy całkowity koszt posiadania dla twórców treści i platform przesyłania strumieniowego. Ta funkcja pozwala na uzyskanie wyższej jakości wideo przy niższych przepływnościach, z korzyścią zarówno dla dostawców treści, jak i użytkowników końcowych. L40S może obsługiwać ponad 1000 jednoczesnych strumieni wideo AV1 w rozdzielczości 720p30 do zastosowań mobilnych, co czyni go idealnym rozwiązaniem dla usług przesyłania strumieniowego i sieci dostarczania treści. Potężne przyspieszenie sprzętowe w połączeniu z 48 GB pamięci GDDR6 umożliwia wydajne przetwarzanie złożonych obciążeń wideo, w tym transkodowanie w czasie rzeczywistym i tworzenie treści w wysokiej rozdzielczości. Organizacjom zajmującym się transmisją strumieniową na żywo, usługami wideo na żądanie lub produkcją wirtualną NVIDIA L40S zapewnia wydajność i wszechstronność niezbędną do spełnienia wymagań współczesnego tworzenia i dystrybucji treści wideo.
GPU Architecture | NVIDIA Ada Lovelace architecture |
GPU Memory | 48GB GDDR6 with ECC |
Memory Bandwidth | 864GB/s |
Interconnect Interface | PCIe Gen4 x16: 64GB/s bidirectional |
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores | 18,176 |
NVIDIA Third-Generation RT Cores | 142 |
NVIDIA Fourth-Generation Tensor Cores | 568 |
RT Core Performance TFLOPS | 212 |
FP32 TFLOPS | 91.6 |
TF32 Tensor Core TFLOPS | 183 I 366* |
BFLOAT16 Tensor Core TFLOPS | 362.05 I 733* |
FP16 Tensor Core | 362.05 I 733* |
FP8 Tensor Core | 733 I 1,466* |
Peak INT8 Tensor TOPS Peak INT4 Tensor TOPS |
733 I 1,466* 733 I 1,466* |
Form Factor | 4.4″ (H) x 10.5″ (L), dual slot |
Display Ports | 4x DisplayPort 1.4a |
Max Power Consumption | 350W |
Power Connector | 16-pin |
Thermal | Passive |
Virtual GPU (vGPU) Software Support | Yes |
vGPU Profiles Supported | See virtual GPU licensing guide |
NVENC I NVDEC | 3x l 3x (includes AV1 encode and decode) |
Secure Boot With Root of Trust | Yes |
NEBS Ready | Level 3 |
Multi-Instance GPU (MIG) Support | No |
NVIDIA® NVLink® Support | No |
*With Sparsity