Niezrównana wydajność AI i grafiki dla centrum danych.
Najpotężniejszy uniwersalny procesor graficzny
Doświadcz przełomowej wydajności przy wielu obciążeniach dzięki procesorowi graficznemu NVIDIA L40S. Łącząc potężną moc obliczeniową AI z najlepszą w swojej klasie akceleracją grafiki i multimediów, procesor graficzny L40S został stworzony do obsługi obciążeń centrów danych nowej generacji — od wnioskowania i uczenia generatywnej sztucznej inteligencji i Large Language Model (LLM) po grafikę 3D, renderowanie i wideo.
Przegląd najważniejszych parametrów
Uniwersalna wydajność
Tensor Performance
1466
TFLOPS¹
RT Core Performance
212
TFLOPS
Single-Precision Performance
91.6
TFLOPS
Zasilany przez architekturę NVIDIA Ada Lovelace
Rdzenie tensorowe czwartej generacji
Wsparcie sprzętowe dla rzadkości strukturalnej i zoptymalizowanego formatu TF32 zapewnia natychmiastowy wzrost wydajności w celu szybszego szkolenia modeli sztucznej inteligencji i nauki o danych. Przyspiesz możliwości graficzne wspomagane przez sztuczną inteligencję dzięki technologii DLSS, aby zwiększyć rozdzielczość i uzyskać lepszą wydajność w wybranych aplikacjach.
Rdzenie RT trzeciej generacji
Zwiększona przepustowość oraz jednoczesne możliwości śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie w projektach produktów i architekturze, inżynierii i przepływach prac konstrukcyjnych. Zobacz realistyczne projekty w akcji dzięki przyspieszanemu sprzętowo rozmyciu ruchu i oszałamiającym animacjom w czasie rzeczywistym.
Rdzenie CUDA
Przyspieszona przepustowość zmiennoprzecinkowa pojedynczej precyzji (FP32) i poprawiona efektywność energetyczna znacznie zwiększają wydajność w przepływach pracy, takich jak opracowywanie modeli 3D i symulacje inżynierii wspomaganej komputerowo (CAE). Korzystaj z udoskonalonych funkcji 16-bitowej matematyki (BF16) w przypadku obciążeń o mieszanej precyzji.
Transformer Engine
Transformer Engine radykalnie przyspiesza działanie sztucznej inteligencji i poprawia wykorzystanie pamięci zarówno na potrzeby uczenia, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji Ady Lovelace, Transformer Engine inteligentnie skanuje warstwy sieci neuronowych architektury transformatora i automatycznie przekształca precyzję między FP8 a FP16, aby zapewnić wyższą wydajność sztucznej inteligencji oraz przyspieszyć szkolenie i wnioskowanie.
Wydajność i bezpieczeństwo
Procesor graficzny L40S jest zoptymalizowany do całodobowego działania korporacyjnego centrum danych oraz zaprojektowany, zbudowany, przetestowany i obsługiwany przez firmę NVIDIA w celu zapewnienia maksymalnej wydajności, trwałości i czasu pracy bez przestojów. Procesor graficzny L40S spełnia najnowsze standardy centrów danych, jest gotowy do obsługi systemu Network Equipment-Building System (NEBS) Level 3 i oferuje bezpieczny rozruch z technologią root of trust, zapewniając dodatkową warstwę bezpieczeństwa dla centrów danych.
DLSS 3
Procesor graficzny L40S umożliwia ultraszybkie renderowanie i płynniejsze wyświetlanie klatek dzięki NVIDIA DLSS 3. Ta przełomowa technologia generowania klatek wykorzystuje głębokie uczenie się i najnowsze innowacje sprzętowe w architekturze Ada Lovelace i procesorze graficznym L40S, w tym rdzenie Tensor czwartej generacji i przepływ optyczny Akcelerator, aby zwiększyć wydajność renderowania, zapewnić wyższą liczbę klatek na sekundę (FPS) i znacznie poprawić opóźnienia.
Specyfikacja
NVIDIA L40S GPU
PU Architecture | NVIDIA Ada Lovelace architecture |
GPU Memory | 48GB GDDR6 with ECC |
Memory Bandwidth | 864GB/s |
Interconnect Interface | PCIe Gen4 x16: 64GB/s bidirectional |
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores | 18,176 |
NVIDIA Third-Generation RT Cores | 142 |
NVIDIA Fourth-Generation Tensor Cores | 568 |
RT Core Performance TFLOPS | 212 |
FP32 TFLOPS | 91.6 |
TF32 Tensor Core TFLOPS | 183 I 366* |
BFLOAT16 Tensor Core TFLOPS | 362.05 I 733* |
FP16 Tensor Core | 362.05 I 733* |
FP8 Tensor Core | 733 I 1,466* |
Peak INT8 Tensor TOPS Peak INT4 Tensor TOPS |
733 I 1,466* 733 I 1,466* |
Form Factor | 4.4″ (H) x 10.5″ (L), dual slot |
Display Ports | 4x DisplayPort 1.4a |
Max Power Consumption | 350W |
Power Connector | 16-pin |
Thermal | Passive |
Virtual GPU (vGPU) Software Support | Yes |
vGPU Profiles Supported | See virtual GPU licensing guide |
NVENC I NVDEC | 3x l 3x (includes AV1 encode and decode) |
Secure Boot With Root of Trust | Yes |
NEBS Ready | Level 3 |
Multi-Instance GPU (MIG) Support | No |
NVIDIA® NVLink® Support | No |