NVIDIA L40S

Niezrównana wydajność AI i grafiki dla centrum danych.

Najpotężniejszy uniwersalny procesor graficzny

Doświadcz przełomowej wydajności przy wielu obciążeniach dzięki procesorowi graficznemu NVIDIA L40S. Łącząc potężną moc obliczeniową AI z najlepszą w swojej klasie akceleracją grafiki i multimediów, procesor graficzny L40S został stworzony do obsługi obciążeń centrów danych nowej generacji — od wnioskowania i uczenia generatywnej sztucznej inteligencji i Large Language Model (LLM) po grafikę 3D, renderowanie i wideo.

Przegląd najważniejszych parametrów

Uniwersalna wydajność

Tensor Performance

1466

TFLOPS¹

RT Core Performance

212

TFLOPS

Single-Precision Performance

91.6

TFLOPS

Zasilany przez architekturę NVIDIA Ada Lovelace

Rdzenie tensorowe czwartej generacji

Wsparcie sprzętowe dla rzadkości strukturalnej i zoptymalizowanego formatu TF32 zapewnia natychmiastowy wzrost wydajności w celu szybszego szkolenia modeli sztucznej inteligencji i nauki o danych. Przyspiesz możliwości graficzne wspomagane przez sztuczną inteligencję dzięki technologii DLSS, aby zwiększyć rozdzielczość i uzyskać lepszą wydajność w wybranych aplikacjach.

Rdzenie RT trzeciej generacji

Zwiększona przepustowość oraz jednoczesne możliwości śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie w projektach produktów i architekturze, inżynierii i przepływach prac konstrukcyjnych. Zobacz realistyczne projekty w akcji dzięki przyspieszanemu sprzętowo rozmyciu ruchu i oszałamiającym animacjom w czasie rzeczywistym.

Rdzenie CUDA

Przyspieszona przepustowość zmiennoprzecinkowa pojedynczej precyzji (FP32) i poprawiona efektywność energetyczna znacznie zwiększają wydajność w przepływach pracy, takich jak opracowywanie modeli 3D i symulacje inżynierii wspomaganej komputerowo (CAE). Korzystaj z udoskonalonych funkcji 16-bitowej matematyki (BF16) w przypadku obciążeń o mieszanej precyzji.

Transformer Engine

Transformer Engine radykalnie przyspiesza działanie sztucznej inteligencji i poprawia wykorzystanie pamięci zarówno na potrzeby uczenia, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji Ady Lovelace, Transformer Engine inteligentnie skanuje warstwy sieci neuronowych architektury transformatora i automatycznie przekształca precyzję między FP8 a FP16, aby zapewnić wyższą wydajność sztucznej inteligencji oraz przyspieszyć szkolenie i wnioskowanie.

Wydajność i bezpieczeństwo

Procesor graficzny L40S jest zoptymalizowany do całodobowego działania korporacyjnego centrum danych oraz zaprojektowany, zbudowany, przetestowany i obsługiwany przez firmę NVIDIA w celu zapewnienia maksymalnej wydajności, trwałości i czasu pracy bez przestojów. Procesor graficzny L40S spełnia najnowsze standardy centrów danych, jest gotowy do obsługi systemu Network Equipment-Building System (NEBS) Level 3 i oferuje bezpieczny rozruch z technologią root of trust, zapewniając dodatkową warstwę bezpieczeństwa dla centrów danych.

DLSS 3

Procesor graficzny L40S umożliwia ultraszybkie renderowanie i płynniejsze wyświetlanie klatek dzięki NVIDIA DLSS 3. Ta przełomowa technologia generowania klatek wykorzystuje głębokie uczenie się i najnowsze innowacje sprzętowe w architekturze Ada Lovelace i procesorze graficznym L40S, w tym rdzenie Tensor czwartej generacji i przepływ optyczny Akcelerator, aby zwiększyć wydajność renderowania, zapewnić wyższą liczbę klatek na sekundę (FPS) i znacznie poprawić opóźnienia.

Specyfikacja

NVIDIA L40S GPU

PU Architecture NVIDIA Ada Lovelace architecture
GPU Memory 48GB GDDR6 with ECC
Memory Bandwidth 864GB/s
Interconnect Interface PCIe Gen4 x16: 64GB/s bidirectional
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores 18,176
NVIDIA Third-Generation RT Cores 142
NVIDIA Fourth-Generation Tensor Cores 568
RT Core Performance TFLOPS 212 
FP32 TFLOPS 91.6
TF32 Tensor Core TFLOPS 183 I 366*
BFLOAT16 Tensor Core TFLOPS 362.05 I 733*
FP16 Tensor Core 362.05 I 733*
FP8 Tensor Core 733 I 1,466*
Peak INT8 Tensor TOPS
Peak INT4 Tensor TOPS
733 I 1,466*
733 I 1,466*
Form Factor 4.4″ (H) x 10.5″ (L), dual slot
Display Ports 4x DisplayPort 1.4a
Max Power Consumption 350W
Power Connector 16-pin
Thermal Passive
Virtual GPU (vGPU) Software Support Yes
vGPU Profiles Supported See virtual GPU licensing guide
NVENC I NVDEC 3x l 3x (includes AV1 encode and decode)
Secure Boot With Root of Trust Yes
NEBS Ready Level 3
Multi-Instance GPU (MIG) Support No
NVIDIA® NVLink® Support No

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *