Najpotężniejszy uniwersalny procesor graficzny

Doświadcz przełomowej wydajności przy wielu obciążeniach dzięki procesorowi graficznemu NVIDIA L40S. Łącząc potężne obliczenia AI z najlepszą w swojej klasie akceleracją grafiki i multimediów, procesor graficzny L40S został zbudowany z myślą o obsłudze obciążeń centrów danych nowej generacji — od generatywnej sztucznej inteligencji i wnioskowania i uczenia modelu dużego języka (LLM) po grafikę 3D, renderowanie i wideo.

NVIDIA, globalni producenci systemów dla centrów danych, usprawnią generacyjną sztuczną inteligencję i cyfryzację przemysłową

Serwery NVIDIA OVX™ wyposażone w nowe procesory graficzne NVIDIA przyspieszające szkolenie i wnioskowanie, a także obciążenia wymagające dużej ilości grafiki, będą wkrótce dostępne w ofercie firm Dell, Hewlett Packard Enterprise, Lenovo, Supermicro i innych.

Przeczytaj komunikat prasowy

Najważniejsze informacje

Uniwersalna wydajność

Tensor Performance

1466

TFLOPS¹

RT Core Performance

212

TFLOPS

Single-Precision Performance

92

TFLOPS

Najważniejsze informacje

Uniwersalna wydajność

Rdzenie tensorowe czwartej generacji

Obsługa sprzętu zapewniająca rzadkość strukturalną i zoptymalizowany format TF32 zapewnia natychmiastowy wzrost wydajności w celu szybszego szkolenia modeli sztucznej inteligencji i nauki o danych. Przyspiesz możliwości graficzne wspomagane sztuczną inteligencją za pomocą DLSS, aby zwiększyć rozdzielczość i lepszą wydajność w wybranych aplikacjach.

Rdzenie RT trzeciej generacji

Większa przepustowość oraz możliwości jednoczesnego śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie projektów produktów oraz procesów związanych z architekturą, inżynierią i konstrukcją. Zobacz realistyczne projekty w akcji dzięki przyspieszanemu sprzętowo rozmyciu ruchu i oszałamiającym animacjom w czasie rzeczywistym.

Rdzenie CUDA

Zwiększona przepustowość zmiennoprzecinkowa pojedynczej precyzji (FP32) i poprawiona efektywność energetyczna znacznie zwiększają wydajność w takich procesach pracy, jak opracowywanie modeli 3D i symulacja inżynierii wspomaganej komputerowo (CAE). Korzystaj z ulepszonych możliwości obliczeń matematycznych 16-bitowych (BF16) w przypadku obciążeń o mieszanej precyzji.

Silnik transformatorowy

Transformer Engine radykalnie przyspiesza wydajność sztucznej inteligencji i poprawia wykorzystanie pamięci zarówno na potrzeby uczenia, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji Ada Lovelace, Transformer Engine inteligentnie skanuje warstwy sieci neuronowych architektury transformatorowej i automatycznie przekształca precyzję między FP8 a FP16, aby zapewnić większą wydajność sztucznej inteligencji oraz przyspieszyć szkolenie i wnioskowanie.

Wydajność i bezpieczeństwo

Procesor graficzny L40S jest zoptymalizowany pod kątem całodobowej pracy w centrum danych przedsiębiorstwa, zaprojektowany, zbudowany, przetestowany i wspierany przez firmę NVIDIA w celu zapewnienia maksymalnej wydajności, trwałości i czasu pracy. Procesor graficzny L40S spełnia najnowsze standardy dla centrów danych, jest zgodny z systemem budowania sprzętu sieciowego (NEBS) poziom 3 i oferuje funkcję bezpiecznego rozruchu z technologią root of trust, zapewniając dodatkową warstwę bezpieczeństwa dla centrów danych.

 
 

 

DLSS 3

Procesor graficzny L40S umożliwia ultraszybkie renderowanie i płynniejszą liczbę klatek na sekundę dzięki NVIDIA DLSS 3. Ta przełomowa technologia generowania klatek wykorzystuje głębokie uczenie się i najnowsze innowacje sprzętowe w ramach architektury Ada Lovelace i procesora graficznego L40S, w tym rdzenie Tensor czwartej generacji i przepływ optyczny Akcelerator, aby zwiększyć wydajność renderowania, zapewnić większą liczbę klatek na sekundę (FPS) i znacząco poprawić opóźnienia.

 
 

 

Obciążenia

Przyspieszenie wielu obciążeń

Wydajność

Przełomowa wydajność

Dane techniczne

Karta graficzna NVIDIA L40S

GPU Architecture NVIDIA Ada Lovelace architecture
GPU Memory 48GB GDDR6 with ECC
Memory Bandwidth 864GB/s
Interconnect Interface PCIe Gen4 x16: 64GB/s bidirectional
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores 18,176
NVIDIA Third-Generation RT Cores 142
NVIDIA Fourth-Generation Tensor Cores 568
RT Core Performance TFLOPS 212 
FP32 TFLOPS 91.6
TF32 Tensor Core TFLOPS 183 I 366*
BFLOAT16 Tensor Core TFLOPS 362.05 I 733*
FP16 Tensor Core 362.05 I 733*
FP8 Tensor Core 733 I 1,466*
Peak INT8 Tensor TOPS
Peak INT4 Tensor TOPS
733 I 1,466*
733 I 1,466*
Form Factor 4.4″ (H) x 10.5″ (L), dual slot
Display Ports 4x DisplayPort 1.4a
Max Power Consumption 350W
Power Connector 16-pin
Thermal Passive
Virtual GPU (vGPU) Software Support Yes
vGPU Profiles Supported See virtual GPU licensing guide
NVENC I NVDEC 3x l 3x (includes AV1 encode and decode)
Secure Boot With Root of Trust Yes
NEBS Ready Level 3
Multi-Instance GPU (MIG) Support No
NVIDIA® NVLink® Support No

*With Sparsity

Rozpocznij

Skontaktuj się z naszym Specjalistą z Działu Handlowego

Wyślij zapytanie