Najpotężniejszy Uniwersalny GPU

Odkryj przełomową wydajność w obsłudze wielu obciążeń z GPU NVIDIA L40S. Łącząc potężne obliczenia AI z najlepszą w swojej klasie akceleracją grafiki i mediów, GPU L40S jest zaprojektowany do obsługi następnej generacji obciążeń w centrach danych — od generatywnej AI i wnioskowania oraz treningu dużych modeli językowych (LLM) po grafikę 3D, renderowanie i wideo.

NVIDIA i Globalni Producenci Systemów Centrum Danych Napędzają Generatywną AI i Cyfryzację Przemysłową

Serwery NVIDIA OVX™ z nowymi GPU NVIDIA, które przyspieszą trening i wnioskowanie, a także obciążenia związane z intensywną grafiką, wkrótce będą dostępne od Dell, Hewlett Packard Enterprise, Lenovo, Supermicro i innych producentów.

Przeczytaj komunikat prasowy

Najważniejsze cechy

Uniwersalna wydajność

Wydajność Tensorów

1466

TFLOPS¹

Wydajność Rdzeni RT

212

TFLOPS

Wydajność przy Precyzji Pojedynczej

92

TFLOPS

Cechy

Napędzany architekturą NVIDIA Ada Lovelace

Rdzenie Tensor czwartej generacji

Sprzętowe wsparcie dla strukturalnej rzadkości oraz zoptymalizowany format TF32 zapewniają natychmiastowe zyski wydajności dla szybszego szkolenia modeli AI i nauki o danych. Przyspiesz możliwości grafiki wspieranej AI za pomocą DLSS, umożliwiając zwiększenie rozdzielczości z lepszą wydajnością w wybranych aplikacjach.

Rdzenie RT trzeciej generacji

Zwiększona przepustowość oraz jednoczesne możliwości śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie dla projektowania produktów, architektury, inżynierii oraz przepływów pracy w budownictwie. Zobacz realistyczne projekty w akcji dzięki sprzętowemu przyspieszeniu rozmycia ruchu i oszałamiającym animacjom w czasie rzeczywistym.

Rdzenie CUDA

Przyspieszona przepustowość operacji zmiennoprzecinkowych pojedynczej precyzji (FP32) oraz poprawiona efektywność energetyczna znacząco zwiększają wydajność dla przepływów pracy, takich jak rozwój modeli 3D i symulacje inżynierii wspomaganej komputerowo (CAE). Wykorzystaj ulepszone możliwości matematyki 16-bitowej (BF16) dla obciążeń o mieszanej precyzji.

Silnik Transformatorów

Silnik Transformatorów znacznie przyspiesza wydajność AI i poprawia wykorzystanie pamięci zarówno podczas treningu, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji architektury Ada Lovelace, Silnik Transformatorów inteligentnie skanuje warstwy architektury sieci neuronowych transformatorów i automatycznie przekształca precyzje między FP8 i FP16, aby zapewnić szybszą wydajność AI i przyspieszyć trening oraz wnioskowanie.

Wydajność i Bezpieczeństwo

GPU L40S jest zoptymalizowany do pracy w trybie 24/7 w centrach danych przedsiębiorstw i został zaprojektowany, zbudowany, przetestowany oraz jest wspierany przez NVIDIĘ, aby zapewnić maksymalną wydajność, trwałość i dostępność. GPU L40S spełnia najnowsze standardy centrów danych, jest zgodny z poziomem NEBS Level 3 oraz oferuje bezpieczny rozruch z technologią podstawy zaufania, co zapewnia dodatkową warstwę bezpieczeństwa dla centrów danych.

 
 

 

DLSS 3

GPU L40S umożliwia ultraszybkie renderowanie i płynniejsze liczby klatek na sekundę (FPS) dzięki technologii NVIDIA DLSS 3. Ta przełomowa technologia generowania klatek wykorzystuje głębokie uczenie i najnowsze innowacje sprzętowe w ramach architektury Ada Lovelace i GPU L40S, w tym rdzenie Tensor czwartej generacji oraz akcelerator optycznego przepływu, aby zwiększyć wydajność renderowania, dostarczać wyższą liczbę FPS oraz znacznie poprawić opóźnienia.

 
 

 

Obciążenia

Przyspieszenie wieloobciążeniowe

Wydajność

Przełomowa Wydajność

Kluczowe zastosowania

Generatywna AI i duże modele językowe (LLM)

The NVIDIA L40S GPU is a powerful solution for NVIDIA Omniverse and 3D content creation, offering exceptional performance and versatility in data center environments. Built on the Ada Lovelace architecture, it features third-generation RT cores for enhanced real-time ray tracing and fourth-generation Tensor Cores that support AI-driven features, significantly improving the quality and speed of 3D workflows. As the engine of NVIDIA Omniverse in the data center, the L40S delivers stunning real-time ray tracing and AI-accelerated capabilities, making it ideal for extended reality (XR) and virtual production tasks. With 48GB of GDDR6 memory, it can handle complex 3D models, high-resolution textures, and large-scale simulations with ease, enabling creative professionals to work on intricate designs and render photorealistic scenes more efficiently. The L40S’s support for Universal Scene Description (OpenUSD)-based 3D workflows within the Omniverse ecosystem enhances collaboration and streamlines production pipelines. Its performance in Omniverse applications is described as „stunning,” positioning it as a top-tier solution for organizations looking to leverage cutting-edge technologies in virtual world creation, 3D visualization, and immersive content production.

NVIDIA Omniverse i tworzenie treści 3D

Procesor graficzny NVIDIA L40S to potężny procesor NVIDIA Omniverse i tworzenia treści 3D, oferujący wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany w oparciu o architekturę Ada Lovelace, zawiera rdzenie RT trzeciej generacji zapewniające ulepszone śledzenie promieni w czasie rzeczywistym oraz rdzenie Tensor czwartej generacji, które obsługują funkcje oparte na sztucznej inteligencji, znacznie poprawiając jakość i szybkość przepływów pracy 3D. Jako silnik NVIDIA Omniverse w centrum danych, L40S zapewnia oszałamiające możliwości śledzenia promieni w czasie rzeczywistym i akceleracji sztucznej inteligencji, dzięki czemu idealnie nadaje się do zadań w rozszerzonej rzeczywistości (XR) i wirtualnej produkcji. Dzięki 48 GB pamięci GDDR6 z łatwością radzi sobie ze złożonymi modelami 3D, teksturami o wysokiej rozdzielczości i symulacjami na dużą skalę, umożliwiając kreatywnym profesjonalistom pracę nad skomplikowanymi projektami i wydajniejsze renderowanie fotorealistycznych scen. Obsługa przez monitor L40S procesów 3D opartych na uniwersalnym opisie scen (OpenUSD) w ekosystemie Omniverse usprawnia współpracę i usprawnia procesy produkcyjne. Jego wydajność w aplikacjach Omniverse określa się jako „oszałamiającą”, co stawia go jako najwyższej klasy rozwiązanie dla organizacji chcących wykorzystać najnowocześniejsze technologie do tworzenia wirtualnego świata, wizualizacji 3D i produkcji treści immersyjnych.

Szkolenie i wnioskowanie AI (sztucznej inteligencji)

Procesor graficzny NVIDIA L40S to potężne rozwiązanie do obciążeń związanych ze szkoleniem i wnioskowaniem AI, oferujące wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany na architekturze Ada Lovelace, zawiera 18 176 rdzeni CUDA i 568 rdzeni Tensor czwartej generacji, zapewniając do 5 razy lepszą wydajność zmiennoprzecinkową pojedynczej precyzji (FP32) w porównaniu do A100. Jego zaawansowany silnik transformatorowy inteligentnie zarządza precyzją między FP8 a FP16, znacznie zwiększając wydajność sztucznej inteligencji zarówno na potrzeby uczenia, jak i wnioskowania modeli opartych na transformatorach. Dzięki 48 GB pamięci GDDR6 L40S może skutecznie obsługiwać złożone zadania AI i modele z dużymi językami. W przypadku szkolenia AI osiem procesorów graficznych L40S w głównym serwerze pozwala na 0,8-krotny wzrost wydajności w porównaniu z systemem 8-GPU A100 dla modeli MLPerf. W zadaniach wnioskowania L40S wykazuje imponujące możliwości, często dorównujące lub przekraczające wydajność A100 w różnych testach MLPerf. To sprawia, że ​​L40S szczególnie dobrze nadaje się do wdrażania i uruchamiania wyrafinowanych modeli sztucznej inteligencji w środowiskach produkcyjnych, oferując organizacjom wydajne i wydajne rozwiązanie dla ich obciążeń związanych ze sztuczną inteligencją.

Grafika i wizualizacja

Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie obciążeń graficznych i wizualizacyjnych, co czyni go potężnym rozwiązaniem do profesjonalnych zastosowań w takich dziedzinach, jak projektowanie wspomagane komputerowo (CAD), produkcja wirtualna i wizualizacja naukowa. Zbudowany na architekturze Ada Lovelace, zawiera rdzenie RT trzeciej generacji, które znacznie zwiększają wydajność śledzenia promieni w czasie rzeczywistym, zapewniając oszałamiającą wierność wizualną i fotorealistyczne renderowanie. 48 GB pamięci GDDR6 modelu L40S pozwala z łatwością obsługiwać złożone modele 3D, tekstury o wysokiej rozdzielczości i duże zbiory danych, umożliwiając profesjonalistom pracę nad skomplikowanymi projektami i wizualizacjami bez wąskich gardeł wydajności. Rdzenie Tensor czwartej generacji obsługują funkcje graficzne wzmocnione sztuczną inteligencją, takie jak DLSS (Deep Learning Super Sampling), które mogą zwiększyć wydajność i jakość obrazu w obsługiwanych aplikacjach. W połączeniu z oprogramowaniem NVIDIA RTX Virtual Workstation (vWS), L40S może zasilać wirtualne stacje robocze o wysokiej wydajności z centrum danych, zapewniając elastyczny dostęp do wymagających aplikacji graficznych z dowolnego urządzenia. To sprawia, że ​​NVIDIA L40S jest doskonałym wyborem dla organizacji, które chcą ulepszyć swoje możliwości wizualizacji, poprawić efektywność przepływu pracy i dostarczać wysokiej jakości treści wizualne w różnych branżach.

Kodowanie wideo i strumieniowanie

Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie kodowania wideo i przesyłania strumieniowego, co czyni go potężnym rozwiązaniem do strumieniowego przesyłania transmisji, produkcji wideo i transkrypcji. Zbudowany na architekturze Ada Lovelace, L40S posiada trzy silniki kodowania i dekodowania wideo, co znacznie zwiększa jego zdolność do jednoczesnej obsługi wielu strumieni wideo wysokiej jakości. Kluczowym postępem jest dodanie obsługi kodowania i dekodowania AV1, która zapewnia przełomową wydajność i niższy całkowity koszt posiadania dla twórców treści i platform przesyłania strumieniowego. Ta funkcja pozwala na uzyskanie wyższej jakości wideo przy niższych przepływnościach, z korzyścią zarówno dla dostawców treści, jak i użytkowników końcowych. L40S może obsługiwać ponad 1000 jednoczesnych strumieni wideo AV1 w rozdzielczości 720p30 do zastosowań mobilnych, co czyni go idealnym rozwiązaniem dla usług przesyłania strumieniowego i sieci dostarczania treści. Potężne przyspieszenie sprzętowe w połączeniu z 48 GB pamięci GDDR6 umożliwia wydajne przetwarzanie złożonych obciążeń wideo, w tym transkodowanie w czasie rzeczywistym i tworzenie treści w wysokiej rozdzielczości. Organizacjom zajmującym się transmisją strumieniową na żywo, usługami wideo na żądanie lub produkcją wirtualną NVIDIA L40S zapewnia wydajność i wszechstronność niezbędną do spełnienia wymagań współczesnego tworzenia i dystrybucji treści wideo.

Dane techniczne

Karta graficzna NVIDIA L40S

GPU Architecture NVIDIA Ada Lovelace architecture
GPU Memory 48GB GDDR6 with ECC
Memory Bandwidth 864GB/s
Interconnect Interface PCIe Gen4 x16: 64GB/s bidirectional
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores 18,176
NVIDIA Third-Generation RT Cores 142
NVIDIA Fourth-Generation Tensor Cores 568
RT Core Performance TFLOPS 212 
FP32 TFLOPS 91.6
TF32 Tensor Core TFLOPS 183 I 366*
BFLOAT16 Tensor Core TFLOPS 362.05 I 733*
FP16 Tensor Core 362.05 I 733*
FP8 Tensor Core 733 I 1,466*
Peak INT8 Tensor TOPS
Peak INT4 Tensor TOPS
733 I 1,466*
733 I 1,466*
Form Factor 4.4″ (H) x 10.5″ (L), dual slot
Display Ports 4x DisplayPort 1.4a
Max Power Consumption 350W
Power Connector 16-pin
Thermal Passive
Virtual GPU (vGPU) Software Support Yes
vGPU Profiles Supported See virtual GPU licensing guide
NVENC I NVDEC 3x l 3x (includes AV1 encode and decode)
Secure Boot With Root of Trust Yes
NEBS Ready Level 3
Multi-Instance GPU (MIG) Support No
NVIDIA® NVLink® Support No

*With Sparsity

Wymiary NVIDIA L40S GPU

Rozpocznij

Skontaktuj się z naszym Specjalistą z Działu Handlowego

Wyślij zapytanie