Najpotężniejszy Uniwersalny GPU

Odkryj przełomową wydajność w obsłudze wielu obciążeń z GPU NVIDIA L40S. Łącząc potężne obliczenia AI z najlepszą w swojej klasie akceleracją grafiki i mediów, GPU L40S jest zaprojektowany do obsługi następnej generacji obciążeń w centrach danych — od generatywnej AI i wnioskowania oraz treningu dużych modeli językowych (LLM) po grafikę 3D, renderowanie i wideo.

NVIDIA i Globalni Producenci Systemów Centrum Danych Napędzają Generatywną AI i Cyfryzację Przemysłową

Serwery NVIDIA OVX™ z nowymi GPU NVIDIA, które przyspieszą trening i wnioskowanie, a także obciążenia związane z intensywną grafiką, wkrótce będą dostępne od Dell, Hewlett Packard Enterprise, Lenovo, Supermicro i innych producentów.

Przeczytaj komunikat prasowy

Najważniejsze cechy

Uniwersalna wydajność

Wydajność Tensorów

1466

TFLOPS¹

Wydajność Rdzeni RT

212

TFLOPS

Wydajność przy Precyzji Pojedynczej

92

TFLOPS

Cechy

Napędzany architekturą NVIDIA Ada Lovelace

Rdzenie Tensor czwartej generacji

Sprzętowe wsparcie dla strukturalnej rzadkości oraz zoptymalizowany format TF32 zapewniają natychmiastowe zyski wydajności dla szybszego szkolenia modeli AI i nauki o danych. Przyspiesz możliwości grafiki wspieranej AI za pomocą DLSS, umożliwiając zwiększenie rozdzielczości z lepszą wydajnością w wybranych aplikacjach.

Rdzenie RT trzeciej generacji

Zwiększona przepustowość oraz jednoczesne możliwości śledzenia promieni i cieniowania poprawiają wydajność śledzenia promieni, przyspieszając renderowanie dla projektowania produktów, architektury, inżynierii oraz przepływów pracy w budownictwie. Zobacz realistyczne projekty w akcji dzięki sprzętowemu przyspieszeniu rozmycia ruchu i oszałamiającym animacjom w czasie rzeczywistym.

Rdzenie CUDA

Przyspieszona przepustowość operacji zmiennoprzecinkowych pojedynczej precyzji (FP32) oraz poprawiona efektywność energetyczna znacząco zwiększają wydajność dla przepływów pracy, takich jak rozwój modeli 3D i symulacje inżynierii wspomaganej komputerowo (CAE). Wykorzystaj ulepszone możliwości matematyki 16-bitowej (BF16) dla obciążeń o mieszanej precyzji.

Silnik Transformatorów

Silnik Transformatorów znacznie przyspiesza wydajność AI i poprawia wykorzystanie pamięci zarówno podczas treningu, jak i wnioskowania. Wykorzystując moc rdzeni Tensor czwartej generacji architektury Ada Lovelace, Silnik Transformatorów inteligentnie skanuje warstwy architektury sieci neuronowych transformatorów i automatycznie przekształca precyzje między FP8 i FP16, aby zapewnić szybszą wydajność AI i przyspieszyć trening oraz wnioskowanie.

Wydajność i Bezpieczeństwo

GPU L40S jest zoptymalizowany do pracy w trybie 24/7 w centrach danych przedsiębiorstw i został zaprojektowany, zbudowany, przetestowany oraz jest wspierany przez NVIDIĘ, aby zapewnić maksymalną wydajność, trwałość i dostępność. GPU L40S spełnia najnowsze standardy centrów danych, jest zgodny z poziomem NEBS Level 3 oraz oferuje bezpieczny rozruch z technologią podstawy zaufania, co zapewnia dodatkową warstwę bezpieczeństwa dla centrów danych.

DLSS 3

GPU L40S umożliwia ultraszybkie renderowanie i płynniejsze liczby klatek na sekundę (FPS) dzięki technologii NVIDIA DLSS 3. Ta przełomowa technologia generowania klatek wykorzystuje głębokie uczenie i najnowsze innowacje sprzętowe w ramach architektury Ada Lovelace i GPU L40S, w tym rdzenie Tensor czwartej generacji oraz akcelerator optycznego przepływu, aby zwiększyć wydajność renderowania, dostarczać wyższą liczbę FPS oraz znacznie poprawić opóźnienia.

Dowiedz się więcej o architekturze GPU NVIDIA Ada Lovelace

Obciążenia

Przyspieszenie wieloobciążeniowe

Generatywna AI

Tworzenie nowych usług, wniosków i oryginalnych treści.

Dzięki możliwościom przyspieszania AI, grafiki i mediów nowej generacji, L40S oferuje do 5 razy wyższą wydajność wnioskowania w porównaniu do poprzedniej generacji NVIDIA A40. Z przełomową wydajnością i pojemnością pamięci wynoszącą 48 gigabajtów (GB), L40S jest idealną platformą do przyspieszania multimodalnych obciążeń generatywnej AI.

Dowiedz się więcej o Generatywnej AI

Trening i Wnioskowanie Dużych Modeli Językowych (LLM)

Przyspieszanie obciążeń treningowych i wnioskowania AI.

Rdzenie Tensor czwartej generacji z obsługą FP8 oferują wyjątkową wydajność obliczeniową AI, przyspieszając trening i wnioskowanie nowoczesnych modeli LLM oraz generatywnej AI.

Poznaj korzyści z NVIDIA AI Inference

Renderowanie i Grafika 3D

Zasilaj wysokiej jakości przepływy pracy kreatywnych z wykorzystaniem grafiki NVIDIA RTX™.

Dzięki rdzeniom RT trzeciej generacji, które oferują do 2 razy wyższą wydajność śledzenia promieni w czasie rzeczywistym w porównaniu do poprzedniej generacji, możliwe jest tworzenie oszałamiającej treści wizualnej oraz wysokiej jakości przepływów pracy kreatywnych, od renderowania interaktywnego po produkcję w czasie rzeczywistym.

Dowiedz się więcej o technologii NVIDIA RTX

NVIDIA Omniverse

Twórz i obsługuj aplikacje Metawersum.

NVIDIA Omniverse™ umożliwia łączenie, rozwijanie i obsługiwanie nowej fali aplikacji cyfryzacji przemysłowej. Dzięki potężnym możliwościom grafiki RTX i AI, L40S oferuje wyjątkową wydajność dla przepływów pracy 3D i symulacji opartych na Universal Scene Description (OpenUSD) zbudowanych w Omniverse.

Dowiedz się więcej o NVIDIA Omniverse

NVIDIA OVX L40S

Skalowalna infrastruktura centrum danych dla wydajnych obliczeń AI i grafiki.

W połączeniu z technologią Ethernet NVIDIA Spectrum-X oraz oprogramowaniem NVIDIA AI Enterprise, NVIDIA OVX L40S zapewnia wiodącą w branży wydajność, przyspieszając transformację przedsiębiorstw dzięki generatywnej AI.

Dowiedz się więcej

Wydajność

Przełomowa Wydajność

Kluczowe zastosowania

Generatywna AI i duże modele językowe (LLM)

The NVIDIA L40S GPU is a powerful solution for NVIDIA Omniverse and 3D content creation, offering exceptional performance and versatility in data center environments. Built on the Ada Lovelace architecture, it features third-generation RT cores for enhanced real-time ray tracing and fourth-generation Tensor Cores that support AI-driven features, significantly improving the quality and speed of 3D workflows. As the engine of NVIDIA Omniverse in the data center, the L40S delivers stunning real-time ray tracing and AI-accelerated capabilities, making it ideal for extended reality (XR) and virtual production tasks. With 48GB of GDDR6 memory, it can handle complex 3D models, high-resolution textures, and large-scale simulations with ease, enabling creative professionals to work on intricate designs and render photorealistic scenes more efficiently. The L40S’s support for Universal Scene Description (OpenUSD)-based 3D workflows within the Omniverse ecosystem enhances collaboration and streamlines production pipelines. Its performance in Omniverse applications is described as „stunning,” positioning it as a top-tier solution for organizations looking to leverage cutting-edge technologies in virtual world creation, 3D visualization, and immersive content production.

NVIDIA Omniverse i tworzenie treści 3D

Procesor graficzny NVIDIA L40S to potężny procesor NVIDIA Omniverse i tworzenia treści 3D, oferujący wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany w oparciu o architekturę Ada Lovelace, zawiera rdzenie RT trzeciej generacji zapewniające ulepszone śledzenie promieni w czasie rzeczywistym oraz rdzenie Tensor czwartej generacji, które obsługują funkcje oparte na sztucznej inteligencji, znacznie poprawiając jakość i szybkość przepływów pracy 3D. Jako silnik NVIDIA Omniverse w centrum danych, L40S zapewnia oszałamiające możliwości śledzenia promieni w czasie rzeczywistym i akceleracji sztucznej inteligencji, dzięki czemu idealnie nadaje się do zadań w rozszerzonej rzeczywistości (XR) i wirtualnej produkcji. Dzięki 48 GB pamięci GDDR6 z łatwością radzi sobie ze złożonymi modelami 3D, teksturami o wysokiej rozdzielczości i symulacjami na dużą skalę, umożliwiając kreatywnym profesjonalistom pracę nad skomplikowanymi projektami i wydajniejsze renderowanie fotorealistycznych scen. Obsługa przez monitor L40S procesów 3D opartych na uniwersalnym opisie scen (OpenUSD) w ekosystemie Omniverse usprawnia współpracę i usprawnia procesy produkcyjne. Jego wydajność w aplikacjach Omniverse określa się jako „oszałamiającą”, co stawia go jako najwyższej klasy rozwiązanie dla organizacji chcących wykorzystać najnowocześniejsze technologie do tworzenia wirtualnego świata, wizualizacji 3D i produkcji treści immersyjnych.

Szkolenie i wnioskowanie AI (sztucznej inteligencji)

Procesor graficzny NVIDIA L40S to potężne rozwiązanie do obciążeń związanych ze szkoleniem i wnioskowaniem AI, oferujące wyjątkową wydajność i wszechstronność w środowiskach centrów danych. Zbudowany na architekturze Ada Lovelace, zawiera 18 176 rdzeni CUDA i 568 rdzeni Tensor czwartej generacji, zapewniając do 5 razy lepszą wydajność zmiennoprzecinkową pojedynczej precyzji (FP32) w porównaniu do A100. Jego zaawansowany silnik transformatorowy inteligentnie zarządza precyzją między FP8 a FP16, znacznie zwiększając wydajność sztucznej inteligencji zarówno na potrzeby uczenia, jak i wnioskowania modeli opartych na transformatorach. Dzięki 48 GB pamięci GDDR6 L40S może skutecznie obsługiwać złożone zadania AI i modele z dużymi językami. W przypadku szkolenia AI osiem procesorów graficznych L40S w głównym serwerze pozwala na 0,8-krotny wzrost wydajności w porównaniu z systemem 8-GPU A100 dla modeli MLPerf. W zadaniach wnioskowania L40S wykazuje imponujące możliwości, często dorównujące lub przekraczające wydajność A100 w różnych testach MLPerf. To sprawia, że L40S szczególnie dobrze nadaje się do wdrażania i uruchamiania wyrafinowanych modeli sztucznej inteligencji w środowiskach produkcyjnych, oferując organizacjom wydajne i wydajne rozwiązanie dla ich obciążeń związanych ze sztuczną inteligencją.

Grafika i wizualizacja

Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie obciążeń graficznych i wizualizacyjnych, co czyni go potężnym rozwiązaniem do profesjonalnych zastosowań w takich dziedzinach, jak projektowanie wspomagane komputerowo (CAD), produkcja wirtualna i wizualizacja naukowa. Zbudowany na architekturze Ada Lovelace, zawiera rdzenie RT trzeciej generacji, które znacznie zwiększają wydajność śledzenia promieni w czasie rzeczywistym, zapewniając oszałamiającą wierność wizualną i fotorealistyczne renderowanie. 48 GB pamięci GDDR6 modelu L40S pozwala z łatwością obsługiwać złożone modele 3D, tekstury o wysokiej rozdzielczości i duże zbiory danych, umożliwiając profesjonalistom pracę nad skomplikowanymi projektami i wizualizacjami bez wąskich gardeł wydajności. Rdzenie Tensor czwartej generacji obsługują funkcje graficzne wzmocnione sztuczną inteligencją, takie jak DLSS (Deep Learning Super Sampling), które mogą zwiększyć wydajność i jakość obrazu w obsługiwanych aplikacjach. W połączeniu z oprogramowaniem NVIDIA RTX Virtual Workstation (vWS), L40S może zasilać wirtualne stacje robocze o wysokiej wydajności z centrum danych, zapewniając elastyczny dostęp do wymagających aplikacji graficznych z dowolnego urządzenia. To sprawia, że NVIDIA L40S jest doskonałym wyborem dla organizacji, które chcą ulepszyć swoje możliwości wizualizacji, poprawić efektywność przepływu pracy i dostarczać wysokiej jakości treści wizualne w różnych branżach.

Kodowanie wideo i strumieniowanie

Procesor graficzny NVIDIA L40S oferuje wyjątkowe możliwości w zakresie kodowania wideo i przesyłania strumieniowego, co czyni go potężnym rozwiązaniem do strumieniowego przesyłania transmisji, produkcji wideo i transkrypcji. Zbudowany na architekturze Ada Lovelace, L40S posiada trzy silniki kodowania i dekodowania wideo, co znacznie zwiększa jego zdolność do jednoczesnej obsługi wielu strumieni wideo wysokiej jakości. Kluczowym postępem jest dodanie obsługi kodowania i dekodowania AV1, która zapewnia przełomową wydajność i niższy całkowity koszt posiadania dla twórców treści i platform przesyłania strumieniowego. Ta funkcja pozwala na uzyskanie wyższej jakości wideo przy niższych przepływnościach, z korzyścią zarówno dla dostawców treści, jak i użytkowników końcowych. L40S może obsługiwać ponad 1000 jednoczesnych strumieni wideo AV1 w rozdzielczości 720p30 do zastosowań mobilnych, co czyni go idealnym rozwiązaniem dla usług przesyłania strumieniowego i sieci dostarczania treści. Potężne przyspieszenie sprzętowe w połączeniu z 48 GB pamięci GDDR6 umożliwia wydajne przetwarzanie złożonych obciążeń wideo, w tym transkodowanie w czasie rzeczywistym i tworzenie treści w wysokiej rozdzielczości. Organizacjom zajmującym się transmisją strumieniową na żywo, usługami wideo na żądanie lub produkcją wirtualną NVIDIA L40S zapewnia wydajność i wszechstronność niezbędną do spełnienia wymagań współczesnego tworzenia i dystrybucji treści wideo.

Dane techniczne

Karta graficzna NVIDIA L40S

GPU Architecture	NVIDIA Ada Lovelace architecture
GPU Memory	48GB GDDR6 with ECC
Memory Bandwidth	864GB/s
Interconnect Interface	PCIe Gen4 x16: 64GB/s bidirectional
NVIDIA Ada Lovelace Architecture-Based CUDA® Cores	18,176
NVIDIA Third-Generation RT Cores	142
NVIDIA Fourth-Generation Tensor Cores	568
RT Core Performance TFLOPS	212
FP32 TFLOPS	91.6
TF32 Tensor Core TFLOPS	183 I 366*
BFLOAT16 Tensor Core TFLOPS	362.05 I 733*
FP16 Tensor Core	362.05 I 733*
FP8 Tensor Core	733 I 1,466*
Peak INT8 Tensor TOPS Peak INT4 Tensor TOPS	733 I 1,466* 733 I 1,466*
Form Factor	4.4″ (H) x 10.5″ (L), dual slot
Display Ports	4x DisplayPort 1.4a
Max Power Consumption	350W
Power Connector	16-pin
Thermal	Passive
Virtual GPU (vGPU) Software Support	Yes
vGPU Profiles Supported	See virtual GPU licensing guide
NVENC I NVDEC	3x l 3x (includes AV1 encode and decode)
Secure Boot With Root of Trust	Yes
NEBS Ready	Level 3
Multi-Instance GPU (MIG) Support	No
NVIDIA® NVLink® Support	No

*With Sparsity

Wymiary NVIDIA L40S GPU

Rozpocznij

Skontaktuj się z naszym Specjalistą z Działu Handlowego

Wyślij zapytanie

NVIDIA L40S