Przyspieszanie Obciążeń Wideo, AI i Grafiki

GPU NVIDIA L4 Tensor Core napędzany architekturą NVIDIA Ada Lovelace zapewnia uniwersalne, energooszczędne przyspieszenie dla wideo, AI, obliczeń wizualnych, grafiki, wirtualizacji i innych zastosowań. Zapakowany w niski profil, L4 jest opłacalnym, energooszczędnym rozwiązaniem o wysokiej przepustowości i niskim opóźnieniu w każdym serwerze, od brzegu sieci po centrum danych i chmurę.

Do 120 razy wyższa wydajność wideo AI

Zmierzone Osiągi: Porównanie 8x L4 z serwerem 2S Intel 8362 CPU, obejmujące końcową drogę przetwarzania wideo z dekodowaniem CV-CUDA®, wstępnym przetwarzaniem, wnioskowaniem (SegFormer), przetwarzaniem końcowym, kodowaniem oraz NVIDIA® TensorRT™ 8.6 w porównaniu do pipeline’u wyłącznie na CPU korzystającego z OpenCV 4.7 oraz wnioskowaniem PyTorch.

Doświadcz Wydajności Real-Time AI Video Pipeline

Przekształć aplikacje wideo dzięki mocy NVIDIA L4. Niezależnie od tego, czy transmitujesz na żywo do milionów widzów, umożliwiasz użytkownikom tworzenie kreatywnych historii, czy dostarczasz immersyjne doświadczenia rozszerzonej i wirtualnej rzeczywistości (AR/VR), serwery wyposażone w L4 mogą obsługiwać do 1,040 równoczesnych strumieni wideo AV1 w rozdzielczości 720p30 dla użytkowników mobilnych.¹

Dzięki rdzeniom Tensor czwartej generacji i 1,5 razy większej pamięci GPU, GPU NVIDIA L4 w połączeniu z biblioteką CV-CUDA® podnoszą zrozumienie treści wideo na nowy poziom. L4 oferuje 120 razy wyższą wydajność wideo AI niż rozwiązania oparte na CPU, pozwalając przedsiębiorstwom na uzyskanie w czasie rzeczywistym informacji do personalizacji treści, poprawy trafności wyszukiwania, wykrywania nieodpowiednich treści oraz wdrażania rozwiązań w inteligentnych przestrzeniach.

¹ Zmierzone osiągi: 8x L4 AV1 z kodowaniem w niskiej latencji przy ustawieniu P1 w rozdzielczości 720p30.

Zużywaj mniej energii i miejsca z L4

W miarę jak AI i wideo stają się coraz bardziej powszechne, zapotrzebowanie na wydajne i opłacalne obliczenia rośnie jak nigdy dotąd. GPU Tensor Core NVIDIA L4 oferują do 120 razy lepszą wydajność wideo AI, co przekłada się na do 99 procent lepszą efektywność energetyczną i niższy całkowity koszt posiadania w porównaniu do tradycyjnej infrastruktury opartej na CPU. Umożliwia to przedsiębiorstwom zmniejszenie zajmowanej przestrzeni rackowej oraz znaczne obniżenie ich śladu węglowego, jednocześnie pozwalając na skalowanie centrów danych dla znacznie większej liczby użytkowników.

Energia zaoszczędzona przez przejście z CPU na NVIDIA L4 w centrum danych o mocy 2 megawatów (MW) może zasilać prawie 2000 domów przez rok lub odpowiadać kompensacji węglowej 172,000 drzew rosnących przez 10 lat.²

Sprawdź Najnowszą Wydajność GPU w Aplikacjach HPC

² Wyniki z kalkulatora EPA wykorzystującego oszczędności na poziomie 1,677 MW.

Lepsza Efektywność Energetyczna

8x L4 vs. 2S Intel 8362 CPU server TCO comparison: end-to-end video pipeline with CV-CUDA pre- and postprocessing, decode, inference (SegFormer), encode, TRT 8.6 vs. CPU-only pipeline using OpenCV 4.7, PyTorch inference.

Przyspieszanie Wydajności Generatywnej AI

L4 oferuje 2,5x wyższą wydajność generatywnej AI.

Zmierzone osiągi: L4 vs T4 w generowaniu obrazów, 512×512 stabilna dyfuzja v2.1, FP16, TensorRT 8.5.2.

Generatywna AI dla obrazów i tekstu sprawia, że życie klientów staje się bardziej wygodne, a doświadczenia bardziej immersyjne w różnych branżach. NVIDIA L4 przyspiesza obliczeniowo intensywne wnioskowanie generatywnej AI, oferując do 2,5 razy wyższą wydajność w porównaniu do poprzedniej generacji GPU. Dzięki o 50 procent większej pojemności pamięci, L4 umożliwia generowanie większych obrazów, do 1024×768, co nie było możliwe w poprzedniej generacji GPU.

Optymalizacja Wydajności Graficznej

Ponad 4x wyższa wydajność renderowania w czasie rzeczywistym i ponad 3x wyższa wydajność Ray-Tracingu

Zmierzone osiągi: Renderowanie w czasie rzeczywistym: Wydajność NVIDIA Omniverse™ w renderowaniu w czasie rzeczywistym w rozdzielczości 1080p i 4K z wykorzystaniem NVIDIA Deep Learning Super Sampling (DLSS) 3.
Ray-Tracing: Średnia wydajność gier dla tytułów AAA wspierających Ray-Tracing i DLSS 3.

 

Dzięki rdzeniom RT trzeciej generacji i zasilanemu AI NVIDIA Deep Learning Super Sampling 3 (DLSS 3), NVIDIA L4 oferuje ponad 4 razy wyższą wydajność dla awatarów opartych na AI, wirtualnych światów NVIDIA Omniverse™, gier w chmurze oraz wirtualnych stacji roboczych. Te możliwości umożliwiają twórcom budowanie grafik i scen o jakości kinowej w czasie rzeczywistym, dostarczając immersyjnych doświadczeń wizualnych, które nie są możliwe do osiągnięcia przy użyciu CPU.

Przyspieszanie Obciążeń Efektywnie i Zrównoważenie

NVIDIA L4 jest integralną częścią platformy centrum danych NVIDIA. Zbudowana do obsługi wideo, AI, wirtualnych stacji roboczych NVIDIA RTX™ (vWS), grafiki, symulacji, nauki o danych oraz analizy danych, platforma przyspiesza ponad 3,000 aplikacji i jest dostępna wszędzie w skali, od centrum danych, przez brzeg sieci, po chmurę, zapewniając zarówno znaczące zyski wydajnościowe, jak i możliwości zwiększenia efektywności energetycznej.

Zoptymalizowana pod kątem standardowych wdrożeń, L4 oferuje niski profil, działając w limicie mocy 72W, co czyni ją efektywnym i opłacalnym rozwiązaniem dla każdego serwera lub instancji w chmurze w ekosystemie partnerów NVIDII.

Jak kupić NVIDIA vWS

Uprość Rozwój i Wdrażanie Dzięki Oprogramowaniu AI Gotowemu do Przedsiębiorstw

Zoptymalizowane w celu uproszczenia rozwoju i wdrażania AI, oprogramowanie NVIDIA AI Enterprise obejmuje przepływy pracy rozwiązań AI, frameworki, wstępnie wytrenowane modele oraz optymalizację infrastruktury, które są certyfikowane do działania na popularnych platformach centrum danych i standardowych systemach certyfikowanych przez NVIDIĘ™ z GPU NVIDIA L4.

NVIDIA AI Enterprise to dodatkowa licencja dla GPU NVIDIA L4, co sprawia, że AI jest dostępne dla niemal każdej organizacji przy najwyższej wydajności w zakresie treningu, wnioskowania i nauki o danych. NVIDIA AI Enterprise, w połączeniu z NVIDIA L4, upraszcza budowę platformy gotowej do AI, przyspiesza rozwój i wdrażanie AI oraz zapewnia wydajność, bezpieczeństwo i skalowalność, co pozwala na szybsze gromadzenie informacji i osiąganie wartości biznesowej.

Rozpocznij korzystanie z NVIDIA AI Enterprise Dowiedz się więcej o NVIDIA LaunchPad

Kluczowe zastosowania

Analiza Wideo i Transkodowanie

Procesor graficzny NVIDIA L4 Tensor Core oferuje wyjątkowe możliwości w zakresie analizy wideo i transkodowania. Zbudowany na architekturze Ada Lovelace, zapewnia znaczną poprawę wydajności w porównaniu do swojego poprzednika, T4. L4 może obsługiwać ponad 1000 jednoczesnych strumieni wideo AV1 w rozdzielczości 720p30 do zastosowań mobilnych, co czyni go idealnym rozwiązaniem dla usług przesyłania strumieniowego i sieci dostarczania treści. Zapewnia do 120 razy wyższą wydajność wideo AI w porównaniu z rozwiązaniami opartymi na procesorze, umożliwiając wgląd w czasie rzeczywistym w celu uzyskania spersonalizowanych treści, lepszą trafność wyszukiwania i inteligentne rozwiązania kosmiczne. Zaawansowane silniki przetwarzania wideo L4 obsługują kodowanie i dekodowanie AV1, a możliwości AI, obsługiwane przez rdzenie Tensor czwartej generacji, usprawniają zadania związane z analityką wideo, takie jak wykrywanie obiektów i zrozumienie treści. Dodatkowo energooszczędność L4 i jednogniazdowa, niskoprofilowa obudowa sprawiają, że nadaje się on do wdrażania w różnych środowiskach, od centrów danych po lokalizacje brzegowe. To połączenie wysokiej wydajności, wszechstronności i wydajności pozycjonuje NVIDIA L4 jako potężne rozwiązanie dla organizacji chcących zoptymalizować swoją infrastrukturę przetwarzania wideo i analityki.

Wnioskowanie AI

Procesor graficzny NVIDIA L4 Tensor Core to wydajne i wszechstronne rozwiązanie do obciążeń wnioskowania AI, oferujące znaczną poprawę wydajności w porównaniu do swojego poprzednika, T4. Zbudowany w oparciu o architekturę NVIDIA Ada Lovelace, L4 zawiera rdzenie Tensor czwartej generacji i rdzenie RT trzeciej generacji, dzięki czemu doskonale nadaje się do szerokiej gamy zastosowań AI. Dzięki 24 GB pamięci GDDR6 i energooszczędnej obudowie o mocy 72 W, L4 zapewnia do 2,7 razy większą wydajność generatywną AI niż poprzednia generacja. Doskonale sprawdza się w zadaniach wnioskowania AI w różnych dziedzinach, w tym w przetwarzaniu obrazu komputerowego, przetwarzaniu języka naturalnego i systemach rekomendacji. Silniki przetwarzania obrazu i wideo z akceleracją sprzętową, w tym możliwości kodowania/dekodowania AV1, sprawiają, że L4 jest szczególnie skuteczny w przypadku analiz wideo i transkodowania wykorzystujących sztuczną inteligencję. Jego jednogniazdowa, niskoprofilowa obudowa umożliwia łatwą integrację z głównymi serwerami, co czyni go idealnym wyborem dla organizacji chcących wdrożyć wnioskowanie AI na dużą skalę w centrach danych lub środowiskach przetwarzania brzegowego. Wszechstronność i wydajność L4 pozycjonuje go jako uniwersalny akcelerator wnioskowania AI, zdolny do obsługi różnorodnych obciążeń, od przesyłania strumieniowego wideo po odkrywanie leków.

Obliczenia brzegowe i głównego nurtu

Procesor graficzny NVIDIA A40 to potężne rozwiązanie dla zaawansowanych aplikacji renderujących, wykorzystujące zaawansowaną architekturę Ampere, aby zapewnić wyjątkową wydajność i efektywność. Zaprojektowany specjalnie z myślą o wymagających obciążeniach związanych z renderowaniem w branżach takich jak media i rozrywka, architektura i projektowanie motoryzacyjne, A40 oferuje solidną gamę rdzeni CUDA i rdzeni Tensor. Taka konfiguracja umożliwia obsługę złożonych zadań renderowania 3D, śledzenia promieni w czasie rzeczywistym i grafiki wspomaganej sztuczną inteligencją z niezwykłą szybkością i precyzją. A40 obsługuje technologię RTX firmy NVIDIA, umożliwiając fotorealistyczne renderowanie i symulację oświetlenia, cieni i odbić w czasie rzeczywistym, usprawniając twórczy przepływ pracy i skracając czas wprowadzania produktów na rynek dla twórców i projektantów treści cyfrowych. Wysoka przepustowość pamięci zapewnia płynną obsługę dużych zbiorów danych i skomplikowanych szczegółów wizualnych, a zgodność z profesjonalnymi narzędziami programowymi firmy NVIDIA, takimi jak RTX Renderer i Omniverse, upraszcza integrację z istniejącymi potokami. Ogólnie rzecz biorąc, procesor graficzny NVIDIA A40 na nowo definiuje możliwości renderowania najwyższej klasy, oferując niezrównaną wydajność i wierność, dzięki czemu profesjonaliści mogą tworzyć oszałamiające wrażenia wizualne i przesuwać granice tworzenia treści cyfrowych.

Grafika i wizualizacja

Procesor graficzny NVIDIA L4 Tensor Core oferuje znaczący postęp w zakresie obciążeń graficznych i wizualizacyjnych, zapewniając ponad 4 razy wyższą wydajność w porównaniu do swojego poprzednika, T4. Zbudowany na architekturze Ada Lovelace, L4 wyposażony jest w rdzenie RT trzeciej generacji i technologię DLSS 3 opartą na sztucznej inteligencji, dzięki czemu może obsługiwać wymagające zadania, takie jak awatary oparte na sztucznej inteligencji, wirtualne światy NVIDIA Omniverse, gry w chmurze i wirtualne stacje robocze. Możliwości te pozwalają twórcom tworzyć w czasie rzeczywistym grafikę o kinowej jakości i niezwykle szczegółowe sceny, zapewniając wciągające wrażenia wizualne, które wcześniej były nieosiągalne w przypadku procesorów. Wszechstronność L4 rozciąga się na profesjonalne zastosowania wizualizacyjne, w tym projektowanie wspomagane komputerowo (CAD) i inżynierię wspomaganą komputerowo (CAE), co czyni go doskonałym wyborem dla projektantów i inżynierów. Dzięki energooszczędnej obudowie o mocy 72 W i niskoprofilowej obudowie z jednym gniazdem, L4 można łatwo zintegrować z głównymi serwerami, umożliwiając organizacjom wdrażanie wydajnych funkcji graficznych i wizualizacyjnych w centrach danych, lokalizacjach brzegowych i środowiskach chmurowych.

Generatywna AI

Procesor graficzny NVIDIA L4 Tensor Core oferuje znaczące postępy w zakresie generatywnych obciążeń AI, zapewniając do 2,7 razy wyższą wydajność w porównaniu do swojego poprzednika, NVIDIA T4. Zbudowany na architekturze Ada Lovelace, L4 jest wyposażony w rdzenie Tensor czwartej generacji i 24 GB pamięci GDDR6, dzięki czemu może obsługiwać większe i bardziej złożone modele generatywnej sztucznej inteligencji. Ta zwiększona pojemność pamięci pozwala na generowanie obrazu do rozdzielczości 1024×768, co nie było możliwe w przypadku procesora graficznego T4. Wszechstronność L4 sprawia, że ​​doskonale nadaje się do szerokiej gamy generatywnych zastosowań sztucznej inteligencji, w tym generowania tekstu na obraz, awatarów zasilanych sztuczną inteligencją i zadań związanych z przetwarzaniem języka naturalnego 3 . Jego energooszczędna konstrukcja, działająca w zakresie mocy 72 W, czyni go atrakcyjną opcją do wdrożeń na dużą skalę w centrach danych i środowiskach przetwarzania brzegowego. Połączenie wydajności, wydajności i wszechstronności L4 sprawia, że ​​jest to potężne rozwiązanie dla organizacji, które chcą przyspieszyć swoje przepływy pracy związane z generatywną sztuczną inteligencją, przy jednoczesnym zachowaniu opłacalności i zrównoważonego rozwoju.

Specyfikacje Produktu

Format: L4
FP32: 30.3 teraFLOPS
TF32 Tensor Core: 120 teraFLOPS*
FP16 Tensor Core: 242 teraFLOPS*
BFLOAT16 Tensor Core: 242 teraFLOPS*
FP8 Tensor Core: 485 teraFLOPS*
INT8 Tensor Core: 485 TOPs*
Pamięć GPU: 24 GB
Przepustowość pamięci GPU: 300 GB/s
Dekodery NVENC | NVDEC | JPEG: 2 | 4 | 4
Maksymalna moc cieplna (TDP): 72 W
Format: Niski profil, jednosesyjny, PCIe
Interfejs: PCIe Gen4 x16 64GB/s
Opcje serwera: Systemy certyfikowane przez partnerów i NVIDIA z 1–8 GPU

*Wartości pokazane przy użyciu rzadkości. Specyfikacje są o połowę niższe bez rzadkości.

Wymiary NVIDIA L4 GPU

Rozpocznij korzystanie z wczesnego dostępu do L4 w Google Cloud.

Złóż wniosek o wczesny dostęp