انویدیا معماری گرافیکی Blackwell را معرفی کرد. بهبود پنج برابری در عملکرد پردازش هوش مصنوعی

پردازنده گرافیکی B200 استفاده از 208 میلیارد ترانزیستور و 192 گیگابایت حافظه HBM3e نسبت به نسل قبلی عملکرد پردازش هوش مصنوعی بهتری دارد.

انویدیا بالاخره معماری نسل جدید پردازنده های گرافیکی خود با نام بلک ول را رسما معرفی کرد. مدتی است که انویدیا تراشه های گرافیکی خود را با معماری مشترک هم برای خانواده های بازی و هم برای مراکز داده منتشر کرده است و اینجاست که چیپست های مرکز داده Green Team مورد توجه قرار می گیرند. پردازنده‌های گرافیکی B200 اولین عضو خانواده بلک‌ول خواهند بود که قرار است در سال 2024 عرضه شوند.

پردازنده‌های گرافیکی سری Blackwell معمولاً تا 5 برابر عملکرد هوش مصنوعی قوی‌تری نسبت به سری Hopper H100 دارند. انویدیا با معماری Blackwell هسته‌های هوش مصنوعی و تراشه‌های گرافیکی Tensor خود از طراحی ریزتراشه یا MCM برای اولین بار در تولید GPU استفاده می‌کند. از دو استفاده می کند GPU را در قالب قرار می دهد.

در طراحی این تراشه ها، انویدیا از 104 میلیارد ترانزیستور در هر قسمت از پردازنده گرافیکی استفاده می کند که در مجموع 208 میلیارد ترانزیستور بر اساس فرآیند تولید تراشه های 4 نانومتری TSMC را تشکیل می دهد. جالب اینجاست که هم Synopsys و هم TSMC از فناوری CuLitho انویدیا برای تولید تراشه های Blackwell استفاده کردند که تولید هر تراشه را تسریع می بخشد تا تولید نسل بعدی شتاب دهنده های هوش مصنوعی را تسریع بخشد.

پردازنده های گرافیکی B100 مجهز به رابط باس حافظه با پهنای باند 10 ترابایت بر ثانیه هستند که تبادل اطلاعات از تراشه به تراشه را بسیار سریع می کند. در واقع، این دو تراشه به عنوان یک پردازنده واحد در یک شکل واحد عمل می کنند که دارای حافظه پنهان GPU منسجم است.

بخوانید  توییت GTA 6 تاکنون با 1.9 میلیون لایک رکورد شکسته است

تراشه مرکز داده بلک ول

در مقایسه با سری هاپر، پردازنده‌های بلک‌ول انویدیا بیش از 128 میلیون ترانزیستور دارند که در مجموع 20 پتافلاپ قدرت پردازش گرافیکی در هر تراشه و 5 برابر بهبود در عملکرد هوش مصنوعی ارائه می‌کنند. این پردازنده گرافیکی با 8 بانک حافظه HBM3e، مجهز به سریعترین فناوری حافظه در جهان است و پهنای باند حافظه 8 ترابایت بر ثانیه را در رابط باس حافظه 8192 بیتی ارائه می کند. در این چیپست قدرتمند از 192 گیگابایت حافظه HBM3e نیز استفاده شده است. در اینجا خلاصه ای از مشخصات این GPU در مقایسه با Hopper آمده است:

  • 20 پتافلاپ قدرت پردازش گرافیکی FP8 (معادل 2.5 برابر سری Hopper)
  • 20 پتافلاپ قدرت پردازش گرافیکی FP6 (معادل 2.5 برابر سری Hopper)
  • 40 پتافلاپ قدرت پردازش گرافیکی FP4 (معادل 5 برابر سری Hopper)
  • پارامترهای 740B (معادل قیف سری 6 بار)
  • نرخ پارامتر در ثانیه 34T (معادل قیف سری 5 بار)
  • پهنای باند NVLINK 7.2 ترابایت بر ثانیه (معادل 4 برابر سری Hopper)

انویدیا چیپست بلک ول را به عنوان یک پلتفرم کامل تحت نام سوپرتراشه GB200 به فروش می رساند که شامل دو سری از این نوع پردازنده ها است که از 4 هسته پردازشی و یک پردازنده Grace با 72 هسته CPU تشکیل شده است. با معماری ARM Neoverse V2 در آن گنجانده شده است. این پردازنده ها از پروتکل 900 گیگابایت بر ثانیه استفاده می کنند NVLINK به یکدیگر متصل می شوند. این مجموعه 30 برابر قدرتمندتر از نسل قبلی برای آموزش مدل های زبان بزرگ است. به گفته انویدیا، تراشه جدید هزینه و مصرف انرژی را تا 25 برابر کاهش می دهد.

بخوانید  فورتنایت: تفنگ فلر را از کجا پیدا کنیم و چگونه کار می کند

پلتفرم هوش مصنوعی بلک ول

اما اولین محصول این سری B200 نام دارد که به اشکال مختلف در پلتفرم های SXM، PCIe AIC و Superchip استفاده خواهد شد. طراحی MCM یا Multi-Chip-Module مدت هاست که توسط انویدیا مورد مطالعه قرار گرفته و در نهایت در محصولات این شرکت مورد استفاده قرار گرفته است. B200 یک تراشه بسیار قدرتمند است که از 160 پردازنده چند جریانی برای 20480 هسته پردازشی تشکیل شده است.

این پردازنده گرافیکی از آخرین نسل فناوری اینترکام NVLINK استفاده می کند و TDP آن 700 وات تبلیغ می شود که از این نظر مشابه H100 است. و H200 برابر است قبل از رونمایی از پردازنده جدید انویدیا، آموزش یک مدل هوش مصنوعی با 1.8 تریلیون پارامتر نیاز به استفاده از 8000 تراشه هاپر و 15 مگاوات قدرت داشت، اما اکنون می توان این کار را با استفاده از 2000 پردازنده بلک ول انجام داد و تنها چهار مگاوات انرژی مصرف می کند.

انویدیا این تراشه‌ها را در بسته‌های بزرگ بسته‌بندی می‌کند، مانند GB200 NVL72 که 36 CPU و 72 GPU را در یک رک خنک‌شده با مایع نگه می‌دارد و تا 720 پتافلاپ قدرت برای آموزش هوش مصنوعی دارد. این مانت انویدیا تقریباً 3.2 کیلومتر کابل دارد. تیم سبز همچنین DGX GB200 را ارائه می دهد که در مجموع دارای 288 پردازنده، 576 پردازنده گرافیکی، 240 ترابایت رم و 11.5 اگزافلاپس توان FP4 است.

معماری Blackwell که در حال حاضر برای تراشه‌های هوش مصنوعی ارائه می‌شود، احتمالاً در آینده‌ای نه چندان دور راه خود را به کارت‌های گرافیکی مصرفی سری RTX 5000 باز خواهد کرد.

بخوانید  اعلام زمان تقریبی اولین تریلر Fast and Furious 10 توسط وین دیزل

تحریریه مجله بازی یک گیمر