پردازنده گرافیکی B200 استفاده از 208 میلیارد ترانزیستور و 192 گیگابایت حافظه HBM3e نسبت به نسل قبلی عملکرد پردازش هوش مصنوعی بهتری دارد.
انویدیا بالاخره معماری نسل جدید پردازنده های گرافیکی خود با نام بلک ول را رسما معرفی کرد. مدتی است که انویدیا تراشه های گرافیکی خود را با معماری مشترک هم برای خانواده های بازی و هم برای مراکز داده منتشر کرده است و اینجاست که چیپست های مرکز داده Green Team مورد توجه قرار می گیرند. پردازندههای گرافیکی B200 اولین عضو خانواده بلکول خواهند بود که قرار است در سال 2024 عرضه شوند.
پردازندههای گرافیکی سری Blackwell معمولاً تا 5 برابر عملکرد هوش مصنوعی قویتری نسبت به سری Hopper H100 دارند. انویدیا با معماری Blackwell هستههای هوش مصنوعی و تراشههای گرافیکی Tensor خود از طراحی ریزتراشه یا MCM برای اولین بار در تولید GPU استفاده میکند. از دو استفاده می کند GPU را در قالب قرار می دهد.
در طراحی این تراشه ها، انویدیا از 104 میلیارد ترانزیستور در هر قسمت از پردازنده گرافیکی استفاده می کند که در مجموع 208 میلیارد ترانزیستور بر اساس فرآیند تولید تراشه های 4 نانومتری TSMC را تشکیل می دهد. جالب اینجاست که هم Synopsys و هم TSMC از فناوری CuLitho انویدیا برای تولید تراشه های Blackwell استفاده کردند که تولید هر تراشه را تسریع می بخشد تا تولید نسل بعدی شتاب دهنده های هوش مصنوعی را تسریع بخشد.
پردازنده های گرافیکی B100 مجهز به رابط باس حافظه با پهنای باند 10 ترابایت بر ثانیه هستند که تبادل اطلاعات از تراشه به تراشه را بسیار سریع می کند. در واقع، این دو تراشه به عنوان یک پردازنده واحد در یک شکل واحد عمل می کنند که دارای حافظه پنهان GPU منسجم است.
در مقایسه با سری هاپر، پردازندههای بلکول انویدیا بیش از 128 میلیون ترانزیستور دارند که در مجموع 20 پتافلاپ قدرت پردازش گرافیکی در هر تراشه و 5 برابر بهبود در عملکرد هوش مصنوعی ارائه میکنند. این پردازنده گرافیکی با 8 بانک حافظه HBM3e، مجهز به سریعترین فناوری حافظه در جهان است و پهنای باند حافظه 8 ترابایت بر ثانیه را در رابط باس حافظه 8192 بیتی ارائه می کند. در این چیپست قدرتمند از 192 گیگابایت حافظه HBM3e نیز استفاده شده است. در اینجا خلاصه ای از مشخصات این GPU در مقایسه با Hopper آمده است:
- 20 پتافلاپ قدرت پردازش گرافیکی FP8 (معادل 2.5 برابر سری Hopper)
- 20 پتافلاپ قدرت پردازش گرافیکی FP6 (معادل 2.5 برابر سری Hopper)
- 40 پتافلاپ قدرت پردازش گرافیکی FP4 (معادل 5 برابر سری Hopper)
- پارامترهای 740B (معادل قیف سری 6 بار)
- نرخ پارامتر در ثانیه 34T (معادل قیف سری 5 بار)
- پهنای باند NVLINK 7.2 ترابایت بر ثانیه (معادل 4 برابر سری Hopper)
انویدیا چیپست بلک ول را به عنوان یک پلتفرم کامل تحت نام سوپرتراشه GB200 به فروش می رساند که شامل دو سری از این نوع پردازنده ها است که از 4 هسته پردازشی و یک پردازنده Grace با 72 هسته CPU تشکیل شده است. با معماری ARM Neoverse V2 در آن گنجانده شده است. این پردازنده ها از پروتکل 900 گیگابایت بر ثانیه استفاده می کنند NVLINK به یکدیگر متصل می شوند. این مجموعه 30 برابر قدرتمندتر از نسل قبلی برای آموزش مدل های زبان بزرگ است. به گفته انویدیا، تراشه جدید هزینه و مصرف انرژی را تا 25 برابر کاهش می دهد.
اما اولین محصول این سری B200 نام دارد که به اشکال مختلف در پلتفرم های SXM، PCIe AIC و Superchip استفاده خواهد شد. طراحی MCM یا Multi-Chip-Module مدت هاست که توسط انویدیا مورد مطالعه قرار گرفته و در نهایت در محصولات این شرکت مورد استفاده قرار گرفته است. B200 یک تراشه بسیار قدرتمند است که از 160 پردازنده چند جریانی برای 20480 هسته پردازشی تشکیل شده است.
این پردازنده گرافیکی از آخرین نسل فناوری اینترکام NVLINK استفاده می کند و TDP آن 700 وات تبلیغ می شود که از این نظر مشابه H100 است. و H200 برابر است قبل از رونمایی از پردازنده جدید انویدیا، آموزش یک مدل هوش مصنوعی با 1.8 تریلیون پارامتر نیاز به استفاده از 8000 تراشه هاپر و 15 مگاوات قدرت داشت، اما اکنون می توان این کار را با استفاده از 2000 پردازنده بلک ول انجام داد و تنها چهار مگاوات انرژی مصرف می کند.
انویدیا این تراشهها را در بستههای بزرگ بستهبندی میکند، مانند GB200 NVL72 که 36 CPU و 72 GPU را در یک رک خنکشده با مایع نگه میدارد و تا 720 پتافلاپ قدرت برای آموزش هوش مصنوعی دارد. این مانت انویدیا تقریباً 3.2 کیلومتر کابل دارد. تیم سبز همچنین DGX GB200 را ارائه می دهد که در مجموع دارای 288 پردازنده، 576 پردازنده گرافیکی، 240 ترابایت رم و 11.5 اگزافلاپس توان FP4 است.
معماری Blackwell که در حال حاضر برای تراشههای هوش مصنوعی ارائه میشود، احتمالاً در آیندهای نه چندان دور راه خود را به کارتهای گرافیکی مصرفی سری RTX 5000 باز خواهد کرد.