همه چیز در مورد معماری Blackwell
همه چیز در مورد معماری Blackwell

همه چیز در مورد معماری Blackwell

معماری Blackwell نسل جدید میکرومعماری GPU های NVIDIA است که برای مقیاس های بزرگِ هوش مصنوعی مولد طراحی شده و شامل سوپرچیپ های دو تراشه ای، بهبودهای گسترده در Tensor و RT Cores، پشتیبانی از فرمت های کم دقت جدید و یک واحد مدیریت هوش مصنوعی (AMP) برای کنترل و زمان بندی هوشمند پردازش هاست.


 

مشخصات فنی کامل Blackwell

1) طراحی کلی و ساخت


تراشه های Blackwell ویژهٔ دیتاسنتر (مثل GB200/GB300) با گرهٔ اختصاصی TSMC تولید می شوند و به شکل «سوپرچیپ» شامل دو تراشهٔ بزرگ متصل با یک پیوند پهن باند ارائه شده اند.


این پیوند با پهنای باند بسیار بالا اجازه می دهد ظرفیت حافظه و توان محاسباتی تجمیع شود.


این ساختار راهی برای عبور از محدودیت ابعاد تراشه (reticle limit) و افزایش ترانزیستورها است.


2) محاسبات عددی و دیتاتایپ ها (Transformer Engine نسل دوم)


نسل دوم Transformer Engine فرمت های داده ای جدید بسیار کم دقت، شامل فرمت های ۴ بیتی و ۶ بیتی میکروسکیل، را پشتیبانی می کند.


این فرمت ها بهره وری را به طرز چشم گیری برای آموزش و استنتاج مدل های بزرگ افزایش می دهند.


به کارگیری این فرمت ها باعث کاهش مصرف انرژی، کاهش نیاز حافظه و افزایش سرعت پردازش LLMها می شود.


3) Streaming Multiprocessor (SM) و هسته های محاسباتی


SM در Blackwell بازطراحی شده تا توان بیشتری برای FP32، FP16 و محاسبات صحیح ارائه دهد.


هسته های Tensor نسل جدید توان عملیاتی بالاتری برای فرمت های کم دقت دارند.


دستورالعمل های جدید مخصوص مدل های ترنسفورمر و عملیات ماتریسی افزوده شده اند.


4) RT Cores و رندرینگ


نسل جدید RT Cores دارای موتور برخورد خوشه ای مثلثات برای هندسهٔ بسیار بزرگ در صحنه های پیچیده است.


قابلیت رهگیری اجسام بسیار ریز (مثل مو یا علف) با روش های جدید هندسی اضافه شده.


در کنار Shader Execution Reordering و تکنیک های Neural Shading، رندرینگ واقع گرایانه تر و سریع تر حاصل می شود.


5) واحد مدیریت هوش مصنوعی (AMP)


AMP یک ریزپردازندهٔ داخلی مبتنی بر معماری RISC-V است.


بخشی از مدیریت بار کاری AI، کنترل کیفیت سرویس و زمان بندی درون GPU انجام می شود و از CPU برداشته می شود.


این کار باعث پایداری بهتر برای سرویس های real-time و مولد می شود.


6) حافظه و ارتباطات


نسخه های دیتاسنتر Blackwell از حافظه های HBM3e با پهنای باند بسیار بالا استفاده می کنند.


نسخه های مخصوص گیمینگ احتمالاً GDDR7 را هدف گرفته اند.


معماری حافظه و پیوند دو تراشه در سوپرچیپ ها طوری طراحی شده که تأخیر کم و ظرفیت بالا ارائه دهد.


7) اکوسیستم نرم افزاری


CUDA، cuDNN، TensorRT و سایر ابزارهای NVIDIA برای پشتیبانی از فرمت های کم دقت و دستورالعمل های جدید Blackwell به روزرسانی شده اند.


این هماهنگی نرم افزار–سخت افزار باعث افزایش سرعت استنتاج و کاهش هزینه پردازش مدل های بزرگ می شود.


یک نمونه کارت گرافیک مبتنی بر معماری : Blackwell

کارت گرافیک NVIDIA RTX PRO 6000 96GB Blackwell


ویژگی های طراحی Blackwell


مقیاس پذیری: طراحی سوپرچیپی دو تراشه ای به GPU اجازه می دهد به ظرفیت های محاسباتی و حافظه ای برسد که در یک تراشهٔ واحد ممکن نیست.


بهره وری انرژی: استفاده از فرمت های ۴ و ۶ بیتی باعث کاهش توان مصرفی و افزایش کارایی در استنتاج می شود.


هماهنگی سخت افزار و نرم افزار: واحد AMP و Transformer Engine نسل دوم به توسعه دهندگان اجازه می دهد بدون تغییرات اساسی در کد به مزایای معماری جدید دست پیدا کنند.


پاسخ دهی بهتر: مناسب برای سرویس های مبتنی بر LLM که نیاز به زمان تأخیر پایین و توان تراکنشی بالا دارند.

 

کارت گرافیک NVIDIA RTX PRO 4500 32GB Blackwell


پرسش و پاسخ در مورد معماری کارت گرافیک Blackwell


1. آیا Blackwell برای بازی ها هم مهم است؟

بله؛ با وجود اینکه تمرکز اصلی روی AI است، قابلیت های رندرینگ و RT Cores نسل جدید تجربهٔ گیمینگ را هم بهبود می دهند.


2. چرا فرمت های ۴ بیتی قدرتمندند؟

چون سرعت پردازش را افزایش و مصرف انرژی و حافظه را کاهش می دهند—بدون افت کیفیت محسوس در بسیاری از مدل های AI.


3. AMP دقیقاً چه کاری می کند؟

AMP بخشی از مدیریت بار کاری و زمان بندی را در خود GPU انجام می دهد تا نتایج پایدارتر و سریع تری به دست آید.


4. آیا برای بهره برداری کامل باید نرم افزار به روزرسانی شود؟

بله؛ CUDA، TensorRT و سایر ابزارهای NVIDIA برای پشتیبانی از امکانات Blackwell نسخه های جدید دارند.


5. آیا در استقرارهای عملی آزمایش شده؟

بله، نسل جدید سیستم های مبتنی بر Blackwell در محیط های واقعی مقیاس بالا عملکرد بسیار خوبی ثبت کرده اند.

 

مشخصات و خرید کارت گرافیک NVIDIA GeForce RTX 5080

در وب سایت کیهان سرور میتوانید به مشخصات تمامی کارت گرافیک ها با معماری blackwell دسترسی داشته باشید.آن هارا بخرید یا مقایسه کنید.

https://keyhanserver.com/otx2W4
کپی آدرس