كارت الشاشة المثالي للذكاء الاصطناعي وكيف تختاره؟

قد تعتقد أن بطاقة RTX 5090 هي أقوى بطاقة رسومية (كارت شاشة) موجودة على الساحة حاليًّا، وهذا قد يكون صحيحًا في حال ما إذا كنا نتحدث على مستوى "البطاقات الاستهلاكية" المعروفة مثل RTX 4090، وRTX 5080، وRX 9070 XT، لكن على مستوى الذكاء الاصطناعي وتطبيقاته، هناك بطاقات لن نقول إنها أفضل، ولكنها أنسب من بطاقة Nvidia الجبارة، فما أشهر البطاقات التي تُستخدم في معالجة الذكاء الاصطناعي؟ وما مواصفاتها؟
ما أهمية كروت الشاشة في مشاريع الذكاء الاصطناعي؟

على عكس المعالجات المركزية CPUs، التي تبرع في التعامل مع المهام الفردية بسرعة وكفاءة عالية (حسب نوع المعالج بالطبع)، فإن كروت الشاشة أو البطاقات الرسومية تستطيع التعامل مع مجموعة ضخمة من البيانات والعمليات بالتوازي في الوقت نفسه، نظرًا لاحتوائها على آلاف الأنوية، وهذه هي الطريقة التي يشتغل بها الذكاء الاصطناعي.
ويُمكننا إحصاء أهمية كروت الشاشة بمشاريع الذكاء الاصطناعي في 3 نقاط:
- النقطة الأولى: معالجة البيانات بالتوازي كما أوضحنا أعلاه.
- النقطة الثانية: كروت الشاشة تمتلك نطاقات تردد للذاكرة أعلى بكثير من المعالجات المركزية وهذا يُسرع من العمليات كثيرًا.
- النقطة الثالثة: كروت الشاشة تحتوي على أنوية متخصصة في معالجة الذكاء الاصطناعي مثل أنوية تنسور Tensor Cores وأنوية كودا CUDA.
معايير اختيار كارت الشاشة المناسب للذكاء الاصطناعي

هناك معايير واضحة لاختيار كارت الشاشة المناسب للذكاء الاصطناعي، مثل عدد أنوية CUDA وTensor، وحجم الذاكرة VRAM، واستهلاك الطاقة، وغيرها من المواصفات والمعايير، ولكن سؤال المعايير هذا ليس المهم؛ الأهم هو حجم ميزانيتك وطبيعة استخدامك.
على سبيل المثال، إذا كنت تريد استخدام النماذج أو البرامج التجارية الشائعة التي تحتوي على مميزات الذكاء الاصطناعي، فستكفيك الكروت العادية التي نستخدمها في الألعاب، بل وربما تستطيع تشغيل هذه البرامج والخدمات بسهولة عن طريق المعالج فقط، خاصةً إذا كان يحتوي على كارت شاشة داخلي قوي.
على الجانب الآخر، إذا كنت تعمل أساسًا في مجال الذكاء الاصطناعي وتريد تدريب النماذج مثلًا، فهنا سيتعين عليك استخدام كارت شاشة قوي من الخيارات التي سنأتي على ذكرها بعد قليل.
إذا كنت بعيدًا عن مجال الذكاء الاصطناعي وتريد أن تفهم طبيعة المهام التي يُمكن أن تُستخدم فيها هذه الكروت، فإليك عينة من أشهرها:
1. التعرف على الصور Image Recognition: لتدريب نماذج ذكاء اصطناعي تستطيع التعرف على الصور، فإنك قد تحتاج أيامًا أو حتى أسابيع، اعتمادًا على قوة الكارت.
2. معالجة اللغة الطبيعية: تدخل كروت الشاشة أيضًا في تدريب نماذج اللغات الكبيرة LLM، وأشهر مثال على هذه النماذج ChatGPT وGemini بموديلّاتهما، فتدريب مثل هذه النماذج يحتاج من أسابيع إلى أشهر.
اقرأ أيضًا: كيف تعمل النماذج اللغوية الكبيرة "LLMs"؟ وهل تمثل تهديدًا حقيقيًا للبشر؟
3. التعلم المعزز والتطبيقات التي تتطلب معالجة فورية للبيانات: نفس ما قلناه بالأعلى ينطبق هنا، وتحديدًا في السيناريوهات التي تتطلب كشف الاحتيال، والسيارات ذاتية القيادة، وغيرهما من التطبيقات التي تتطلب معالجة فورية للبيانات.
وطبعًا لا ننسى أن الميزانية هي العنصر والعامل الأهم في كل هذه الحكاية، ولولا ضيق الميزانية -والتوافر بدرجة أقل- لكان الجميع اشترى أقوى الكروت والمعالجات المتاحة، والمشكلة أن الفجوة في أسعار كروت الشاشة كبيرة، ولا تنفك تزداد بزيادة الفرق في الإمكانيات والمواصفات التقنية.
لكن على كلٍ، إليك أبرز المعايير التي يُفترض أن تراعيها في كروت الذكاء الاصطناعي:
1. أنوية كودا وأنوية تنسور: بالنسبة لأنوية كودا CUDA Cores، فتعمل على تنفيذ العديد من المهام في الوقت نفسه، أما أنوية تنسور Tensor Cores، فتوجد في كروت الشاشة الأحدث مثل RTX وA100، وكلا النوعين من الأنوية متوافر بكروت Nvidia فقط.
2. الذاكرة: تمتلك كروت الشاشة ذاكرة مؤقتة، مثل الرامات، تُعرف بالـVRAM؛ عليها يُخزّن كارت الشاشة الصور التي يعالجها ليعرضها لك، ولهذا كلما كانت سعة VRAM أكبر، كانت قدرة الكارت على معالجة المزيد من بيانات الذكاء الاصطناعي أعلى، والعكس يمكن أن يؤدي إلى أعطال أو ما يُسمى "بعنق الزجاجة Bottleneck"، وهو عدم قدرة الكارت على معالجة البيانات بالسرعة المطلوبة.
3. عرض النطاق الترددي: يعبر عرض النطاق Memory Bandwidth عن مدى سرعة انتقال البيانات بين الذاكرة وشريحة المعالجة GPU والأنوية، وهو معيار في غاية الأهمية، لأنه يتيح معالجة البيانات الكبيرة بشكل سريع، ولهذا السبب تحديدًا تكمن أهميته في تدريب الشبكات العصبية العميقة التي تمتلئ بكميات مهولة من البيانات.
4. الحد الأقصى لاستهلاك الطاقة TDP: يشير إلى الحد الأقصى لكمية الحرارة التي يولدها الكارت تحت الحِمل، إذ يجب أن تحرص على التوازن بين أداء الكارت واستهلاكه للطاقة، خاصة إذا كان المشروع الذي تعمل عليه كبيرًا.
5. التوافق مع إطارات العمل: من المفترض أن يتوافق كارت الشاشة الجيد مع معظم إطارات العمل للتعلم الآلي، مثل TensorFlow، وPyTorch، وJAX.
6. الفاصلة العائمة FP16، وFP32، وFP64: وهذه من أهم المقاييس لأداء كروت الشاشة والحواسيب بشكل عام.
NVIDIA مقابل AMD: من يتفوّق في الذكاء الاصطناعي؟

الجواب المختصر أن Nvidia تتفوق بشكلٍ واضح بفضل أنوية كودا وتنسور التي تحدثنا عنها، لكن AMD لا تهدأ، حيث تطور من كروتها باستمرار لا سيما على مستوى الأسعار.
سلسلة مثل RX 9000، وحتى RX 7000، تقدم أداءً ممتازًا، وتأتي بسعرٍ تنافسي مقارنةً بأسعار كروت Nvidia، وعلى سبيل المثال، يقدم كارت RX 9070 XT أداء أفضل من RTX 5070 Ti رُغم أنه أرخص بـ 150 دولارًا.
اقرأ أيضًا: كيف يختلف Manus AI عن نماذج الذكاء الاصطناعي الأخرى؟
كروت مخصصة للمبتدئين وأخرى للمحترفين

والآن، حان الوقت لنذكر أشهر كروت الشاشة المخصصة للذكاء الاصطناعي؛ للمبتدئين والمحترفين، ونبدأ بالأقوى:
Nvidia H100 NVL
أداء الفاصلة العائمة:
FP16 - 1,671 TFLOPS
TFLOPS FP32 - 60 TFLOPS
FP64 - 30 TFLOPS
الذاكرة: 94 جيجابايت من نوع HBM3.
عرض النطاق الترددي: 3.9 تيرابايت في الثانية.
Nvidia A100
أداء الفاصلة العائمة:
FP16 - 624 TFLOPS
FP32 - 19.5 TFLOPS
FP64 - 9.7 TFLOPS
الذاكرة: 80 جيجابايت من نوع HBM2e.
عرض النطاق: 2.039 جيجابايت/ثانية.
RTX 5090
أداء الفاصلة العائمة:
FP16- 104.8 TFLOPS
FP32- 104.8 TFLOPS
FP64- 1.637 TFLOPS
الذاكرة: 32 جيجابايت من نوع GDDR7.
عرض النطاق: 1.79 تيرابايت/ثانية
NVIDIA RTX A6000
أداء الفاصلة العائمة:
FP16 - 40.00 TFLOPS
FP32 - 38.71 TFLOPS
FP64 - 604.8 GFLOPS
الذاكرة: 48 جيجابايت من نوع GDDR7.
عرض النطاق: 768 جيجابايت في الثانية.
NVIDIA GeForce RTX 4090
أداء الفاصلة العائمة:
FP16 - 82.58 TFLOPS
FP32 - 82.58 TFLOPS
FP64 - 1,290 GFLOPS
الذاكرة: 24 جيجابايت من نوع GDDR6X.
عرض النطاق: 1,008 جيجابايت/ثانية.
NVIDIA GeForce RTX 3090 Ti
أداء الفاصلة العائمة:
FP16 - 40 TFLOPS
FP32 - 35.6 TFLOPS
FP64 - 625 GFLOPS
الذاكرة: 24 جيجابايت من نوع GDDR6X.
عرض النطاق: 1,008 جيجابايت/ثانية.
GIGABYTE GeForce RTX 3080
أداء الفاصلة العائمة:
FP16 - 31.33 TFLOPS
FP32 - 29.77 TFLOPS
FP64 - 489.6 GFLOPS
الذاكرة: 12 جيجابايت من نوع GDDR6X.
عرض النطاق: 760 جيجابايت/ثانية.
أما بالنسبة لكروت المبتدئين، فتشمل:
EVGA GeForce GTX 1080
أداء الفاصلة العائمة:
FP16 - 138.6 GFLOPS
FP32 - 8.873 TFLOPS
FP64 - 277.3 GFLOPS
الذاكرة: 8 جيجابايت من نوع GDDR5X.
عرض النطاق: 320 جيجابايت/ثانية.
ZOTAC GeForce GTX 1070
أداء الفاصلة العائمة:
FP16- 103.3 GFLOPS
FP32 - 6.609 TFLOPS
FP64 - 206.5 GFLOPS
الذاكرة: 8 جيجابايت من نوع GDDR5.
عرض النطاق: 265 جيجابايت/ثانية.
جدير بالذكر أن معظم الكروت المذكورة من شركة Nvidia لأنها الأفضل إجمالًا بالنسبة للذكاء الاصطناعي كما قلنا، غير أن هناك العديد من الخيارات الرائعة أيضًا من AMD مثل RX 7900 GRE، وRX 7600، وRX 7900 XTX، وRX 9070 وRX 9070 XT، وغيرها من الكروت التي تقدم أداءً جيدًا.