Skip to main content

Nvidia Chief Scientist: CPUs Slowed by Legacy Design

وحدات المعالجة المركزية (CPU) "تحرق أشار بيل دالي ، كبير العلماء ونائب رئيس قسم الأبحاث في نفيديا ، خلال حديثه الأربعاء في مؤتمر الحواسب العملاقة 2010 في نيو أورليانز ، إلى أن الكثير من السلطة "تنفذ مهام قد تكون غير ضرورية في بيئة الحوسبة اليوم."

The GPU " هو الأمثل للصبيب ، "في حين أن" وحدة المعالجة المركزية هي الأمثل لوقت استجابة منخفض ، للحصول على أداء جيد حقا موضوع ، "قال. [اقرأ المزيد: أفضل صناديق NAS لتدفق وسائل الإعلام والنسخ الاحتياطي]

أشار دالي لبعض من الميزات التي معظم الوضع تمتلك وحدات المعالجة المركزية (CPU) طاقة تهدر في سعيها لحدوث تأخر منخفض.

"لديهم تنبؤات فرعية تتنبأ بفروع كل دورة سواءً كانت فروع البرنامج أم لا - تحرق كتل الطاقة. أعادوا ترتيب التعليمات لإخفاء وقت استجابة الذاكرة. هذا يحرق الكثير من القوة. فهي تحمل مجموعة من الإرشادات القديمة التي تتطلب الكثير من التفسير. هذا يحرق الكثير من القوة. يفعلون تنفيذ المضاربة وتنفيذ التعليمات البرمجية التي قد لا يحتاجون إليها ورميها بعيدا. كل هذه الأشياء تحرق الكثير من القوة.

على الرغم من أن وحدة معالجة الرسومات صممت في الأصل لتقديم الرسومات على الشاشة ، فإن البائعين مثل Nvidia و Advanced Micro Devices يضعون الآن بطاقات GPU كمحركات عامة للحوسبة ، على الأقل. لأحمال العمل التي يمكن تقسيمها إلى أجزاء متعددة وتشغيلها بالترادف.

على الأقل بعض الصناعات تدرس هذه الفكرة ، ولا سيما عالم الحوسبة عالية الأداء (HPC) .في وقت سابق من هذا الأسبوع ، نظام تيانخه 1A الصيني المبني حديثًا تصدر أحدث 500 قائمة من أقوى أجهزة الكمبيوتر العملاقة في العالم ، ويشمل هذا النظام 7،168 وحدة معالجة الرسوميات Nvidia Tesla M2050 بالإضافة إلى 14000 وحدة معالجة مركزية (CPUs) ، ويدعي نفيديا أنه بدون وحدات معالجة الرسوم ، سيحتاج النظام إلى أربعة أضعاف هذا العدد من وحدات المعالجة المركزية (CPU) مرتين. قدر مساحة الأرض وثلاثة أضعاف الكهرباء لتشغيل.

وعلى الرغم من Dally ركز ملاحظاته على استخدامها في HPC ، قال إن الفكرة العامة سوف تتخلل عالم الحوسبة ككل.

"HPC هو ، في طرق عديدة ، وهو متبني سابق ، لأنهم يواجهون مشكلات عاجلة لأنهم يعملون على نطاق أوسع. ولكن هذا ينطبق تمامًا على تطبيقات المستهلك وكذلك على تطبيقات الخوادم ، "قال في مقابلة بعد الكلمة الرئيسية.

قال دالي إنه في حين لا يتم كتابة العديد من التطبيقات الحالية للتشغيل في بيئات متوازية ، في النهاية سينتقل المبرمجون إلى هذا وقال: "أعتقد أنه بمرور الوقت ، سيقوم الناس بتحويل التطبيقات إلى موازاة ، وستكون تلك الأجزاء المتوازية مناسبة تمامًا لوحدات معالجة الرسومات" ، حتى أنه توقع أن الأنظمة ستتمكن في يوم من الأيام من إقلاع وحدة معالجة الرسومات بالإضافة إلى وحدة المعالجة المركزية ، على الرغم من أنه لا يعرف أي عمل على وجه الخصوص لبناء نظام تشغيل مبني على معالج الجرافيكس.

يمثل التخصيم في استخدام الطاقة أحد المستأجرين الأساسيين من Dally للمطالبة بتفوق GPU ، وأشار إلى أنه في حين أن الجيل التالي من هندسة Nvidia GPU ، Ficky ​​، المسمى nick ، ​​تستهلك 200 pJs (picojoules) في السلطة لكل تعليمات تنفيذها ، وحدة المعالجة المركزية تستهلك 2nJ (nanojoules) ، أو أكثر من الجول من أجل.

هذا الاختلاف الصغير سوف يصل إلى الهوة الضخمة عندما تضخمت عبر لارج الأنظمة الإلكترونية. أشار دالي إلى جهود وكالة مشاريع الأبحاث المتقدمة التابعة لوزارة الدفاع الأمريكية لتمويل تطوير كمبيوتر إكسيسكالي ، أو جهاز كمبيوتر يمكنه تنفيذ 1 كوينتيليون عملية حسابية في الثانية. وقال إن مثل هذا النظام الذي تم بناؤه من وحدات المعالجة المركزية وحدها ، سيتطلب "محطة طاقة نووية تم بناؤها في الجوار" فقط للعمل من حيث استخدام الطاقة.

لا يباع الجميع في مجتمع HPC على فكرة استخدام وحدات معالجة الرسومات على سبيل المثال. بديل عن وحدات المعالجة المركزية. إحدى المشاكل المحتملة التي يشير إليها الكثيرون هي أنه على الرغم من أن وحدات معالجة الرسوم قد يكون لديها قدر أكبر من الإنتاجية ، إلا أنه من الصعب على الأنظمة توفير هذه البيانات إلى هذه المعالجات.

"هناك كمية قليلة جدًا من الذاكرة المتوفرة لكل وحدة معالجة الرسومات. إذا كان لديك شيء سريع بالفعل ، فأنت بحاجة إلى إطعامه بسرعة كبيرة ، وإذا لم يكن لديك ذاكرة كافية لإطعام ذلك المعالج ، قال دايف تريك ، رئيس قسم الحوسبة العميقة لشركة IBM ، في الأسبوع الماضي.

قال دالي أن مشكلة عرض النطاق الترددي هذه ليست فريدة بالنسبة لوحدات معالجة الرسومات - حيث تواجه وحدات المعالجة المركزية نفس المعضلة. وقال "يعد النطاق الترددي مشكلة كبيرة لأي نظام حاسوبي". واعترف بأن المشكلة أكثر حدة بالنسبة لوحدات معالجة الرسومات. تحتوي بطاقة GTX 580 من NVIDIA التي تم إصدارها للتو على نطاق ترددي أولي يصل إلى 200 غيغابايت في الثانية ، في حين أن وحدة المعالجة المركزية "الأفضل في فئتها" لديها حوالي 35 غيغابايت في الثانية فقط. وقال: "تحتاج أنظمة الذاكرة إلى التطور لتكون أكثر كفاءة". >

يغطّي جواب جاكسون برمجيات الشركات والتكنولوجيا العامة الأخبار العاجلة عن

The IDG News Service

. اتبع Joab على تويتر علىJoab_Jackson. عنوان البريد الإلكتروني لـ Joab هو [email protected]