لسنوات، قصةمركز البياناتاتبع استهلاك الطاقة قوسًا يمكن التنبؤ به. من المؤكد أن الرقمنة كانت تنمو، لكن مكاسب الكفاءة الناتجة عن الخوادم الأفضل والمحاكاة الافتراضية والدمج السحابي أبقت إجمالي استخدام الكهرباء ثابتًا بشكل مدهش. كان الطلب العالمي على الطاقة في مراكز البيانات يحوم حول 1% من إجمالي استهلاك الكهرباء – ما يقرب من 200 تيراواط/ساعة سنويًا – طوال الجزء الأكبر من العقد.
تلك الحقبة تنتهي.
إن التقارب بين الذكاء الاصطناعي التوليدي، وتعدين العملات المشفرة، والحوسبة المتطورة، والنمو الهائل للأجهزة المتصلة، أدى إلى كسر منحنى الكفاءة القديم. تُظهر تقديرات الصناعة الآن أن الطلب على الطاقة في مراكز البيانات ينمو بمعدلات سنوية لم نشهدها منذ أوائل العقد الأول من القرن الحادي والعشرين. وفي بعض المناطق -أيرلندا، وفيرجينيا الشمالية، وسنغافورة- تمثل مراكز البيانات بالفعل ما بين 15% إلى 25% من إجمالي استهلاك الكهرباء، مما يجبر الجهات التنظيمية على فرض حظر على البناء الجديد.
وفي ظل هذه الخلفية، أصبحت خيارات البنية التحتية التي كانت تبدو ذات يوم وكأنها تفاصيل تقنية - هندسة التبريد، وطوبولوجيا توزيع الطاقة، وتخطيط كثافة الحامل - قرارات مجلس الإدارة. لم تعد تكلفة الطاقة بندًا. وهو عائق أمام النمو.
لقد كانت فعالية استخدام الطاقة، أو PUE، هي مقياس الكفاءة القياسي في صناعة مراكز البيانات منذ ما يقرب من عقدين من الزمن. إنها نسبة بسيطة: إجمالي طاقة المنشأة مقسومًا على طاقة معدات تكنولوجيا المعلومات.
يعني PUE الذي يبلغ 2.0 أنه مقابل كل واط يعمل على تشغيل الخوادم والتخزين، يذهب واط آخر إلى التبريد والإضاءة وفقدان تحويل الطاقة والنفقات العامة الأخرى. يعني PUE الذي يبلغ 1.2 أن النفقات العامة تستهلك 0.2 واط فقط لكل واط من تكنولوجيا المعلومات.
لقد قبلت الصناعة على نطاق واسع المستويات بناءً على PUE:
| مستوى | PUE | DCiE | ماذا يعني |
|---|---|---|---|
| البلاتين | <1.25 | >0.80 | كفاءة ذات مستوى عالمي، تتطلب عادةً تبريدًا مجانيًا أو تبريدًا سائلًا |
| ذهب | 1.25 - 1.43 | 0.70 - 0.80 | فعال للغاية، ويمكن تحقيقه من خلال التصاميم الحديثة في المناخات المعتدلة |
| فضي | 1.43 - 1.67 | 0.60 - 0.70 | مقبول للمرافق القديمة أو المناخات الدافئة |
| برونزية | 1.67 - 2.00 | 0.50 – 0.60 | نموذجي لمراكز البيانات القديمة التي لا تحتوي على تعديلات تحديثية كبيرة |
| عدل | 2.00 - 2.50 | 0.40 - 0.50 | ضعف الكفاءة، وارتفاع تكاليف التشغيل |
| فقير | > 2.50 | <0.40 | من المحتمل أن يتطلب عدم الكفاءة الحرجة اهتمامًا فوريًا |
المشكلة هي أن العديد من المنظمات لا تعرف بالفعل PUE الخاص بها. يقدرون. يخمنون. أو يقومون بالقياس فقط على عداد المرافق الرئيسي ويتحملون الباقي.
وجد استطلاع الصناعة لعام 2023 أن ما يقرب من 40 بالمائة من مشغلي مراكز البيانات لم يقوموا أبدًا بقياس PUE على مستوى الحامل. ومن بين أولئك الذين فعلوا ذلك، بلغ متوسط الفارق بين PUE المُبلغ عنه والفعلي 0.3 نقطة - وهو ما يكفي لنقل المنشأة من الذهب إلى الفضة دون أن يلاحظ أحد.
إن فهم سبب اختلاف PUE على نطاق واسع يبدأ بالنظر إلى المكان الذي تترك فيه الطاقة مركز البيانات.
في منشأة تبريد الهواء النموذجية مع PUE حوالي 1.8، يبدو الانهيار تقريبًا كما يلي:
حمل التبريد هو المتغير الأكبر. قد تنفق منشأة في مناخ معتدل تستخدم الهواء الخارجي للتبريد المجاني 15 بالمائة فقط من طاقتها غير المخصصة لتكنولوجيا المعلومات على التبريد. نفس المنشأة في مناخ استوائي مع التبريد الميكانيكي على مدار العام قد تنفق 40 بالمائة.
ولهذا السبب يعلن موفرو الموقع المشترك عن PUE على مستوى المنشأة ولكنهم يقدمون PUE على عداد العميل - أرقام مختلفة وتأثيرات مختلفة. يدفع العميل ثمن كل ذلك.
تفترض إدارة مراكز البيانات التقليدية بيئة ثابتة نسبيًا. تم ملء الرفوف على مدى أشهر أو سنوات. يمكن تعديل التبريد ببطء. كان توزيع الطاقة كبيرًا جدًا منذ اليوم الأول.
لقد غير عصر السحابة الافتراضات. تملأ الرفوف الآن أيامًا. تنتقل أعباء العمل عبر الخوادم تلقائيًا. يمكن لمجموعات الذكاء الاصطناعي عالية الكثافة أن تستهلك ثلاثة أضعاف قوة رفوف الحوسبة ذات الأغراض العامة المجاورة.
وقد أجبرت هذه التغييرات على إعادة التفكير في إدارة البنية التحتية. تبرز ثلاثة اتجاهات.
أولا، الكثافة ترتفع بشكل غير متساو.كان رف الخادم القياسي قبل عقد من الزمن يستهلك ما بين 5 إلى 8 كيلووات. واليوم، تستهلك الرفوف ذات الأغراض العامة ما بين 10 إلى 15 كيلووات. تتجاوز رفوف تدريب الحوسبة عالية الأداء والذكاء الاصطناعي بشكل روتيني 30 كيلووات لكل رف. بعضها يتجاوز 50 كيلووات.
وهذا يخلق تحديات في الإدارة الحرارية والتي يجد تبريد الهواء صعوبة في حلها. عند 20 كيلووات لكل رف، يظل تبريد الهواء فعالاً مع الاحتواء المناسب. وعند 30 كيلووات تصبح هامشية. عند 40 كيلووات فما فوق، ينتقل التبريد السائل من الاختياري إلى الضروري.
ثانياً، أصبح تخطيط القدرات تنبؤياً.الطريقة القديمة - شراء سعة أكبر مما هو مطلوب وتركها في وضع الخمول - لم تعد تعمل على نطاق واسع. السعة الخاملة لها تكلفة رأسمالية وتكلفة صيانة مستمرة.
تستخدم أنظمة إدارة البنية التحتية الحديثة البيانات التاريخية والتنبؤ بعبء العمل للتنبؤ بموعد نفاد الطاقة أو التبريد أو مساحة الحامل. يمكن لأفضل الأنظمة أن توصي بإعادة تكوين السعة الحالية أو طلب أجهزة جديدة، قبل أيام أو أسابيع من أن يصبح القيد حرجًا.
ثالثا، متطلبات الرؤية لها على سبيل المثالباند.قد يقوم مركز البيانات التقليدي بتتبع الطاقة على مستوى وحدة PDU. تحتاج المنشأة الحديثة إلى الرؤية على مستوى الحامل، وأحيانًا على مستوى الخادم، وبشكل متزايد على مستوى عبء العمل - معرفة أي جهاز ظاهري أو حاوية تقوم بتشغيل الطاقة التي تستهلكها.
البنية التحتية لمركز البياناتلقد كانت برمجيات الإدارة (DCIM) موجودة منذ أكثر من عقد من الزمن، ولكن اعتمادها لا يزال متفاوتًا. قام أقل من نصف مراكز بيانات المؤسسات بنشر نظام DCIM كاملاً. والعديد منها لم تستخدم سوى جزء صغير من قدراتها.
يقوم نظام DCIM المطبق بشكل صحيح بأربعة أشياء:
إدارة الأصول.يتم تتبع كل خادم ومحول ووحدة PDU ووحدة تبريد في قاعدة بيانات إدارة التكوين (CMDB). الموقع، وتقييم الطاقة، واتصالات الشبكة، وتاريخ الصيانة - كل ذلك. قد يبدو هذا أمرًا أساسيًا، لكن لا تزال العديد من المؤسسات تتتبع الأصول في جداول البيانات التي تمر أشهر بين التحديثات.
مراقبة في الوقت الحقيقي.سحب الطاقة على مستوى وحدة توزيع الطاقة (PDU) أو الحامل، ودرجة الحرارة والرطوبة عند نقاط الإمداد والعودة، وحالة نظام التبريد، وصحة بطارية UPS. يتم تشغيل الإنذارات عندما تنحرف المعلمات عن نقاط الضبط. الهدف هو اكتشاف المشاكل قبل أن تتسبب في التوقف عن العمل.
تخطيط القدرات.يعرف النظام مقدار الطاقة وقدرة التبريد المتاحة، ومقدار الاستخدام، ومقدار ما تم حجزه للنشر في المستقبل. يمكنه تصميم تأثير إضافة حامل جديد عالي الكثافة أو إيقاف مجموعة من الخوادم القديمة.
التصور.يُظهر التوأم الرقمي لمركز البيانات - رفًا تلو الآخر، وبلاطًا تلو الآخر - الظروف الحالية ويسمح للمشغلين بمحاكاة التغييرات. إضافة 10 كيلووات من الحمل إلى الصف الثالث، العمود الرابع: هل يتجاوز ذلك قدرة التبريد؟ يجيب النظام قبل أن يقوم أي شخص بنقل المعدات.
خفض استهلاك الطاقة في مراكز البيانات ليس بالأمر الغامض. الأساليب مفهومة جيدا. التحدي هو الانضباط في التنفيذ.
رفع درجة حرارة الهواء العرض.تعمل معظم مراكز البيانات بشكل بارد - من 18 إلى 20 درجة مئوية عند عودة وحدة التبريد - لأن هذا هو ما يفعله المشغلون دائمًا. توصي إرشادات ASHRAE الآن بـ 24 إلى 27 درجة. وكل زيادة في الدرجة تقلل من طاقة التبريد بنسبة 4 بالمائة تقريبًا. فالجري على درجة حرارة 26 درجة بدلاً من 20 درجة يوفر 20-25 بالمائة من طاقة التبريد.
القضاء على اختلاط الهواء الساخن والبارد.إن احتواء الممر الساخن أو احتواء الممر البارد أو قنوات العادم العمودية تجبر هواء التبريد على الذهاب إلى المكان المطلوب بدلاً من الدوران القصير عبر مقدمة الرفوف. عادةً ما يؤدي الاحتواء وحده إلى تقليل طاقة التبريد بنسبة 15-25 بالمائة.
استخدم محركات الأقراص ذات السرعة المتغيرة.تهدر المراوح والمضخات ذات السرعة الثابتة الطاقة عند التحميل الجزئي. تعمل محركات الأقراص ذات السرعة المتغيرة على مطابقة تدفق الهواء وتدفق المياه مع الطلب الفعلي. فترات الاسترداد التحديثية عادة ما تكون 1-3 سنوات.
تحسين تشغيل UPS.تعمل معظم أنظمة UPS في وضع التحويل المزدوج بشكل مستمر - حيث تقوم بتحويل التيار المتردد إلى تيار مستمر والعودة إلى تيار متردد حتى عندما تكون طاقة المرافق نظيفة. يمكن لأنظمة UPS الحديثة التحول إلى الوضع الاقتصادي عندما تسمح جودة الطاقة بذلك، مما يحقق كفاءة بنسبة 99 بالمائة بدلاً من 94-96 بالمائة. المقايضة هي وقت نقل قصير إلى البطارية في حالة انقطاع طاقة المرافق. بالنسبة لأحمال تكنولوجيا المعلومات مع مصادر الطاقة المصممة لمثل هذه عمليات النقل، فإن المخاطر تكون ضئيلة.
اعتماد توزيع الجهد العالي.يؤدي توزيع الطاقة عند 415 فولت بدلاً من 208 فولت إلى تقليل خسائر التوزيع بنسبة 25 بالمائة تقريبًا. ويتطلب ذلك وحدات PDU ومصادر طاقة للخادم متوافقة، ولكن العديد من الأجهزة الحديثة تدعم ذلك.
شركة شانجيو CPSY، وهي مؤسسة ذات تقنية عالية تركز على البنية التحتية لمراكز البيانات، سجلت معدل استخدام قدره 1.3 لحلول مراكز البيانات المعيارية الخاصة بها. وهذا يضع الشركة في الطبقة الذهبية، وتتجه نحو البلاتينية.
إن توفير الطاقة المزعوم بنسبة 25 بالمائة مقارنة بالتصميمات التقليدية يأتي من عوامل متعددة. تعمل أنظمة UPS المعيارية ذات الكفاءة بنسبة 97.4 بالمائة على مستوى النظام على تقليل خسائر التوزيع التي تتراوح بين 15 إلى 20 بالمائة. تقوم مكيفات الهواء الدقيقة المزودة بضواغط متغيرة السرعة ومراوح EC بضبط مخرجات التبريد لتتناسب مع الحمل الحراري الفعلي بدلاً من التشغيل بقدرة ثابتة. ويعالج التصميم المادي - احتواء الممر الساخن، والتباعد الأمثل بين الرفوف، والأرضية المرتفعة مع البلاط المثقوب ذو الحجم المناسب - إدارة تدفق الهواء التي تقوض العديد من المرافق ذات الكفاءة الأخرى.
تتضمن محفظة شهادات الشركة ISO 9001 (إدارة الجودة) وISO 27001 (إدارة أمن المعلومات). وتشمل عمليات نشر العملاء الخاصة بها شراكات مع Huawei وZTE وInspur، مع منشآت تصدير في الولايات المتحدة والمملكة المتحدة وألمانيا وفرنسا وأستراليا.
لسنوات عديدة، كان التبريد السائل تقنية متخصصة لمراكز الحوسبة الفائقة. وهذا يتغير بسرعة.
تولد مجموعات تدريب الذكاء الاصطناعي التي تستخدم NVIDIA H100 أو وحدات معالجة الرسوميات B200 القادمة ما بين 30 إلى 50 كيلووات لكل حامل في تكوينات مبردة بالهواء تمامًا. عند هذه الكثافات، يتطلب تبريد الهواء معدلات تدفق هواء عالية - مراوح عالية الصوت، وأرفف عميقة، وتحكمًا حراريًا هامشيًا.
يعمل التبريد السائل المباشر على الشريحة على إزالة 60-80 بالمائة من الحرارة عند المصدر. تعمل الرقائق بشكل أكثر برودة. المشجعين يعملون بشكل أبطأ. يعالج مكيف هواء الغرفة فقط الحرارة المتبقية من مصادر الطاقة والذاكرة والمكونات الأخرى.
مكاسب الكفاءة كبيرة. تشير المرافق ذات التبريد المباشر إلى الشريحة إلى قيم PUE تتراوح من 1.1 إلى 1.2. وتتمثل المفاضلات في ارتفاع تكلفة رأس المال، وإدارة أكثر تعقيدًا للتسرب، والحاجة إلى معالجة المياه على مستوى المنشأة.
التبريد الغمر الكامل - غمر الخوادم بأكملها في السائل العازل - يدفع PUE إلى أقل من 1.1 ولكنه يظل متخصصًا. ستعتمد معظم مراكز البيانات التجارية التبريد المباشر على الشريحة أولاً، ثم الغمر لاحقًا في مناطق محددة عالية الكثافة.
تتضمن منصة مركز بيانات SHANGYU أحكامًا لكل من هياكل تبريد الهواء والسائل، مع إدراك أن عمليات النشر عالية الكثافة المستقبلية ستتطلب إدارة حرارية قائمة على السوائل بغض النظر عن تصميم المنشأة.
لا تزال معظم فرق عمليات مراكز البيانات تعمل بشكل تفاعلي. يصدر صوت إنذار. شخص ما يحقق. يتم تطبيق الإصلاح. تتكرر الدورة.
يتطلب الانتقال إلى الإدارة التنبؤية ثلاث قدرات تفتقر إليها العديد من المنظمات.
استكمال بيانات التكوين.إن معرفة ما هو موجود في مركز البيانات - كل خادم، وكل محول، وكل وحدة PDU، وكل وحدة تبريد - هو الأساس. بدون بيانات CMDB الدقيقة، يكون تخطيط السعة مجرد تخمين.
القياس عن بعد الحبيبي.قياس الطاقة على مستوى الرف هو الحد الأدنى. يعد قياس الطاقة لكل خادم أفضل. يعد إسناد الطاقة على مستوى عبء العمل هو الأفضل ولكن الأصعب في تحقيقه.
التحليلات التي تميز الإشارة عن الضوضاء.قد يعني ارتفاع درجة الحرارة في أحد الرفوف فشل المروحة. قد يعني ارتفاع درجة الحرارة في نصف مركز البيانات فشل جهاز التبريد. يحتاج النظام إلى التمييز والتوصية بالاستجابات وفقًا لذلك.
توفر منصة DCIM من SHANGYU دعمًا لجهاز SNMP وModbus، وواجهات تطبيقات Windows المستندة إلى الويب، والتكامل مع كاميرات الشبكة للتصوير المحفز للحدث. الأهداف المعلنة واضحة ومباشرة: تقليل وقت التوقف عن العمل المكلف، وخفض تكاليف التشغيل اليومية من خلال التحكم البيئي الكامل، وتحسين رؤية الإدارة وإمكانية التتبع.
يمثل استهلاك الطاقة في مراكز البيانات ما يقرب من 1 بالمائة من الطلب العالمي على الكهرباء. يبدو هذا الرقم صغيرًا حتى يتم وضعه في السياق. وهو يعادل تقريبًا إجمالي استهلاك الكهرباء في المملكة المتحدة.
والأهم من ذلك أن معدل النمو يتسارع. تشير توقعات الصناعة إلى زيادة الطلب على الطاقة في مراكز البيانات بنسبة 10-15 بالمائة سنويًا حتى عام 2030، مدفوعًا بالذكاء الاصطناعي واعتماد السحابة والتوسع المستمر في الأجهزة المتصلة. وبهذا المعدل، ستستهلك مراكز البيانات ما بين 3% إلى 4% من الكهرباء العالمية بحلول نهاية العقد.
جاءت مكاسب الكفاءة التي أبقت استهلاك الطاقة ثابتًا خلال العقد الماضي من المحاكاة الافتراضية للخادم (تقليل عدد الخوادم الفعلية)، وتحسين كفاءة محرك الأقراص (الانتقال من الأقراص الدوارة إلى محركات أقراص الحالة الصلبة)، والنشر الواسع للتبريد المجاني (باستخدام الهواء الخارجي بدلاً من التبريد الميكانيكي). لقد تم قطف تلك الثمار المنخفضة إلى حد كبير.
وستأتي الموجة التالية من الكفاءة من التبريد السائل، وتوزيع الجهد العالي، وضوابط التبريد المحسنة بواسطة الذكاء الاصطناعي، وربما الأهم من ذلك، المواءمة الأفضل بين سعة البنية التحتية والحمل الفعلي لتكنولوجيا المعلومات. تتطلب هذه القطعة الأخيرة نوعًا من الرؤية في الوقت الفعلي والتحليلات التنبؤية التي توفرها أنظمة DCIM ولكن القليل من المرافق تستخدم بشكل كامل.
هل تعرف رقم PUE الفعلي لديك، وليس الرقم الموجود في ورقة المواصفات؟إذا لم تقم بالقياس عند مخرج UPS وعند إدخال معدات تكنولوجيا المعلومات، فأنت لا تعرف. الفرق هو النفقات العامة الحقيقية الخاصة بك.
هل أنظمة التبريد الخاصة بك تقاتل بعضها البعض؟في العديد من مراكز البيانات، يتم ضبط وحدات CRAC بنطاقات درجة حرارة ورطوبة متداخلة. وحدة واحدة تزيل الرطوبة بينما تقوم وحدة أخرى بترطيبها. واحد يبرد بينما الآخر يسخن. هذا ليس غير عادي. كما أنها ليست فعالة.
ما هو سحب الطاقة الخامل لخوادمك؟تُظهر بيانات الصناعة أن خوادم المؤسسات النموذجية تستهلك ما بين 30 إلى 40 بالمائة من طاقتها القصوى عند عدم القيام بأي شيء. يعد إيقاف تشغيل الخوادم غير المستخدمة أو إيقافها عن العمل هو أعلى مقياس متاح لكفاءة عائد الاستثمار. وهو أيضًا الأكثر إغفالًا.
هل يمكنك رفع درجة حرارة الهواء لديك بمقدار درجتين دون مخالفة مواصفات المعدات؟من المحتمل نعم. تم تصنيف معظم المعدات لدرجات حرارة دخول تتراوح بين 25 و27 درجة. تعمل معظم مراكز البيانات بدرجة حرارة 20-22 درجة. تمثل فجوة الست درجات سنوات من طاقة التبريد غير الضرورية.
متى كانت آخر مرة قمت فيها بالتحقق من كفاءة UPS لديك؟يتم قياس كفاءة اللوحة عند التحميل الكامل باستخدام عامل الطاقة المثالي. يمكن أن تكون الكفاءة في العالم الحقيقي عند التحميل الجزئي مع عامل الطاقة في العالم الحقيقي أقل بمقدار 5 إلى 10 نقاط.