সার্ভার: পাওয়ারেডেজ আর 620
ওএস: আরএইচএল 6.4
কার্নেল: 2.6.32-358.18.1.el6.x86_64
আমি আমার উত্পাদন পরিবেশে অ্যাপ্লিকেশন অ্যালার্মের অভিজ্ঞতা নিচ্ছি। ক্রিটিকাল সিপিইউ ক্ষুধার্ত প্রক্রিয়াগুলি সংস্থান থেকে সঞ্চারিত হচ্ছে এবং একটি প্রক্রিয়াজাতকরণ ব্যাকলগ তৈরি করছে। সমস্যাটি সম্প্রতি প্রকাশিত ক্লাস্টারে 12 তম জেনারেশন ডেল সার্ভারগুলিতে (r620s) চলছে। কাছাকাছি হিসাবে আমি বলতে পারি, এই ঘটনাকেই দৃষ্টান্ত শিখর CPU- র ব্যবহার পর্যন্ত মিলে হয়, মধ্যে "ক্ষমতা সীমা প্রজ্ঞাপন" স্প্যাম বিপুল পরিমাণে দ্বারা অনুষঙ্গী dmesg
। এর মধ্যে একটি ঘটনার একটি অংশ:
Nov 7 10:15:15 someserver [.crit] CPU12: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU0: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU6: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU14: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU18: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU2: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU4: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU16: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU0: Package power limit notification (total events = 11)
Nov 7 10:15:15 someserver [.crit] CPU6: Package power limit notification (total events = 13)
Nov 7 10:15:15 someserver [.crit] CPU14: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU18: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU20: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU8: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU2: Package power limit notification (total events = 12)
Nov 7 10:15:15 someserver [.crit] CPU10: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU22: Core power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU4: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU16: Package power limit notification (total events = 13)
Nov 7 10:15:15 someserver [.crit] CPU20: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU8: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU10: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU22: Package power limit notification (total events = 14)
Nov 7 10:15:15 someserver [.crit] CPU15: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU3: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU1: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU5: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU17: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU13: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU15: Package power limit notification (total events = 375)
Nov 7 10:15:15 someserver [.crit] CPU3: Package power limit notification (total events = 374)
Nov 7 10:15:15 someserver [.crit] CPU1: Package power limit notification (total events = 376)
Nov 7 10:15:15 someserver [.crit] CPU5: Package power limit notification (total events = 376)
Nov 7 10:15:15 someserver [.crit] CPU7: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU19: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU17: Package power limit notification (total events = 377)
Nov 7 10:15:15 someserver [.crit] CPU9: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU21: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU23: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU11: Core power limit notification (total events = 369)
Nov 7 10:15:15 someserver [.crit] CPU13: Package power limit notification (total events = 376)
Nov 7 10:15:15 someserver [.crit] CPU7: Package power limit notification (total events = 375)
Nov 7 10:15:15 someserver [.crit] CPU19: Package power limit notification (total events = 375)
Nov 7 10:15:15 someserver [.crit] CPU9: Package power limit notification (total events = 374)
Nov 7 10:15:15 someserver [.crit] CPU21: Package power limit notification (total events = 375)
Nov 7 10:15:15 someserver [.crit] CPU23: Package power limit notification (total events = 374)
একটি সামান্য গুগল ফু প্রকাশ করেছে যে এটি সাধারণত সিপিইউতে গরম চলছে বা ভোল্টেজের নিয়ন্ত্রণের সাথে জড়িত। ক্লাস্টারের সমস্ত সার্ভারের জন্য তাপমাত্রা সেন্সরগুলি ঠিকঠাক চলছে, পাওয়ার ক্যাপ নীতি আইডিআরএসি-তে অক্ষম রয়েছে এবং আমার সিস্টেম প্রোফাইলটি এই সার্ভারের সমস্তটিতে "পারফরম্যান্স" এ সেট করা আছে:
# omreport chassis biossetup | grep -A10 'System Profile'
System Profile Settings
------------------------------------------
System Profile : Performance
CPU Power Management : Maximum Performance
Memory Frequency : Maximum Performance
Turbo Boost : Enabled
C1E : Disabled
C States : Disabled
Monitor/Mwait : Enabled
Memory Patrol Scrub : Standard
Memory Refresh Rate : 1x
Memory Operating Voltage : Auto
Collaborative CPU Performance Control : Disabled
- একটি ডেল মেলিং তালিকা পোস্ট লক্ষণগুলি প্রায় পুরোপুরি বর্ণনা করে। ডেল পরামর্শ দিয়েছিলেন যে লেখক পারফরম্যান্স প্রোফাইলটি ব্যবহার করার চেষ্টা করুন, তবে তাতে কোনও লাভ হয়নি। কম বিলম্বিত পরিবেশের জন্য একটি সার্ভার কনফিগার করার জন্য ডেলের গাইডে কিছু সেটিংস প্রয়োগ করে তিনি সেগুলির মধ্যে একটি (বা এর সংমিশ্রণ) সমস্যার সমাধান করেছেন বলে মনে হয়।
- কার্নেল.আর.জি. বাগ # 36182 নোট করে যে পাওয়ার-সীমা ব্যাহত ডিবাগটি ডিফল্টরূপে সক্ষম করা হয়েছিল, যা সিপিইউ ভোল্টেজ রেগুলেশন লাথি মারছে এমন পরিস্থিতিতে পরিস্থিতিগুলিতে কর্মক্ষমতা হ্রাস পাচ্ছে ।
- একটি RHN কে.বি. নিবন্ধ (পিএমআর লগইন আবশ্যক) উল্লেখ করেছে যে পিই r620 এবং r720 সার্ভারগুলি পারফরম্যান্স প্রোফাইলটি চালাচ্ছে না এমন ক্ষেত্রে প্রভাব ফেলবে এবং দু'সপ্তাহ আগে প্রকাশিত কার্নেলের আপডেটের প্রস্তাব দেয়। ... বাদে আমরা পারফরম্যান্স প্রোফাইল চালাচ্ছি ...
আমি অনলাইনে যা কিছু পেতে পারি তা এখানে আমাকে চেনাশোনাতে চালাচ্ছে। হ্যাক কি চলছে?