বাউজি: সফট লকআপ - সিপিইউ # এক্স সেকেন্ডের জন্য আটকে রয়েছে


33

আমি একটি নগ্যিং সম্পর্কিত কয়েকটি বাগ রিপোর্ট এবং প্রশ্নগুলি (স্ট্যাকেক্সচেঞ্জ এবং অন্য কোথাও) দেখেছি "BUG: soft lockup - CPU#<n> stuck for <dt>s!"। এখন পর্যন্ত আমি কী করব বা চেষ্টা করব সে সম্পর্কে কোনও ধারণা খুঁজে পাইনি (বরং, আমি যে চিহ্নগুলি খুঁজে পেয়েছি এবং অনুসরণ করেছি সেগুলি এটিকে থামিয়ে দেয়নি)। আমি এই সম্পর্কে আরও উদ্বিগ্ন কারণ:

  1. এই ইভেন্টগুলির ফ্রিকোয়েন্সি মনে হচ্ছে ইদানীং বৃদ্ধি পেয়ে ধীরে ধীরে বেড়েছে (প্রতি মাসে 700 এর বেশি),
  2. yum update এবং রিবুট এটি কিছুক্ষণের জন্য কিছুটা কমিয়ে দিয়েছে তবে আমি আবার কিছু লকআপগুলি আবার হতে শুরু করে দেখেছি,
  3. বেশ কয়েকটি প্রক্রিয়া (যদি পুরো হোস্ট না হয় তবে তা বলা শক্ত), অবশ্যই আমার সমস্ত ইন্টারেক্টিভ শেলগুলি যখন কিছু ঘটে তখন কিছু সময়ের জন্য হিমায়িত হয়,
  4. এটি সম্পর্কিত কিনা তা সম্পর্কে আমি নিশ্চিত নই, তবে আমি এনটিপিডি সম্পর্কিত প্রচুর লগ / বার্তাগুলি ঘড়ি আপডেট করতে সক্ষম হচ্ছি না।

নীচে একটি উদ্ধৃতি $(grep 'soft lockup' /var/log/messages*):

Mar 22 10:02:35 localhost kernel: BUG: soft lockup - CPU#15 stuck for 10s! [kjournald:1048]
Mar 22 10:02:36 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372]
Mar 22 10:02:36 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [postgres:5368]
Mar 22 10:02:37 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372]
Mar 22 10:02:37 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [postgres:5368]
Mar 22 10:02:38 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372]
Mar 22 10:02:38 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [postgres:5368]
Mar 22 10:02:39 localhost kernel: BUG: soft lockup - CPU#0 stuck for 10s! [postgres:5372]
Mar 22 10:02:39 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [postgres:5368]
Mar 22 10:02:40 localhost kernel: BUG: soft lockup - CPU#15 stuck for 25s! [swapper:0]
Mar 22 15:42:16 localhost kernel: BUG: soft lockup - CPU#8 stuck for 25s! [kjournald:1048]
Mar 22 18:22:13 localhost kernel: BUG: soft lockup - CPU#15 stuck for 10s! [postgres:21356]
Mar 22 18:22:20 localhost kernel: BUG: soft lockup - CPU#7 stuck for 10s! [java:8653]
Mar 22 18:22:20 localhost kernel: BUG: soft lockup - CPU#8 stuck for 72s! [kjournald:1048]
Mar 22 21:21:37 localhost kernel: BUG: soft lockup - CPU#12 stuck for 29s! [kjournald:1048]
Mar 22 21:22:07 localhost kernel: BUG: soft lockup - CPU#12 stuck for 27s! [kjournald:1048]
Mar 23 02:01:47 localhost kernel: BUG: soft lockup - CPU#8 stuck for 10s! [kblockd/8:276]
Mar 23 02:02:22 localhost kernel: BUG: soft lockup - CPU#8 stuck for 34s! [kblockd/8:276]

এটি এলোমেলো প্রক্রিয়াগুলির সাথে ঘটে এবং এটি ভার্চুয়াল হোস্টের 16 "কোর" জুড়ে বেশ ভাল বিতরণ করা হয়েছে।

হোস্টটি হ'ল AWS EC2 "cc1.4xlarge" উদাহরণ, "EC2 CentOS 5.5 GPU HVM AMI (ড্রাইভার 260.19.29) (ami-42a2532b)" নামক একটি এএমআই রয়েছে। এটি জেনের সাথে ভার্চুয়ালাইজড বলে মনে হচ্ছে।

cat /etc/redhat-releaseফলন CentOS release 5.9 (Final)'free'21 গিগাবাইট র্যাম রিপোর্ট করে।

প্রধান dmesgহলেন:

Linux version 2.6.18-348.3.1.el5 (mockbuild@builder10.centos.org) (gcc version 4.1.2 20080704 (Red Hat 4.1.2-54)) #1 SMP Mon Mar 11 19:39:25 EDT 2013
Command line: ro root=/dev/VolGroup00/LogVol00 rhgb quiet console=tty0 console=ttyS0,115200n8
BIOS-provided physical RAM map:
 BIOS-e820: 0000000000010000 - 000000000009fc00 (usable)
 BIOS-e820: 000000000009fc00 - 00000000000a0000 (reserved)
 BIOS-e820: 00000000000e0000 - 0000000000100000 (reserved)
 BIOS-e820: 0000000000100000 - 00000000c0000000 (usable)
 BIOS-e820: 00000000fc000000 - 0000000100000000 (reserved)
 BIOS-e820: 0000000100000000 - 00000005dd800000 (usable)
DMI 2.4 present.
DMI: Xen HVM domU, BIOS 3.4.3-2.6.18 08/29/2012
ACPI: RSDP (v002    Xen                                ) @ 0x00000000000ea020
ACPI: XSDT (v001    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc0062b0
ACPI: FADT (v004    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc005ee0
ACPI: MADT (v002    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc005fe0
ACPI: SRAT (v001    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc0060c0
ACPI: SLIT (v001    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc006240
ACPI: HPET (v001    Xen      HVM 0x00000000 HVML 0x00000000) @ 0x00000000fc006270
ACPI: DSDT (v002    Xen      HVM 0x00000000 INTL 0x20090220) @ 0x(null)

নিম্নলিখিত শো সাম্প্রতিক সময়ের এই "নরম লকআপ" র ক্রমসঞ্চিত COUNT (রেডলাইন যখন আমি গত করেনি yum updateদ্বারা অনুসরণ reboot): নরম লকআপগুলির সংখ্যা কমুল count

নিম্নলিখিত শো স্থিতিকালের হিস্টোগ্রাম (কতকাল হোস্ট আটকে): সময়কাল হিস্টোগ্রাম


1
সম্ভাব্য কারণ টন। আমি একবার এটি কেভিএম ইভেন্টে পেয়েছি। কারণ হোস্ট নেটওয়ার্ক ড্রাইভার (রিয়েলটেক) ছিল, যা ভার্চুয়ালাইজেশন প্রত্যাশা করে না এমন উচ্চ নেটওয়ার্ক লোডের উপর এমন কিছু করবে যা আপনি ভিএমগুলিতে সিপিইউ আটকে রাখবেন। সুতরাং মূলত নেটওয়ার্ক ড্রাইভারের মধ্যে একটি বাগ যা রাস্তায় আরও কিছু সমস্যা সমাধান করেছিল। সমাধানটি অন্য কোনও কার্নেল সংস্করণে (হোস্টে) স্যুইচ করা ছিল যা সেই নির্দিষ্ট আচরণকে ট্রিগার করে না।
frostschutz

1
আমরা এই ত্রুটি বার্তাটি পেয়েছি, কারণ কিছু সার্ভিসে ভিজিপিয়াল সিপিইউর তুলনায় কিছু ভিএমএসের আরও ভিসিপাস কনফিগার করা ছিল, আমরা আমাদের জেন হোস্টে স্থানান্তরিত করেছি।
জার্গ লুডভিগ

উত্তর:


11

আমার কাছে এই সমস্যাটি জেন ​​4.2 এ 3.6 এবং 3.8 কার্নেল (আলপাইনলিনাক্স) সহ রয়েছে।

আমি চারপাশে এবং আমার কার্নেলটিতে ক্লকসোর্স = জিফি যুক্ত করে এটি ঠিক করেছি। জিফির পরিবর্তে আপনি "পিট" ব্যবহার করে দেখতেও পারেন।

বিআইওএস-এ সি-রাজ্যগুলি অক্ষম করারও খবর রয়েছে ।


4
এই কার্নেল পরামিতিগুলি কী করে?
বুরহান আলী

2
ক্লকসোর্সটি আমার কাছে বেশ সুস্পষ্ট বলে মনে হয় এবং সি-স্টেটস হ'ল সিপিইউর পাওয়ার স্টেটস।
ফ্রাঞ্জ বেটাগ

+1 টি। সি-রাজ্যগুলি অক্ষম করা আমার পক্ষে কাজ করেছিল।
অ্যান্ড্রু এনসলে

2

আমার থিঙ্কপ্যাড টি 520 নিয়ে আমার একই সমস্যা ছিল। তবে কার্নেলে দূরে হ্যাক না করে আমি আরও সাধারণ কিছু করেছি। প্রথমে আমি Centos7 ব্যবহার করছি আমি বেস সিস্টেমটি ইনস্টল করেছিলাম সমস্ত ঠিকঠাক। আমি পরে জিনোম জিইউআই যুক্ত করেছি যা পরে যখন আমি উপরে উল্লিখিত সমস্যাগুলি পাওয়া শুরু করি। আমি লক্ষ্য করেছি যে উইন্ডোজ ইনস্টলগুলির জন্য প্রচুর নির্মাতারা সেট আপ করেছেন। গ্রাফিক্স কার্ডটি সাধারণত উইন 7 (এনভিআইডিএ অপটিমাস) এর জন্য সেটআপ হয় আমি এটিকে সংহত গ্রাফিক্স মোডে পুনরায় সেট করি এবং কোনও ঝুলন্ত / ত্রুটি নেই। এটা কিভাবে করতে হবে? BIOS এ যাওয়ার জন্য আপনার থিংকপ্যাড হিট F1 বা নীল ভাবনা বাটনটি পুনরায় বুট করুন। গ্রাফিকগুলিতে যান ইন্টিগ্রেটেড গ্রাফিক্স নির্বাচন করুন তারপরে F10 সংরক্ষণ এবং প্রস্থান করতে। এই কার্ডের জন্য এখানে 3 টি সেটিং রয়েছে: ইন্টিগ্রেটেড, ডিসক্রেট এবং এনভিআইডিএ অপটিমাস (কেবল উইন 7?) আশা করি এটি কারও কিছুটা সময় সাশ্রয় করবে?


দীর্ঘশ্বাস, বেশিরভাগ সমস্ত কিছুর মতো, পৃথকভাবে স্টাফ ইনস্টল করা হ'ল না। অফিস এবং অন্যান্য বকাবকি দিয়ে ফুলে যাওয়া ডেস্কটপ সংস্করণে ফিরে যান :(
মেরজয়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.