লিনাক্স উবুন্টুতে গড় বিস্মৃততা লোড করুন


9

বিগত কয়েকদিন ধরে আমি আমাদের অবকাঠামোতে যে অদ্ভুততা ঘটছে তা বোঝার চেষ্টা করেছি কিন্তু আমি এটি আমাদের অনুধাবন করতে সক্ষম হইনি তাই আমি আপনাকে কিছু ইঙ্গিত দেওয়ার জন্য আপনাকে বলছি।

আমি গ্রাফাইটে লক্ষ্য করছি, লোড_এভিজে স্পাইক যা প্রায় 2 ঘন্টা পরে মারাত্মক নিয়মিততার সাথে ঘটে থাকে - এটি ঠিক 2 ঘন্টা নয় তবে এটি খুব নিয়মিত। আমি গ্রাফাইট থেকে নেওয়া এর একটি স্ক্রিনশট সংযুক্ত করছি

অ্যাভারেজ লোড করুন - প্রসারিত করতে ক্লিক করুন

আমি এটি তদন্তে আটকে গিয়েছি - এর নিয়মিততা আমাকে ভাবতে পরিচালিত করেছিল যে এটি কোনও ধরণের ক্রোন জব বা এরকম কিছু তবে এই সার্ভারগুলিতে কোনও ক্রোনজব রয়েছে না - আসলে এগুলি র্যাকস্পেস ক্লাউডে চলছে ভিএম s আমি যা খুঁজছি তা হ'ল এক ধরণের ইঙ্গিত হতে পারে যে এই সমস্যাগুলি তৈরি করছে এবং কীভাবে এটি আরও তদন্ত করা যায়।

সার্ভারগুলি মোটামুটি নিষ্ক্রিয় - এটি একটি মঞ্চের পরিবেশ তাই প্রায় ট্র্যাফিক আসেনি / সেগুলিতে কোনও বোঝা থাকার কথা নয়। এগুলি হ'ল 4 টি ভার্চুয়াল কোর ভিএম। আমি যা নিশ্চিতভাবে জানি তা হ'ল আমরা প্রতি 10 সেকেন্ডে গ্রাফাইটের একগুচ্ছ নমুনা নিচ্ছি তবে এটি যদি বোঝার কারণ হয় তবে আমি আশা করি যে এটি প্রতিটি সার্ভারে 2 ঘন্টার তরঙ্গ হওয়ার চেয়ে ক্রমাগত উচ্চতর হবে।

এটি কীভাবে তদন্ত করতে হবে তার কোনও সাহায্যের প্রশংসা হবে!


এখানে অ্যাপ01 এর জন্য সর থেকে কিছু ডেটা দেওয়া হয়েছে - যা উপরের ছবিতে প্রথম নীল স্পাইক - আমি ডেটা থেকে কোনও সিদ্ধান্ত নিতে সক্ষম হইনি। এছাড়াও এটি নয় যে বাইটস স্পাইক লিখেছেন যা আপনি প্রতি আধা ঘন্টা (প্রতিটি 2 ঘন্টা নয়) ঘটতে দেখছেন প্রতি 30 মিনিটে শেফ-ক্লায়েন্টের কারণে চলছে। আমি আরও ডেটা সংগ্রহ করার চেষ্টা করব যদিও আমি ইতিমধ্যে এটি করে ফেলেছি তবে সেগুলির থেকে সত্যই কোনও সিদ্ধান্ত নিতে পারিনি।

বোঝা

09:55:01 PM   runq-sz  plist-sz   ldavg-1   ldavg-5  ldavg-15   blocked
10:05:01 PM         0       125      1.28      1.26      0.86         0
10:15:01 PM         0       125      0.71      1.08      0.98         0
10:25:01 PM         0       125      4.10      3.59      2.23         0
10:35:01 PM         0       125      0.43      0.94      1.46         3
10:45:01 PM         0       125      0.25      0.45      0.96         0
10:55:01 PM         0       125      0.15      0.27      0.63         0
11:05:01 PM         0       125      0.48      0.33      0.47         0
11:15:01 PM         0       125      0.07      0.28      0.40         0
11:25:01 PM         0       125      0.46      0.32      0.34         0
11:35:01 PM         2       130      0.38      0.47      0.42         0
11:45:01 PM         2       131      0.29      0.40      0.38         0
11:55:01 PM         2       131      0.47      0.53      0.46         0
11:59:01 PM         2       131      0.66      0.70      0.55         0
12:00:01 AM         2       131      0.81      0.74      0.57         0

সিপিইউ

09:55:01 PM     CPU     %user     %nice   %system   %iowait    %steal     %idle
10:05:01 PM     all      5.68      0.00      3.07      0.04      0.11     91.10
10:15:01 PM     all      5.01      0.00      1.70      0.01      0.07     93.21
10:25:01 PM     all      5.06      0.00      1.74      0.02      0.08     93.11
10:35:01 PM     all      5.74      0.00      2.95      0.06      0.13     91.12
10:45:01 PM     all      5.05      0.00      1.76      0.02      0.06     93.10
10:55:01 PM     all      5.02      0.00      1.73      0.02      0.09     93.13
11:05:01 PM     all      5.52      0.00      2.74      0.05      0.08     91.61
11:15:01 PM     all      4.98      0.00      1.76      0.01      0.08     93.17
11:25:01 PM     all      4.99      0.00      1.75      0.01      0.06     93.19
11:35:01 PM     all      5.45      0.00      2.70      0.04      0.05     91.76
11:45:01 PM     all      5.00      0.00      1.71      0.01      0.05     93.23
11:55:01 PM     all      5.02      0.00      1.72      0.01      0.06     93.19
11:59:01 PM     all      5.03      0.00      1.74      0.01      0.06     93.16
12:00:01 AM     all      4.91      0.00      1.68      0.01      0.08     93.33

আই

09:55:01 PM       tps      rtps      wtps   bread/s   bwrtn/s
10:05:01 PM      8.88      0.15      8.72      1.21    422.38
10:15:01 PM      1.49      0.00      1.49      0.00     28.48
10:25:01 PM      1.54      0.00      1.54      0.03     29.61
10:35:01 PM      8.35      0.04      8.31      0.32    411.71
10:45:01 PM      1.58      0.00      1.58      0.00     30.04
10:55:01 PM      1.52      0.00      1.52      0.00     28.36
11:05:01 PM      8.32      0.01      8.31      0.08    410.30
11:15:01 PM      1.54      0.01      1.52      0.43     29.07
11:25:01 PM      1.47      0.00      1.47      0.00     28.39
11:35:01 PM      8.28      0.00      8.28      0.00    410.97
11:45:01 PM      1.49      0.00      1.49      0.00     28.35
11:55:01 PM      1.46      0.00      1.46      0.00     27.93
11:59:01 PM      1.35      0.00      1.35      0.00     26.83
12:00:01 AM      1.60      0.00      1.60      0.00     29.87

অন্তর্জাল:

10:25:01 PM     IFACE   rxpck/s   txpck/s    rxkB/s    txkB/s   rxcmp/s   txcmp/s  rxmcst/s
10:35:01 PM        lo      8.36      8.36      2.18      2.18      0.00      0.00      0.00
10:35:01 PM      eth1      7.07      4.77      5.24      2.42      0.00      0.00      0.00
10:35:01 PM      eth0      2.30      1.99      0.24      0.51      0.00      0.00      0.00
10:45:01 PM        lo      8.35      8.35      2.18      2.18      0.00      0.00      0.00
10:45:01 PM      eth1      3.69      3.45      0.65      2.22      0.00      0.00      0.00
10:45:01 PM      eth0      1.50      1.33      0.15      0.36      0.00      0.00      0.00
10:55:01 PM        lo      8.36      8.36      2.18      2.18      0.00      0.00      0.00
10:55:01 PM      eth1      3.66      3.40      0.64      2.19      0.00      0.00      0.00
10:55:01 PM      eth0      0.79      0.87      0.08      0.29      0.00      0.00      0.00
11:05:01 PM        lo      8.36      8.36      2.18      2.18      0.00      0.00      0.00
11:05:01 PM      eth1      7.29      4.73      5.25      2.41      0.00      0.00      0.00
11:05:01 PM      eth0      0.82      0.89      0.09      0.29      0.00      0.00      0.00
11:15:01 PM        lo      8.34      8.34      2.18      2.18      0.00      0.00      0.00
11:15:01 PM      eth1      3.67      3.30      0.64      2.19      0.00      0.00      0.00
11:15:01 PM      eth0      1.27      1.21      0.11      0.34      0.00      0.00      0.00
11:25:01 PM        lo      8.32      8.32      2.18      2.18      0.00      0.00      0.00
11:25:01 PM      eth1      3.43      3.35      0.63      2.20      0.00      0.00      0.00
11:25:01 PM      eth0      1.13      1.09      0.10      0.32      0.00      0.00      0.00
11:35:01 PM        lo      8.36      8.36      2.18      2.18      0.00      0.00      0.00
11:35:01 PM      eth1      7.16      4.68      5.25      2.40      0.00      0.00      0.00
11:35:01 PM      eth0      1.15      1.12      0.11      0.32      0.00      0.00      0.00
11:45:01 PM        lo      8.37      8.37      2.18      2.18      0.00      0.00      0.00
11:45:01 PM      eth1      3.71      3.51      0.65      2.20      0.00      0.00      0.00
11:45:01 PM      eth0      0.75      0.86      0.08      0.29      0.00      0.00      0.00
11:55:01 PM        lo      8.30      8.30      2.18      2.18      0.00      0.00      0.00
11:55:01 PM      eth1      3.65      3.37      0.64      2.20      0.00      0.00      0.00
11:55:01 PM      eth0      0.74      0.84      0.08      0.28      0.00      0.00      0.00

ক্রোনজবস সম্পর্কে কৌতূহলযুক্ত লোকদের জন্য। সার্ভারে সেট করা সমস্ত ক্রোনজবসের সংক্ষিপ্তসারটি এখানে রয়েছে (আমি অ্যাপ্লিকেশন 01 বেছে নিয়েছি তবে একই ক্রোনজবস সেটআপ করার সাথে এটি কয়েকটি অন্যান্য সার্ভারেও ঘটছে)

$ ls -ltr /etc/cron*
-rw-r--r-- 1 root root  722 Apr  2  2012 /etc/crontab

/etc/cron.monthly:
total 0

/etc/cron.hourly:
total 0

/etc/cron.weekly:
total 8
-rwxr-xr-x 1 root root 730 Dec 31  2011 apt-xapian-index
-rwxr-xr-x 1 root root 907 Mar 31  2012 man-db

/etc/cron.daily:
total 68
-rwxr-xr-x 1 root root  2417 Jul  1  2011 popularity-contest
-rwxr-xr-x 1 root root   606 Aug 17  2011 mlocate
-rwxr-xr-x 1 root root   372 Oct  4  2011 logrotate
-rwxr-xr-x 1 root root   469 Dec 16  2011 sysstat
-rwxr-xr-x 1 root root   314 Mar 30  2012 aptitude
-rwxr-xr-x 1 root root   502 Mar 31  2012 bsdmainutils
-rwxr-xr-x 1 root root  1365 Mar 31  2012 man-db
-rwxr-xr-x 1 root root  2947 Apr  2  2012 standard
-rwxr-xr-x 1 root root   249 Apr  9  2012 passwd
-rwxr-xr-x 1 root root   219 Apr 10  2012 apport
-rwxr-xr-x 1 root root   256 Apr 12  2012 dpkg
-rwxr-xr-x 1 root root   214 Apr 20  2012 update-notifier-common
-rwxr-xr-x 1 root root 15399 Apr 20  2012 apt
-rwxr-xr-x 1 root root  1154 Jun  5  2012 ntp

/etc/cron.d:
total 4
-rw-r--r-- 1 root root 395 Jan  6 18:27 sysstat
$ sudo ls -ltr /var/spool/cron/crontabs 
total 0
$

আপনি দেখতে পাচ্ছেন যে কোনও ঘন্টা ক্রোনজবস নেই। কেবল দৈনিক / সাপ্তাহিক ইত্যাদি

আমি একসংখ্যক পরিসংখ্যান সংগ্রহ করেছি (ভিএমস্ট্যাট, এমপিস্ট্যাট, আইওস্ট্যাট) - তবে আমি চেষ্টা করছি খুব সহজেই আমি এমন কোনও লিড দেখতে পাচ্ছি না যা কোনও ভিএম উপাদানকে দুর্ব্যবহারের পরামর্শ দেয় ... আমি হাইপারভাইজারের সম্ভাব্য সমস্যার দিকে ঝুঁকতে শুরু করছি। পরিসংখ্যানগুলিতে একবার নির্দ্বিধায় মনে করুন গিস্টটি "আপত্তিকর" সময়ের চারপাশে সর-কিউ আউটপুট দিয়ে শুরু হবে এবং তারপরে আপনি ভিএম, এমপি এবং আইওস্ট্যাটগুলি দেখতে পাবেন ....

মূলত এটি এখনও আমার কাছে সম্পূর্ণ রহস্য ...


আপনার কাছে আরও তদন্ত করার জন্য ভাগ করার মতো কোনও ইন্টারেক্টিভ ডেটা রয়েছে (যেমন, পুনরাবৃত্ত লোড স্পাইকের সময় 'শীর্ষ', 'হটপ' এবং 'আইটপ' প্রদর্শন কী করবেন)? এছাড়াও, আপনি প্রশ্নগুলির সময়কালে আপনার অ্যাপ্লিকেশন লগগুলি পরীক্ষা করে দেখেছেন যে তারা কোনও অদ্ভুত আচরণ প্রদর্শন করছে কিনা? অতিরিক্তভাবে, আপনার কি কোনও হোস্টের অনুরূপ কনফিগারেশনগুলি পাবলিক ক্লাউড অবকাঠামোতে হোস্ট করা নেই এবং যদি তাই হয়, তবে তারা কি একই রকম আচরণ প্রদর্শন করছে?
esquireofoz 6'13

অ্যাপ্লিকেশন লগগুলির নিরিখে - কিছুই হচ্ছে না। এতে থাকা কেবলমাত্র লগ এন্ট্রিগুলি হ'ল মনিটরিং থেকে যাচাই করা প্রতি মিনিটে যাচাই করা হয় - মূলত মনিটরিং সিস্টেমটি মূল সাইটটিকে আঘাত করে এবং ফলাফলের কোডের প্রতিবেদন করে - লগগুলি ব্যতীত খালি। এছাড়াও আপনি দেখতে পাচ্ছেন উপরে বিভিন্ন হোস্ট রয়েছে - এটি তাদের সকলের মধ্যেই ঘটছে (রেডিস, অ্যাপ সার্ভার, শেফ সার্ভার ইত্যাদি)
মিলোসাজডোস

আপনি কি এটিকে সংকীর্ণ করার জন্য psacct ব্যবহার করার চেষ্টা করেছেন ?
HTTP500

আপনি নিয়মিততা অনুমান করেন, তবে আপনি যে ডেটা দেখান তা কোনও নিয়মিত ঘটছে স্পাইকগুলি দেখায় না .. দয়া করে সঠিক সময়কালে এটি নির্দিষ্ট সময়কাল সম্পর্কে নির্দিষ্টভাবে নির্দিষ্ট হন (সম্ভবত বেশ কয়েক দিন ধরে? ছবিতে, কোনও নিয়মিততা নেই)) প্রতি 1mn বা আরও একটি "টপ-এন 1" চালান এবং সেগুলিকে একটি ফাইলে রাখুন এবং এটি একই সাথে সিপু-র জন্য অন্যান্য প্রক্রিয়াগুলি কী প্রতিযোগিতা করছে তা দেখতে সহায়তা করতে পারে একই সাথে স্পাইক দেখা দেয়। যদি অ্যাপ 1 হ'ল কোনও ইন্টারনেট মুখোমুখি অ্যাপ্লিকেশন, সম্ভবত এটির মধ্যে কেউ অ্যাক্সেস পেয়ে এই আচরণটি জোর করে? খুব নিয়মিত "নেটস্ট্যাট-অন" লগিং যুক্ত করুন (প্রতি মিনিটে?)
অলিভিয়ার ডুলাক

আপনি সংযুক্ত স্ক্রিনশটটি দেখেছেন? যদি এটি নিয়মিত না দেখায় আমি জানি না কী করে। আমি এখন সারের জন্য নমুনার সময়কাল বাড়িয়েছি তাই প্রতি 5 মিনিটে আমি নমুনা নিচ্ছি। ছবিটিতে নিয়মিততা সুস্পষ্টর চেয়ে বেশি - এটি প্রতি দুই ঘন্টা পরে ঘটে থাকে। এটি মোটেই কোনও ট্র্যাফিকের সাথে মঞ্চসই পরিবেশ নয় - যেমন আপনি অবশ্যই নেটওয়ার্ক পরিসংখ্যানের উপরের সর্ট আউটপুটগুলি থেকে দেখতে পাচ্ছেন।
milosgajdos

উত্তর:


3

মজাদার.

প্রথমত, আপনি সর লগিংয়ের ফ্রিকোয়েন্সি বাড়িয়ে তুলতে পারেন। 10 মিনিটের স্থানে, প্রতি মিনিটে লগ করার চেষ্টা করুন। সিস্টেস্ট ক্রোনজব কনফিগারযোগ্য।

এরপরে, নিম্নলিখিত কমান্ডগুলি স্ক্রিপ্ট করার চেষ্টা করুন।

ps auxf > /tmp/ps.out
vmstat 1 50 > /tmp/vm.out
mpstat -P ALL 1 50 > /tmp/mp.out
iostat -xdk 1 50 > /tmp/io.out
cat /proc/meminfo > /tmp/meminfo.out

লোড গড় ম্যানুয়ালি বা ক্রোনের মাধ্যমে বৃদ্ধির সাথে সাথে প্রতিটি পুনরাবৃত্তিতে এই ডেটা সেটটি সংগ্রহ করুন। কমপক্ষে একটি পূর্ণ কার্যদিবসের ডেটা থাকা ভাল।

এখন, আমি বুঝতে পারি যে সার্ভারগুলি নিষ্ক্রিয় তবে এখনও কিছু অ্যাপ্লিকেশন চলমান থাকতে হবে। তারা কি?

এটা কি সম্ভব যে আপনি পারফ বা অপ্রোফিলের মতো কিছু প্রোফাইলিং সরঞ্জাম চালনা করতে পারেন।

কোনও সার্ভার হার্ডওয়্যার উপাদান পরিবর্তন করা হচ্ছে? এমনকি ফার্মওয়্যার আপগ্রেড বা সফ্টওয়্যার আপগ্রেডের মতো নির্দোষ কিছু।

আরে, একটা প্রশ্ন আপনি যে শিডিয়ুলারটি চালাচ্ছেন তা কী। আমি বিশ্বাস করি এটি সিএফকিউ, যে কোনও সুযোগ আপনি এটিকে নূপুরে পরিবর্তন করতে পারবেন। রাখুন elevator=noopকার্নেল কমান্ড লাইন প্যারামিটার এবং সিস্টেম রিবুট এবং কিনা এটা উন্নত।


আমি শিডিয়ুলার সম্পর্কে একটি ছোট সম্পাদনা যুক্ত করেছি। ফলাফল দেখুন।
সোহম চক্রবর্তী

1

শীর্ষ প্রসেস লগ করুন

যেহেতু ঘটনাটি খুব নিয়মিত, সেই সময়ের মধ্যে শীর্ষ প্রক্রিয়াগুলি পর্যবেক্ষণ করার জন্য সেটআপ ক্রোন জব

#app01
20-59 0/2 * * * root /usr/bin/top -b -n 1 | /usr/bin/head -n 15 >> /var/log/top.log

প্রতি এমনকি সংখ্যা ঘন্টা পুরো ঘন্টা লগ 20-59করতে পরিবর্তন করুন *। ক্রোন জব উভয় ক্ষেত্রে প্রতি মিনিটে একবার চালানো হবে।

আপনি লগ রোটেশনে শীর্ষ.লগ ফাইলটি যুক্ত করতে চাইতে পারেন যাতে আপনি এটি অক্ষম করতে ভুলে যান তবে এটি সমস্ত স্থান গ্রহণ করবে না।

লগ ফাইল চেক করুন

উচ্চ লোড সময়কালে লগ ফাইল এন্ট্রি অনুসন্ধান করুন

উদাহরণস্বরূপ নিম্নলিখিত লোড এন্ট্রি গ্রহণ করুন

10:25:01 PM         0       125      4.10      3.59      2.23         0

ডু

grep ' 22:2' /var/log/*
grep ' 22:2' /var/log/apache2/*

এটির জন্য সমস্ত লগ এন্ট্রি প্রদর্শিত হবে 22:2x:xx। অন্যান্য লগ ডিরেক্টরি অন্তর্ভুক্ত থাকতে পারে।

সান জানুয়ারী 21 21:00:07 2013: xvda ডাব্লু_ওয়াইত স্পাইক

xvda চার্ট - w_await স্পাইক সান 6 জানুয়ারী 2013 এ 2013 এখানে চিত্র বর্ণনা লিখুন


0

আমি অবশ্যই একটি জিনিস যাচাই করব:

  • একই প্যাটার্নের জন্য vSphere গ্রাফগুলি, একই হোস্টের অন্য কোনও ভিএম সিপিইউগুলি খাচ্ছে (সুতরাং আপনার ভিএমের বোঝা বৃদ্ধি পাবে কারণ কম সিপিইউয়ের জন্য উপলব্ধ থাকার কারণে ধ্রুবক প্রবাহের সাথে একই পরিমাণের ডেটা প্রক্রিয়া করতে আরও সময় লাগে) আপনার ভিএম)।

সম্পাদনা: এটি প্রথমবার পেল না :) আপনি র‌্যাকস্পেসে চলেছেন, তাই হাইপারভাইজারের উপর কোনও নিয়ন্ত্রণ নেই, তবে তারা যদি একই হোস্টের অন্যান্য ভিএমগুলিতে এই প্যাটার্নটি সাধারণ কিনা তা পরীক্ষা করতে পারে কিনা র্যাকস্পেস জিজ্ঞাসা করা উচিত they ।


1
আমি এটি সম্পর্কেও সন্দেহজনক - র‌্যাকস্পেসের মেঘটি কোনও প্রকার উন্মাদনার কারণ হবে এমনটা প্রথম নয়। আমি সন্দেহ করি যে তারা তাদের হাইপারভাইজার সার্ভারগুলির কোনওটি নিরীক্ষণ করে - যদিও আমার ভিএমএসকে খারাপ ব্যবহারের শর্ত হিসাবে বোঝানো হচ্ছে তবে আমি শেষ অবলম্বনে যাওয়ার আগে কোনও "অভ্যন্তরীণ" সম্ভাবনা বাতিল করতে চাই - র্যাকস্পেস সমর্থন।
milosgajdos

হাইপাইভাইজারের কার্য সম্পাদন কোনও ভিএম-এর স্ব-প্রকাশিত লোড-গড়কে প্রভাবিত করবে? এটি আমাকে কীভাবে লোড গড় গণনা করা হয় তা নিয়ে ভাবতে পরিচালিত করে। এটি সম্ভবত সবুজ / শক্তি-সাশ্রয়ী বৈশিষ্ট্যের কোনও প্রভাব হতে পারে যা পর্যায়ক্রমে ওএসের অজানা কম কোরে কাজ সরিয়ে নিয়ে যায়? বা যেমন পরিবেশগত ইনপুটগুলির উপর ভিত্তি করে গতিশীলভাবে ক্লক-রেট পরিবর্তন করবেন?
trp

লোড এভারেজ নির্ধারিত অ্যালগরিদম দ্বারা গণনা করা হয়, সহজ কথায়, যদি আপনার প্রসেসিংয়ের সারিতে 100 টি কাজ থাকে এবং হাইপাইভাইজার প্রতি 1 সেকেন্ডে 10 টি কার্য সম্পাদন করতে 100% দক্ষ হয়, তবে আপনার হাইপারভাইজার যদি 100 হাই ডাইরেক্টর এক্সিকিউট করার জন্য 10 সেকেন্ডের প্রয়োজন হয় মাত্র 50% দক্ষ (সম্ভবত সিপিইউ ওভারপ্রোভেশনিং) একই পরিমাণ কাজ সম্পাদন করতে 20 সেকেন্ড সময় লাগবে, ফলে লোড বাড়বে। সম্পূর্ণ ব্যাখ্যা: blog.scoutapp.com/articles/2009/07/31/…
মার্টিনো দিনো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.