আবার হয়েছে! আমার 4 টি সার্ভার রয়েছে যা পর্যায়ক্রমে ক্রাশ হচ্ছে এবং সিস্টেম লগগুলিতে বা সিরিয়াল কনসোলে মুদ্রিত কোনও তথ্য নেই।
তদ্ব্যতীত , লিনাক্স kdump পরিষেবাটি ডিফল্ট অবস্থানে কোর ডাম্পগুলি লিখছে না /var/crash।
- আপনি আমাকে বুঝতে সাহায্য করতে পারেন কেন?
- আমার রুট ফাইল সিস্টেমটি একটি এলভিএম ভলিউম কিনা তা বিবেচনা করে?
এখানে আমি চেষ্টা করেছি।
আমার সিস্টেমটি সর্বশেষতম কার্নেল সহ বৈজ্ঞানিক লিনাক্স 6.5।
[root@host1 ~]# uname -r 2.6.32-431.11.2.el6.x86_64 [root@host1 ~]# cat /etc/issue Scientific Linux release 6.5 (Carbon)ফাইলটি
/etc/kdump.confহ'ল ভ্যানিলা ফাইল যা ডিফল্ট সেটিংস ধারণ করে। সর্বাধিক লাইন আউট মন্তব্য করা হয়, সেখানে মাত্র দুটি সক্রিয় লাইন আছেpathএবংcore_collector।#net my.server.com:/export/tmp #net user@my.server.com path /var/crash core_collector makedumpfile -c --message-level 1 -d 31 #core_collector scpআমি নিশ্চিত করছি যে
kdumpপরিষেবাটি চলছে এবং এটিkdumpআমার পুনর্নির্মাণের দরকার নেইinitrd।[root@host1 ~]# chkconfig --list kdump kdump 0:off 1:off 2:off 3:on 4:on 5:on 6:off [root@host1 ~]# /etc/init.d/kdump restart Stopping kdump: [ OK ] Starting kdump: [ OK ] [root@host1 ~]#তারপরে, আমি আরএইচইল 6 ডিপ্লোয়মেন্ট গাইড থেকে ধার করা এই কমান্ডগুলি ব্যবহার করে একটি কার্নেল ক্রাশকে বাধ্য করি : অধ্যায় 29. কেডাম্প ক্র্যাশ রিকভারি সার্ভিস :
তারপরে শেল প্রম্পটে নিম্নলিখিত কমান্ডগুলি টাইপ করুন:
echo 1 > /proc/sys/kernel/sysrq echo c > /proc/sysrq-triggerএটি লিনাক্স কার্নেলকে ক্রাশ করতে বাধ্য করবে
সিস্টেমটি ক্র্যাশ হয়ে গেছে। আমি আমার সিরিয়াল কনসোলটিতে অগ্রগতি দেখতে পারি। আমি বার্তাটি দেখতে পাচ্ছি
Saving to the local filesystem UUID=e7abcdeb-1987-4c69-a867-fabdceffghi2তবে এর ঠিক পরে আমি এর অদ্ভুত বার্তাটি দেখতে পাচ্ছিUsage: fsck.ext4, মনে হচ্ছে কোন ধরণের কিছু ঘটনাক্রমে ঘটছেfsckযা করা উচিত তার পরিবর্তে কল করছে। আমি স্মৃতি ছাড়িয়ে যাওয়া বা ত্রুটির কোনও উল্লেখ দেখতে পাই না।host1.example.org login: SysRq : Trigger a crash BUG: unable to handle kernel NULL pointer dereference at (null) ... ... skipping 50 lines of output ... Creating block device ram8 Creating block device ram9 Creating Remain Block Devices Making device-mapper control node Scanning logical volumes Reading all physical volumes. This may take a while... No volume groups found No volume groups found Activating logical volumes No volume groups found No volume groups found Free memory/Total memory (free %): 58272 / 116616 ( 49.9691 ) Saving to the local filesystem UUID=e7abcdeb-1987-4c69-a867-fabdceffghi2 Usage: fsck.ext4 [-panyrcdfvtDFV] [-b superblock] [-B blocksize] [-I inode_buffer_blocks] [-P process_inode_size] [-l|-L bad_blocks_file] [-C fd] [-j external_journal] [-E extended-options] device Emergency help: -p Automএবং তারপরে সিস্টেমটি পুনরায় বুট হয় (যা পূর্বনির্ধারিত)।
সিস্টেমটি যখন অনলাইনে ফিরে আসে তখন কিছুই থাকে না
/var/crash। আমি ধরে নিয়েছি যে ক্র্যাশ ডাম্প লেখা হয়নি।[root@host1 ~]# ls -lA /var/crash/ total 0 [root@host1 ~]#আমি জানি যে ক্র্যাশ ডাম্পগুলি সাধারণভাবে কাজ করতে পারে। যদি আমি
kdumpনিম্নলিখিত কনফিগারেশনের সাহায্যে কোর ডাম্পটি অন্য সিস্টেমে অনুলিপি করতে বলি , কেডিম্প্প সফলভাবে অন্য হোস্টে কোর ডাম্পটি লিখে ফেলবে:path vmcore ssh user@hostb.example.org sshkey /root/.ssh/kdump_id_rsaযদি আমি সেট
default shellমধ্যে/etc/kdump.confএবং initrd- র পুনর্নির্মাণ, এবং তারপর সিস্টেম বিপর্যস্ত আবার আমি একটি সামান্য আরো তথ্যপূর্ণ ভুল পানmount: can't find /mnt in /etc/fstabFree memory/Total memory (free %): 58272 / 116616 ( 49.9691 ) Saving to the local filesystem UUID=e720481b-1987-4c69-a867-f2b4cba3b312 Usage: fsck.ext4 [-panyrcdfvtDFV] [-b superblock] [-B blocksize] [-I inode_buffer_blocks] [-P process_inode_size] [-l|-L bad_blocks_file] [-C fd] [-j external_journal] [-E extended-options] device Emergency help: -p Automatic repair (no questions) -n Make no changes to the filesystem -y Assume "yes" to all questions -c Check for bad blocks and add them to the badblock list -f Force checking even if filesystem is marked clean -v Be verbose -b superblock Use alternative superblock -B blocksize Force blocksize when looking for superblock -j external_journal Set location of the external journal -l bad_blocks_file Add to badblocks list -L bad_blocks_file Set badblocks list mount: can't find /mnt in /etc/fstab dropping to initramfs shell exiting this shell will reboot your system /sys/block #তবে এখন আমি আটকা পড়েছি।