ডিবাগিং লিনাক্স মেশিন হিমশীতল


9

আমার 15 টি অভিন্ন লিনাক্স আরএইচ 4.7 64-বিট সেভার রয়েছে। তারা ক্লাস্টার ডাটাবেস চালায় (ক্লাস্টারটি অ্যাপ্লিকেশন স্তর)। উপলক্ষে (প্রতি মাস বা তার বেশি) একটি এলোমেলো বাক্স (যদিও আগের মতো নয়) হিমশীতল।

আমি বাক্সটি পিং এবং পিং করতে পারি works আমি যদি বাক্সটি সেশ করার চেষ্টা করি তবে আমি তা পেতে পারি:

ssh_exchange_identification: Connection closed by remote host

এসএসএইচ সঠিকভাবে সেট আপ করা হয়েছে।

যখন আমি সার্ভার রুমে যাই এবং সরাসরি কনসোলে লগইন করার চেষ্টা করি, আমি Alt+ দিয়ে কনসোলগুলি স্যুইচ Fnকরতে পারি, আমি একটি ব্যবহারকারীর নাম এবং অক্ষর প্রদর্শন করতে পারি, তবে চাপ দেওয়ার পরে Enterকিছুই হয় না। আমি একবার 8 ঘন্টা অপেক্ষা করেছি এবং এটি পরিবর্তন হয়নি।

আমি রিমোট হোস্টে সমস্ত কিছু লগ করার জন্য সিসলগ স্থাপন করেছি এবং সেই লগগুলিতে কিছুই নেই। আমি যখন মেশিনটি রিবুট করি তখন এটি কোনও সমস্যা ছাড়াই কাজ করে। আমি এইচডব্লিউ পরীক্ষা চালিয়েছি - সবকিছু ঠিক আছে, এবং কিছুই লগ মধ্যে নেই। মেশিনগুলি NAGIOS এর সাথেও পর্যবেক্ষণ করা হয় এবং জমা করার আগে কোনও অস্বাভাবিক লোড বা ক্রিয়াকলাপ নেই।

আমি ধারণা করে ফেলেছেন; আমি আর কি করতে পারি বা চেক করতে পারি?


আপনি কোন হার্ডওয়্যার পরীক্ষা চালিয়েছেন? আপনি কি সরঞ্জাম ব্যবহার করেছেন?
tshepang

এইচডাব্লু এইচপি প্রলিয়েন্ট, আমি তাদের ব্যবহারের জন্য র‌্যাডের স্থিতি সাধারণ স্মার্ট সরঞ্জামগুলি ব্যবহার করে না তা যাচাই করতে ব্যবহার করি এবং মেমরি পরীক্ষা করতে আমি স্মৃতি ব্যবহার করি। বেশ কয়েক মাস ধরে আমার এই সমস্যা হচ্ছে এবং এটি কখনও একই সার্ভারে নেই।
লুকা মেরিঙ্কো

রেডহ্যাট সমর্থন কীসের পরামর্শ দেয়?
রেডগ্রিটিব্রিক

Luka থেকে, কনসোল এ কিছুই ঠিক প্রবেশের পর ঘটবে ব্যবহারকারী নাম এবং এন্টার আঘাত, অথবা এটি পাসওয়ার্ড লেখার অনুরোধ জানানো না এবং পরে যে না সাড়া দিতে পারে?
mattdm

যদি আপনি সমস্যার সমাধান করেন তবে দয়া করে আপনার প্রশ্নটি সম্পাদনা করুন আসলে কী ভুল ছিল এবং অন্যদের দেখার জন্য আপনি কী করেছিলেন তা বর্ণনা করতে edit
থরবজর্ন রাভন অ্যান্ডারসন

উত্তর:


6

মনে হচ্ছে আপনার কার্নেলটি এমনভাবে আতঙ্কিত হয়েছে যে sshd সার্ভার কীগুলি প্রেরণ করতে পারে না। সম্ভবত, কার্নেলটি এমনভাবে আটকেছিল যাতে নেটওয়ার্ক স্ট্যাকটি এখনও অবধি ছিল, তবে ভিএফএস স্তরটি উপলভ্য ছিল না।

আমি যখন আরএইচইএল 4 সিস্টেমে একইরকম সমস্যার মুখোমুখি হয়েছি তখন ক্র্যাশ ডাম্প এবং কার্নেল প্যানিক সম্পর্কিত তথ্যগুলি সনাক্ত করার জন্য আমি নেটডাম্প এবং নেটকনসোল পরিষেবা এবং একটি ডেডিকেটেড নেটডাম্প এবং সিসলগ সার্ভার সেট আপ করেছি । আমি কার্নেল.প্যানিক সিসটেলটিও 10 তে সেট করে রেখেছি That সেইভাবে, যখন কোনও সিস্টেম প্যানিক হয়, আপনি সেই সিস্টেমে কার্নেল ট্রেস এবং মেমরির একটি অনুলিপি পেয়ে যান, যেখানে আপনি 'ক্র্যাশ' ইউটিলিটি দিয়ে বিশ্লেষণ করতে পারেন।

হোস্টদের জন্য সিরিয়াল কনসোল সেটআপ করার মাধ্যমে আপনি অবশ্যই উপকৃত হবেন, যাতে আপনি কনসোলটি খুঁজে বার করতে পারেন এবং যাদু সিসারকি কীগুলিকে সম্ভবত হিট করতে পারেন। এছাড়াও, আপনি যদি নেটওয়ার্কিং সেটআপ করতে ইচ্ছুক থাকেন এবং আপনার কাছে এমন হার্ডওয়্যার রয়েছে যা এটি সমর্থন করে তবে আপনি আইপিএমআই ব্যবহার করে রিমোটলি পাওয়ার অফ, পাওয়ারন, পুনরায় চালু করতে এবং হার্ডওয়্যারটি অনুসন্ধান করতে পারেন।

(এটির মূল্যের জন্য, আরএইচইল 5 এর কেক্সেক / কেডম্পের সাথে একই রকম কার্যকারিতা রয়েছে, কেবল ক্র্যাশ ডাম্প স্থানীয়ভাবে সংরক্ষণ করা হয়)


হাই, আমার কাছে সরাসরি (কেভিএমের মাধ্যমে) কনসোলের অ্যাক্সেস রয়েছে, এবং সেখানে কিছুই ছিল না। আমি আমার ব্যবহারকারীর নামটিতে ভার্চুয়াল টার্মিনালগুলির মধ্যে স্যুইচ করতে পারতাম, তবে এটি, সিটিটিও + ওয়েল + ডেল কাজ করে না, তবে কনসোল থেকে নেওয়া উচিত should
লুকা মেরিঙ্কো

এছাড়াও সার্ভারগুলির এইচপির আইএলও রয়েছে, আমি সেগুলি রিবুট করতে পারি এবং দূরবর্তী থেকে এইচডাব্লুয়ের স্টাও দেখতে পারি। সেখানে কোনও ত্রুটি ছিল না
লুকা মেরিঙ্কো

আপনি কি সেই সময়ে সিসলোগগুলি পরীক্ষা করেছিলেন? এটি আতঙ্কিত কর্নেলের মতো শোনাচ্ছে। আমি আমার লিনাক্স সার্ভারগুলিতে কেভিএমগুলিকে বিশ্বাস করি না, প্রায়শই কার্নেল প্যানিক কনসোলে প্রদর্শিত হয় না, বা এটি দূষিত হয় বা কেবল শেষ দুটি লাইনে থাকে, এজন্য আমি সিরিয়াল কনসোলটি পছন্দ করি।
jsbillings

1
এটি কার্নেল আতঙ্কের মতো শোনাচ্ছে না। কনসোল স্যুইচিং এখনও কাজ করে এবং লগইন প্রোগ্রাম এখনও সক্রিয়।
ম্যাটডেম

হ্যাঁ আমি সিসলগকে কেন্দ্রীয় সিসলগ সার্ভারে পুনঃনির্দেশিত করেছিলাম। লগগুলিতে অস্বাভাবিক কিছু নেই।
লুকা মেরিঙ্কো

3

ডোনটকে আমি ডলার বাজি দেব যা আপনার স্মৃতিশক্তি শেষ। কোথা থেকে কোথা থেকে আসবেন তা নির্ধারণ করার চেষ্টা করার সাথে সিস্টেমটি থামছে to এটি এত তাড়াতাড়ি ঘটছে যাতে আপনার পর্যবেক্ষণ এটি ধরা না দেয়। আমি মেমরির ব্যবহারের দূরবর্তী লগিং সহ পর্যবেক্ষণ বাড়িয়ে দেব। OOM বার্তাগুলির জন্য লগগুলিও পরীক্ষা করুন।

(আপনি এমনকি কয়েকটি এসএসএস উইন্ডোটি চলমান শীর্ষে রাখতে চান))


3

আমার কাছে এটির মতো শোনার মতো সিস্টেমটি রিসোর্সের বাইরে চলেছে তাই ssh এর সার্ভার সাইড দ্বারা প্রয়োজনীয় প্রক্রিয়াটি বরাদ্দ করা যায় না।

প্রকৃত বাধা হ'ল পরিবর্তিত হতে পারে - প্রক্রিয়াগুলির বাইরে বা মেমরির বাইরে - এবং নিশ্চিত হওয়ার একমাত্র উপায় হ'ল লগগুলি এবং কনসোলটি সেখানে উপস্থিত রয়েছে কিনা তা দেখার জন্য। আপনি প্রাক-শুরু হওয়া এস-এস-জবসের একটি দৃশ্যাবলী সেট আপ করতে চাইতে পারেন - প্রতিটি মেশিনে একটি - কেবল পরবর্তী সময়ে এটি হওয়ার পরে প্রস্তুত হতে পারে।

যদি এটি সত্যিই খারাপ হয়, তবে আপনি আরও বিল্ট-ইন কমান্ড দিয়ে অন্য শেলটি শুরু করার বিষয়টি বিবেচনা করতে চাইতে পারেন যাতে কোনও অতিরিক্ত প্রক্রিয়া শুরু না করেই আপনি আরও তদন্ত করতে পারেন কারণ এটি সম্ভব নাও হতে পারে। এছাড়াও "পুচ্ছ -f / var / লগ / *" খুব কার্যকর হতে পারে।

শুভকামনা।


0

কেবলমাত্র যখনই অনুরূপ কিছু দেখলাম তখন সেখানে কেভিএম স্যুইচ ব্যবহার করা হয়েছিল এবং সার্ভারের মধ্যে স্যুইচ করার জন্য একটি কী-বোর্ড হট-কী (উদাহরণস্বরূপ Alt + n) ব্যবহার করা হয়েছিল। এটি প্রতিবারই ঘটে নি এবং এটি থেকে সার্ভারটি স্যুইচ করা হচ্ছে যা প্রভাবিত হয়েছিল - তাই এটি অবিলম্বে লক্ষণীয় ছিল না। কোনও সার্ভিসের মধ্যে স্যুইচ করার জন্য যদি কেভিএম স্যুইচ নিজেই একটি ফিজিকাল বোতাম ব্যবহার করা হয় তবে কোনও লক-আপগুলি ঘটবে না। হট-কীটি প্রায়শই ব্যবহার করা গেলে মাঝে মধ্যে একটি সার্ভার নতুন লগইন করতে দেয় না। বিদ্যমান এসএসএইচ সেশনগুলি প্রভাবিত হয়নি।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.