প্রথমে, আমাকে জিজ্ঞাসা করতে হবে: "শাটডাউন"? আপনি কী বোঝাতে চেয়েছেন যে মেশিনটি রিবুট হয় বা এটি আসলে থামে? যদি এটি বন্ধ হয়ে যায় তবে এটি হয় ভুল কনফিগার করা হয়েছে (সম্ভবত বিআইওএস-এ) বা কোনও কিছু সক্রিয়ভাবে মেশিনটি বন্ধ করে দিচ্ছে (অর্থাত্ 0 0)।
যদি তা না হয় তবে আপনার প্রাথমিক প্রার্থী / var / log / syslog এবং /var/log/kern.log হবে কারণ আপনার সমস্যাটি কার্নেল প্যানিক বা সফ্টওয়্যার দ্বারা চালিত হার্ডওয়্যার-ফল্টের মতো মনে হচ্ছে। অবশ্যই, যদি সার্ভারটি কিছু পরিষেবা চালায় (যেমন অ্যাপাচি) আপনাকে খুব ক্লুও দিতে পারে।
প্রায়শই, এই জাতীয় পরিস্থিতিতে লগ এন্ট্রি উত্পন্ন হয় তবে মেশিনটির সমস্যা হওয়ায় এটি ডিস্কে এন্ট্রি লিখতে সক্ষম হবে না। যদি বাক্সটি একত্রিত হয়, তবে সম্ভাবনা হ'ল এটি কোলো অংশীদার দ্বারা সিরিয়াল কনসোলের সাথে সংযুক্ত। সেখান থেকে আমি যদি লগগুলিতে কোনও সন্দেহজনক কিছু না পাই তবে আমি দেখতে চাই।
যদি মেশিনটি সিরিয়াল কনসোলের সাথে সংযুক্ত না থাকে এবং লগটিতে কিছুই না থাকে তবে আপনি নেটওয়ার্কের মাধ্যমে কোনও সিসলগ অন্য কোনও বাক্সে প্রেরণ বিবেচনা করতে পারেন। সম্ভবত নেটওয়ার্ক ইন্টারফেসটি কিছুটা বেশি সময় বেঁচে থাকতে পারে এবং লগ বার্তাগুলি সিসলগ সার্ভারে পড়তে পারে। Rsyslog বা syslog-ng এ দেখুন।
হালনাগাদ:
আমি নীচে @ জোহান এর সাথে একমত থামার সর্বাধিক সম্ভাব্য কারণ হ'ল প্রসেসরের তাপমাত্রা নজরদারি। Lmsensors বা smartctl (সাধারণত সবচেয়ে সহজ) এর মাধ্যমে বাক্সে তাপমাত্রা পরীক্ষা / চক্রান্ত করার চেষ্টা করুন। আমি দেখতে পেয়েছি যে সংগ্রহ করা সময়ের সাথে সাথে প্রচুর পরিমাণে ভেরিয়েবলের ট্র্যাক রাখতে অতুলনীয়। এটি আইপিএমআই এবং এলএম-সেন্সর এবং এইচডিডিটেম্প উভয়ই করতে পারে। এছাড়াও, কিছু বায়োস: এসএস লগ তাপমাত্রা হোল ইভেন্টগুলি।