আমি কীভাবে একটি হার্ড লিনাক্স ক্র্যাশ সনাক্ত করতে পারি?


5

আমার একটি হোম-বিল্ট লিনাক্স সার্ভার রয়েছে (উবুন্টু 12.04.5 এলটিএস, ইন্টেল আই 5-3570 কে, 8 জিবি র‌্যাম) মূলত একটি মেল এবং ওয়েব সার্ভার হিসাবে অভিনয় করে। এটি কেবল কনসোল মোডে পরিচালিত হয় (কোনও জিইউআই নেই)। আমি এখনই এটিতে এসএসএচ করব এবং কনসোল থেকে প্রায় কখনও এটি পরিচালনা করব না operate এটি অনেক দিন, এমনকি সপ্তাহ ধরে ভাল কাজ করে থাকে তবে কখনও কখনও সতর্কতা ছাড়াই শক্ত ক্রাশ হয়। এবং যখন আমি বলি "শক্ত ক্রাশ", তখন আমার অর্থ হ'ল পিসি হঠাৎ সম্পূর্ণ প্রতিক্রিয়াহীন হয়ে পড়ে:

  • এটি কোনও লগ এন্ট্রি দেয় না
  • এটি কোনও "ওফস", কার্নেল প্যানিক বার্তা বা কোর ডাম্প নির্গত করে না
  • এটি স্ক্রিনে কোনও বার্তা প্রদর্শন করে না।
  • এটি কোনও কীবোর্ড বা মাউস ইনপুটটির প্রতিক্রিয়া জানায় না (নুমলক আলোও সেই কীটির কাছে প্রতিক্রিয়াহীন)
  • এটি এসএসএইচ দ্বারা অ্যাক্সেস করা যায় না
  • কেসটির রিসেট স্যুইচ কাজ করবে না

একমাত্র সমাধান হ'ল কেস পাওয়ার বোতামটি এটি বন্ধ না হওয়া পর্যন্ত ধরে রাখা, তারপরে এটি পুনরায় আরম্ভ করুন।

অবশ্যই এই চিৎকার করে তোলে "হার্ডওয়্যার সমস্যা", তবে কোন উপাদানটি সবচেয়ে বেশি সম্ভবত? মেমস্টেস্ট + ++ কোনও ত্রুটি দেখায় না, যাতে এটি বিগ থ্রি - মাদারবোর্ড, সিপিইউ বা বিদ্যুত সরবরাহ সরবরাহ করে। (পিসি ওভারক্লকড নয়, এবং সেন্সরগুলির শেষ বার্তাগুলি (ক্র্যাশের আগে) কোনও অতিরিক্ত গরম বা ফ্যানের সমস্যা নির্দেশ করে না)

  1. এইগুলির মধ্যে কোনটি সমস্যা হওয়ার সম্ভাবনা রয়েছে তার কোনও পরিসংখ্যানগত সম্ভাবনা রয়েছে?

  2. আমি শেষ মানদণ্ডকে উপরে সাহসের মধ্যে রেখেছি কারণ এটি আমার কাছে অস্বাভাবিক মনে হয়েছিল। সাধারণত একটি শক্ত ক্রাশের পরেও, কেসটির রিসেট স্যুইচ দিয়ে একটি পিসি পুনরায় চালু করা যায়। এটি কি পিএসইউ, বা মাদারবোর্ডে কোনও সমস্যা প্রস্তাব করে? (পাওয়ার সুইচ মধ্যে অধিষ্ঠিত 4-5 সেকেন্ড পিসি বন্ধ করতে নেই এখনও কাজ)

  3. সমস্যাটি সমাধান না হওয়া পর্যন্ত আমি আত্মবিশ্বাসী না হয়ে (একাধিক সপ্তাহের ক্রাশ না হওয়ার পরে) একসাথে কেবল নতুন অংশগুলি অর্ডার না করেই তাদের পরীক্ষা করার কোনও উপায় আছে কি?

যে কেউ সাহায্য করতে পারে ধন্যবাদ।


1
স্মার্ট কি কোনও ইনস্টল করা হার্ড ড্রাইভে কোনও ত্রুটির কথা জানায়? দ্রষ্টব্য: স্মার্ট প্রতিবেদন পরীক্ষা করতে ইউটিলিটি "ডিস্ক" ব্যবহার করুন।
স্টিভেন

ত্রুটিযুক্ত রিসেট স্যুইচটি অস্বাভাবিক। কেবলমাত্র একবার যখন আমি ফ্লেকি রিসেটটি দেখতে পেয়েছিলাম তখন অনেক আগে থেকেই একটি মিল-স্পেক রাগডাইজড কম্পিউটারে ছিল (চিত্র দেখুন); বোর্ডের পরিচিতিগুলি খারাপ হয়ে যায়, যাতে সমস্ত বোর্ডগুলি টেনে এনে আবার প্রবেশ করতে হয়। অন্যথায় রিসেট সার্কিটগুলি কেবল মবো এবং সিপিইউকে জড়িত করার চেয়ে বরং সরল বলে মনে হয় (যদিও পিসিগুলিতে এসিপিআই জড়িত থাকতে পারে?)।
বরদা

স্টিভেন, স্মার্ট ত্রুটিগুলি সম্পর্কে আমি অবগত নই, তবে আমি আবার সার্ভারে ফিরে আসব। @ সাউডস্ট, মজার বিষয় হ'ল মেশিনটি তার শক্ত ক্রাশ অবস্থায় না থাকলে রিসেট সুইচটি ঠিকঠাক কাজ করে (এমনটি নয় যে আপনি তখন এটি ব্যবহার করতে চান তবে এটি কাজ করে ...)
জর্জ অ্যাডামস

"রিসেট স্যুইচ ঠিকঠাক কাজ করে ..." - হ্যাঁ, আমি সে সম্পর্কে ভাবছিলাম, তবে আপনার বিশ্লেষণ / লেখার ব্যবস্থা খুব ভাল, তাই আমি ধরে নিয়েছি এটি হয়েছে। এর চেয়ে খারাপ পরিস্থিতি এসডাব্লু + এইচডাব্লু ইস্যুগুলির সংমিশ্রণে মেশিনটিকে এই অবস্থায় ফেলে দেয়। পিসিতে রিসেট কীভাবে কাজ করে (বনাম শিল্প এসবিসি) কীভাবে কাজ করে তা সম্পর্কে আমার কোনও ধারণা নেই (উদাহরণস্বরূপ এটি কি এইচডাব্লু রিসেট বা এনএমআই, মাস্কেবল ব্যাহত?)। যেহেতু পিএসইউ সম্ভবত বিকল্প হিসাবে সবচেয়ে সহজ উপাদান, আপনি কেবল কারণ হিসাবে এটি নির্মূল করার চেষ্টা করতে পারেন।
করাত

উত্তর:


1

1: আপনার উবুন্টু স্থির ?? আপনি কি উবুন্টুর একটি স্থিতিশীল সংস্করণ ডাউনলোড করেছেন? সর্বশেষ স্থিতিশীল বিল্ডে ডাউনগ্রেড না করার চেষ্টা করুন।

2: আপনি কি অন্য ভার্চুয়াল / ফিজিক্যাল মেশিনে চেষ্টা করে দেখেছেন? ভার্চুয়াল বাক্সের মতো ভিএম-তে এটি পরীক্ষার ক্ষেত্রে খুব সহজেই স্ক্রিপ্টের ত্রুটি হতে পারে যা যদি আপনি ইতিমধ্যে এই পদক্ষেপগুলি ব্যবহার না করে থাকেন তবে এটি আপনাকে এমন একটি পরিবেশ দেবে যেখানে আপনি ওএস ডিবাগ এবং মনিটরিং করতে পারবেন এমন পরিবেশ প্রদান করবে more

3: রাম ব্যর্থতা? ঠিক আছে তাই এটির স্থানীয় এসএসডি / এইচডিডি / এসএসএইচডি হওয়ার খুব সম্ভাবনা নেই কারণ লিনাক্স ওএসটি র‍্যামে লোড করা হয়েছে এবং কার্নেলের সাথে যোগাযোগ করতে অক্ষমতা থাকলে এটি ক্র্যাশ হয়ে যেতে পারে তবে এটি একটি সতর্কতা পোস্ট করবে। তবে যদি ল্যাম-আপটি চালিত হয় তবে তার ত্রুটিযুক্ত / অপূর্ণতা অপারেটিং সিস্টেমটি কোনও লগ নেই বলে ব্যাখ্যা করতে পারে এমন কোনও ত্রুটি পোস্ট করতে (বা এমনকি সচেতন হতে হবে) সম্পূর্ণরূপে হিমশীতল হয়ে যাবে তবে এটি খুব সম্ভব যে এটি কিছু হতে পারে আর

৪: ফোরামগুলি একবার দেখুন, ঠিক আছে আমি সেখানে সবচেয়ে কার্যকর লিনাক্স ব্যবহারকারী নই এবং এমন অনেক কিছুই আছে যা আমি সত্যই জানি না যে আমার মতোই হার্ডওয়্যার এবং সফ্টওয়্যার সংক্রান্ত সমস্যা আছে, তবে আমি আসলে কী জানি না এটি আপনার হোম-ব্রিউ সার্ভারটি তাই ফোরাম ব্রাউজ করে আইডিটি ত্রুটিগুলি চিহ্নিত করার জন্য কঠোর করে


1. হ্যাঁ, আমি যেমনটি বলেছি, এটি উবুন্টু 12.04.5 এলটিএস (দীর্ঘমেয়াদী সমর্থন সংস্করণ)। ২. এটি একটি ফিজিকাল সার্ভার। আমার কাছে অন্য কোনও হার্ডওয়্যার নেই যা আমাকে ভার্চুয়ালাইজ করতে এবং এটিকে সরাতে দেয়। 3) যেমনটি আমি উল্লেখ করেছি, মেমস্টেস্ট 86 + কোনও ত্রুটি দেখায় না।
জর্জ অ্যাডামস

1

আমি কিছুটা অবাক হয়েছি কেউ SysRqম্যাজিক কী ব্যবহারের পরামর্শ দেয়নি ।

প্রথমত, এটি পুনরায় বুট করার জন্য পাওয়ার স্যুইচের পরিবর্তে ব্যবহার করা উচিত, কারণ এটি প্রোগ্রামগুলিকে ডিস্কে অরক্ষিত ডেটা সংরক্ষণের সুযোগ দেয়; এটির ব্যর্থতা পুনরায় বুট করার পরে যথেষ্ট সমস্যা সৃষ্টি করতে পারে (সাধারণ fsckচেকের জন্য অপেক্ষা করতে থাকা ক্র্যাশিং বোরের কথা উল্লেখ না করা )। এটি নিম্নরূপ করা হয়: পালন Altএবং SysRqএকযোগে টিপুন, প্রবেশ করান, প্রতিটি কয়েক সেকেন্ডের ব্যবধানে প্রবেশ করুন, r e i s u b(ইংরেজিতে বিখ্যাত স্মৃতিবিজ্ঞান হ'ল রাইজিং এলিফ্যান্টস ইজ সো উত্তেজক বোরিং , আমি রানিং এর্যানডস ইজ সো উত্তাল বোরিংকে পছন্দ করি , আরও ভাল করার চেষ্টা করি এক যদি আপনি পারেন)।

পৃথক্ এমনকি এই যখন সিস্টেম ব্যবহার স্থির থেকে Alt+ + SysRq+ + X(যেখানে এক্স একটি চিঠি হয়) আপনি কিছু ডায়গনিস্টিক চালানোর জন্য অনুমতি দেয়: উদাহরণস্বরূপ, X=dসমস্ত বর্তমান কেশ, যা একটি সফ্টওয়্যার সমস্যা নির্ণয় সাহায্য করতে পারে প্রদর্শন; X=jহিমায়িত ফাইল সিস্টেমগুলি thaws; X=l( lএটি একটি এলাল) একটি স্ট্যাক ব্যাকট্রিজ দেখায়; X=tকনসোলকে আউটপুটগুলি বর্তমান কাজগুলির একটি তালিকা; X=wঅবরুদ্ধ কর্মগুলির একটি তালিকা প্রদর্শন করে।

আপনি উইকিপিডিয়ায় আরও কোডগুলি পেতে পারেন ।

যদিও আমি বলতে পারি না এটি একটি সিদ্ধান্ত নেওয়া পদক্ষেপ হবে (এমন পরিস্থিতিতেও রয়েছে যেখানে এটি ব্যর্থ হয়) তবে তদন্তের এটি পরবর্তী পদক্ষেপ, যা একটি সফ্টওয়্যার বা হার্ডওয়্যার সমস্যার দিকে ইঙ্গিত করতে এবং সম্ভাব্য অপরাধীদের সীমাবদ্ধ করতে সহায়তা করবে।


0

লক-আপের সময়টির নিকটে থাকা লগগুলিতে নজর দেওয়া এবং আপনি যে কোনও ধরণের কোনও সিস্টেম ইভেন্টের সাথে লকআপের সাথে সম্পর্ক স্থাপন করতে পারেন তা দেখুন best এটি করা একটি কঠিন জিনিস এবং আপনি সম্ভবত সরাসরি কারণ হতে পারে এমন কোনও কিছুই খুঁজে পেতে সক্ষম নন।

হার্ডওয়্যার সমস্যা নির্ণয়ের জন্য কয়েকটি ইঙ্গিত:

ফার্মওয়্যার ইস্যু / সেটিংস মুছে ফেলার সবচেয়ে সহজ জিনিস:

  • আপনার সিস্টেমে প্রস্তুতকারকের কাছ থেকে সর্বশেষ ফার্মওয়্যার / বিআইওএস আপডেট রয়েছে তা নিশ্চিত করুন।

  • কোনও স্টোরেজ ডিভাইসও সর্বশেষতম ফার্মওয়্যারের সাথে আপডেট হয়েছে তা নিশ্চিত করুন।

  • ফার্মওয়্যার / বিআইওএসে কোনও সিপিইউ বা অন্যান্য পাওয়ার ম্যানেজমেন্ট অপশন অক্ষম করার চেষ্টা করুন।

  • আপনি যদি ফার্মওয়্যারটি ব্যবহার না করেন তবে ভার্চুয়ালাইজেশন অক্ষম করার চেষ্টা করুন।

র‌্যামের সমস্যাগুলি মেমরি পরীক্ষায় না দেখানো সত্ত্বেও হার্ড লকআপগুলির কারণ হতে পারে। এটি খুব মাঝে মাঝে কিছু হতে পারে। প্রকৃত সার্ভারগুলিতে ইসিসি র‌্যাম রয়েছে যা বিরল / ক্ষণস্থায়ী র‌্যাম ত্রুটিগুলি সমস্যা তৈরি থেকে বাধা দেয় তবে এটি যদি কোনও সার্ভারবিহীন পিসি হয় তবে এটি এতে নেই। আপনি যদি পারেন তবে র‌্যামের সন্ধানের চেষ্টা করুন।

আপনার প্রাচীর শক্তি থেকে পাওয়ার সমস্যার কারণ এ জাতীয় সমস্যার সৃষ্টি করতে পারে। আপনি যদি হোম সার্ভার চালানোর বিষয়ে গুরুতর হন তবে আপনার একটি ব্যাটারি ব্যাকআপ থাকা উচিত যা ক্ষণস্থায়ী বিদ্যুতের সমস্যাগুলিও ফিল্টার করে।

এর পরে যদি সমস্যাটি অব্যাহত থাকে তবে বিদ্যুৎ সরবরাহ প্রতিস্থাপন বা অন্য একটি ব্যবহার করার চেষ্টা করুন।

এরপরে, ধরে নিন মাদারবোর্ডটি ফ্ল্যাশযুক্ত এবং প্রতিস্থাপনের দিকে তাকাবে।


লগগুলি সর্বদা খুব নিরীহ are হঠাৎ করে বিএএম - লগ-এন্ট্রি নেই এমন সময়ে এটি কেবল তার স্বাভাবিক ব্যবসায় সম্পর্কে চলেছে। হঠাৎ মৃত্যুর ঠিক আগে কোনও অদ্ভুত স্ক্রিপ্ট গুলি ছোঁড়াচ্ছে না। সার্ভারটি একটি ইউপিএসে চলছে। ইসিসি র‌্যাম একটি আকর্ষণীয় ধারণা। আমাকে সেই মূল্য নির্ধারণ করতে হবে।
জর্জ অ্যাডামস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.