অব্যাহত mpt2sas syslog বার্তাগুলি বোঝা যাচ্ছে ing


15

সারসংক্ষেপ

আমি কিছু নতুন হার্ডওয়্যার ইনস্টল করার পর থেকে আমি এই ক্রিপ্টিক বার্তাগুলি সিসলোগে পাচ্ছি এবং সমস্যাটি কী তা গুরুতর, বা এটি সম্পর্কে কী করা যায় তা আমি বুঝতে পারি না।

তারা নতুন সটা এইচবিএ থেকে এসেছে এবং তারা একটি নমুনা অনুসরণ করে। আমি প্রথম বার্তাটির বেশিরভাগটি পরে দ্বিতীয় বার্তাটির বেশ কয়েকটি পরে 5-30 সেকেন্ড পরে পেয়ে যাব। এগুলি একই ব্লকের মধ্যে আসে যা সমস্ত একই সেকেন্ডে লগ হয় এবং প্রতিটিটির সঠিক পরিমাণ প্রায় 2 এবং 35 এর মধ্যে পরিবর্তিত হয় It

দুটি বার্তার উদাহরণ:

Jul 13 06:06:23 durandal kernel: [366918.435596] mpt2sas0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Jul 13 06:06:28 durandal kernel: [366923.145524] mpt2sas0: log_info(0x31110d01): originator(PL), code(0x11), sub_code(0x0d01)

এটি সর্বদা 0x31120303 এর পরে 0x31110d01 হয়।

mpt2sas হ'ল আমি ব্যবহার করছি SATA হোস্ট বাস অ্যাডাপ্টারের ড্রাইভার তবে ত্রুটির বিষয়বস্তু অত্যধিক ক্রিপ্টিক। সমস্যাটি কী, এটি কোন ডিস্ক বা পোর্ট সহ বা এটি কতটা তীব্র তা আমাকে জানায় না।

হার্ডওয়্যারের

Xeon E3-1220 এবং 8GB র‌্যামের সাথে সুপারমাইক্রো এক্স 9 এসসিএল

LSI SAS2008 ভিত্তিক সুপার মাইক্রো এওসি-ইউএসএএস 2-এল 8 আই এসএএস / সাটা এইচবিএ একটি সুপার মাইক্রো সিএসই-এম 35 টি -1 বি ডিস্ক ট্রে সেটটির সাথে সংযুক্ত । এটি তিনটি ওয়েস্টার্ন ডিজিটাল হয়েছে WD30EZRX এবং দুই Segate ST3000DM001 এটা মধ্যে প্লাগ। সমস্ত 3 টিবি ড্রাইভ (সেক্টরের প্রকৃত একই সংখ্যক)। ব্যবহারে কোনও বন্দর সম্প্রসারণকারী নেই।

এইচবিএ, ডিস্ক ট্রে এবং ড্রাইভের 4 টি নতুন। WD30EZRXes এর মধ্যে একটি মাস কয়েক মাস ধরে রয়েছে, এতে কোনও সমস্যা হয়নি। এটি যদি আগে ইন্টিগ্রেটেড ইন্টেল সাটা কন্ট্রোলারের সাথে সংযুক্ত থাকে, তবে এটি নতুন সেটআপ দিয়ে ড্রাইভ উপসাগরে স্থানান্তরিত করে।

এইচবিএর সাথে ঘন ঘন পুনরায় সেট করা দরকার এবং সত্যিই ভয়াবহ পারফরম্যান্স পেতে সমস্যা ছিল। ফার্মওয়্যার / বায়োসকে "ফেজ 12" এ আপডেট করেছেন, সুপারমাইক্রো থেকে পাওয়া সর্বশেষ প্রকাশ এবং আইটি (যেমন পাস্ত্রথ্র, আইআর থেকে সংযুক্ত অভিযানের জন্য যেহেতু আমি সমস্ত সফ্টওয়্যার রেইড ব্যবহার করতে যাচ্ছিলাম) পরিবর্তন করেছি: ২০০ITIT12.FW। এই আপডেটটি প্রথম দিকের সমস্ত বিষয় মুছে ফেলেছে এবং উপরের বার্তাগুলি আমি পরে পাওয়া শুরু করিনি (নীচে দেখুন)।

আমি যুক্ত করা প্রথম চারটি ডিস্কগুলি প্রথম এসএফএফ -8087 পোর্টে রয়েছে (4 টি এসটিএ কেবলগুলিতে বিভক্ত)। আমি যুক্ত হওয়া সর্বশেষতম ডিস্কটি অন্য বন্দরে রয়েছে, যদি তা গুরুত্বপূর্ণ হয়।

সিস্টেমে কেবলমাত্র অন্য ডিস্কটিতে ওএস রয়েছে এবং এটি একটি পুরানো ইন্টেল ৮০ জিবি এসএসডি সংহত SATA নিয়ামকটিতে প্লাগ ইন করা হয়েছে।

সফটওয়্যার

উবুন্টু ১১.১০ (একেরিক)। লিনাক্স 3.0.0-14-সার্ভার x86_64। ওএস সহ যে এমপিটি 2 এসাস ড্রাইভার ব্যবহার করা হচ্ছে।

এই পাঁচটি ডিস্কের সাথে লিনাক্স এমডি ব্যবহার করে একটি RAID6 অ্যারে তৈরি করার চেষ্টা করা হচ্ছে। 3 টি ডিস্কের অধঃপতিত অ্যারে, দুটি সেগেটস এবং নতুন ডাব্লুডি ড্রাইভগুলির মধ্যে একটি দিয়ে শুরু হয়েছিল। এটি দ্রুত ছিল এবং খুব ভাল চলেছিল, ফার্মওয়্যার আপডেট করার পরে লগগুলিতে কোনও বার্তা নেই। ইতিমধ্যে, আমি এখনও একই নিয়ামকের 0 বন্দরে পুরানো ডাব্লুডি ডিস্ক ব্যবহার করছি using

অ্যারেতে অন্যান্য নতুন ডাব্লুডি ডিস্ক যুক্ত হয়েছে। পুনর্নির্মাণ শুরু হয়েছে এবং আমি এখন পর্যায়ক্রমে এই বার্তাগুলি সিসলোগে পাচ্ছি। আমি নিশ্চিত নই যে অ্যারেতে ডিস্ক যুক্ত করতে কত সময় লাগবে কিন্তু আনুমানিক সময়টি (বিড়াল / প্রোক / এমডিস্ট্যাট) হাজার থেকে শুরু করে কয়েক হাজার মিনিটের মধ্যে, প্রথম 3 ডিস্কের চেয়ে অনেক বেশি দীর্ঘ longer আমি বুঝতে পারি যে ডাব্লুডি ডিস্কগুলি অনেক ধীর গতির; আমি একাধিক ডিস্ক ব্যর্থতার সম্ভাবনাগুলি হ্রাস করতে বিভিন্ন মডেল পেয়েছি এবং সেগুলি ছিল দুটি সস্তা 3 টিবি মডেল।

মন্তব্য

স্মার্ট কোনও ডিস্কে কোনও সমস্যা রিপোর্ট করে না। কোনও ডিস্কে কোনও লগড ত্রুটি নেই এবং ব্যর্থতার পরিসংখ্যানগুলির কোনওটিই প্রান্তিকের কাছাকাছি নেই।

লগ করা বার্তাগুলি কেবলমাত্র আমি সর্বশেষ ডিস্ক যুক্ত করার পরে উপস্থিত হতে শুরু করি, যা প্রস্তাব দেয় যে কারওর মধ্যে একটি সমস্যা হতে পারে তবে এর দিকে ইশারা করার মতো আমার আর কিছুই নেই।

আমি একটি শিরোনাম ফাইল পেয়েছি যা এই ড্রাইভারের লগিং বার্তাগুলির সাথে সম্পর্কিত বলে মনে হচ্ছে। প্রথম বার্তাটি "সাব কোড" 0303 এর তালিকাভুক্ত নয় এমন একটি বিসর্জন (কোড 12) বলে মনে হচ্ছে। দ্বিতীয় বার্তাটি কোনও কারণে রিসেট (কোড 11) যা পরিষ্কার নয়। যদি আমি 0303 এবং 0d01 এর অর্থ কী তা নির্ধারণ করতে পারি, তবে এটি সত্যই সহায়ক।

আমি জানি যে 5 টি ডিস্কের 4 টি ডিস্ক RAID6 একটি অসম্পূর্ণ অ্যারে। আমি পুরানো ডিস্কের সামগ্রীগুলি অ্যারেতে অনুলিপি করার পরিকল্পনা করছি একবার এটি 4 র্থ ডিস্কের সংহতকরণ শেষ করে এবং তারপরে অ্যারের সাথে পুরানো ডিস্কটি যুক্ত করুন।

উত্তর:


5

সম্ভবত আপনার সেরা বাজি আপনার ডিস্কের মধ্যে কোথাও একটি হার্ডওয়ার সমস্যা এবং আপনার এসএএস রেইড কন্ট্রোলার সহ including আমি চেষ্টা করার পরামর্শ দিচ্ছি:

  1. যদি বিক্রেতা পাওয়া যায় তবে সেগুলি থেকে কোনও ডায়াগনস্টিক সরঞ্জামগুলি চালান
  2. তারগুলি চেক / পুনরায় আসন / প্রতিস্থাপন করুন
  3. হার্ডওয়্যার উপাদানগুলি বের করে আনুন এবং সেই চেইনে হার্ডওয়্যার অদলবদল করুন যা ডিস্কগুলিকে আপনার রাইড কন্ট্রোলারের সাথে সংযুক্ত করে, নিজেই নিয়ামক সহ (যেমন, আপনার জন্য, মাদারবোর্ড ইন্টিগ্রেটেড রেইডের চেয়ে অন্য কিছু চেষ্টা করুন)।

আমার দুটি অভিন্ন ডেল পাওয়ারএজজ আর 515 এর মধ্যে একটি খুব অনুরূপ বার্তা দিয়েছে (লগগুলি পর্যায়ক্রমে mpt2sas0 বার্তা পূরণ করে, যদিও আমার কাছে সঠিক সংখ্যা নেই)। ডেলের নিজস্ব বুটেবল ডায়াগনস্টিক এটিকে "হার্ডওয়্যার ত্রুটি" হিসাবে বেছে নিয়েছে এবং RAID sas ব্যাকপ্লেনটি প্রতিস্থাপনের ফলে সমস্যার সমাধান হয়েছে।

যখন আমি তদন্ত করছিলাম, আমি বিভিন্ন mpt2sas0 ত্রুটি কোডের অর্থ কী তার একটি বিস্তৃত উত্স খুঁজে পাইনি। আমার সন্দেহ হয় তারা এমনকি হার্ডওয়্যার-বিক্রেতা-নির্দিষ্ট হতে পারে (এসএএস সম্পর্কে আরও বেশি কিছু জানেন এমন ব্যক্তির এটি নিশ্চিত বা অস্বীকার করা দরকার)। সুতরাং আপনার ত্রুটি কোডগুলি বিস্তৃতভাবে অন্য কিছু বোঝাতে পারে তবে স্মার্ট পরিষ্কার থাকলে ত্রুটি কোডগুলি রিপোর্ট করার জন্য mpt2sas0 এর অন্যান্য ভাল কারণগুলি কল্পনা করা শক্ত is

এই ত্রুটিগুলি খুব মারাত্মক হতে পারে। আমার আর 515 এই বার্তাগুলির সাথে 12 ডিস্ক উবুন্টু লিনাক্স সফ্টওয়্যার রাইড with সহ এক সপ্তাহের জন্য আপাতদৃষ্টিতে ঠিকঠাক কাজ করেছিল, কিন্তু তারপরে হঠাৎ করে অ্যারে থেকে সমস্ত 12 টি ডিস্ককে বের করে আনা হয়েছে (!)

এছাড়াও আমার ক্ষেত্রে সমস্ত ডিস্কের জন্য স্মার্ট সম্পূর্ণ পরিষ্কার ছিল। একটি ভাল চেক হ'ল একটি স্মার্ট স্ব ডায়াগনস্টিক পরীক্ষা: smartctl -t long /dev/sdXএবং তারপরে এক দিন পরে ফলাফলগুলি পরীক্ষা করে smartctl -l selftest /dev/sdX। যদি সব ঠিক থাকে তবে পরীক্ষাটি বলা উচিত Completedএবং LBA_first_errকলামটি খালি থাকতে হবে।


দ্রষ্টব্য: RAID নিয়ামক (এইচবিএ সত্যই) ইতিমধ্যে একটি পৃথক কার্ড। জাহাজে থাকা SATA কন্ট্রোলার সূক্ষ্মভাবে কাজ করে। আমার অর্ডার অনুসারে একটি প্রতিস্থাপন এসএফএফ -8087 কেবল আছে, আগামীকাল নাগাদ এখানে আসা উচিত। এটাই আমার শীর্ষ সন্দেহভাজন।
ক্রিস স্মিথ

বাজে তারের সমস্যা ছিল! আমি উভয় (দুটি এসএফএফ বন্দর) কিছু উচ্চ মানের তারের সাথে প্রতিস্থাপন করেছি এবং যেহেতু কোনও সমস্যা নেই! আমি আপনার উত্তরটি গ্রহণ করছি যেহেতু এটি দীর্ঘতম এবং কোনও খারাপ তারের পরামর্শ দেয়। পিএস আমি অবশ্যই দীর্ঘ দীর্ঘ স্মার্ট পরীক্ষা করেছি; কোনও ডিস্কে কোনও সমস্যা নেই।
ক্রিস স্মিথ

আপনি সমস্যাটি পেয়েছেন শুনে ভাল লাগল। গ্রহন করার জন্যে ধন্যবাদ.
রিকার্ড আরমিয়েন্টো

আমার জন্য সত্যিই অদ্ভুত যে আমি ডেল পাওয়ারএজ প্ল্যাটফর্মের ক্ষেত্রেও এই সমস্যার আগে মিলিত হয়েছি। একই ফলস্বরূপ সমস্যাগুলি কেবলগুলির সাথে ছিল ...
মাজারেট

3

বাহ, একটি শক্ত।

এটি থেকে বোঝা যাচ্ছে যে 0x31120303 হল আপনার একটি ডিভাইস ভারী চাপের মধ্যে থাকার কারণে একটি বাস রিসেট। এটি আরও বলেছে যে এটি সম্পর্কে আপনার চিন্তা করার দরকার নেই। (হাহা, হ্যাঁ ঠিক আছে।)

এটি নির্দেশ করে যে এই লগ বার্তাগুলি ঘটছে কারণ আপনার ডিভাইসের একটি কমান্ডের প্রতিক্রিয়া জানাতে খুব বেশি সময় নিচ্ছে। এটি একই কথা বলে এবং এটিও বোঝায় যে এটি ভারী বোঝার অধীনে ঘটে।

যদিও এটি একটি সম্পূর্ণ উত্তর নয়, আশা করি এটি আপনাকে একটি কার্যকর দিক নির্দেশ করবে।


আমি সেই পোস্টগুলির মধ্যে কয়েকটি দেখেছি কিন্তু কখনই সঠিক বার্তাটি পাওয়া যায়নি তা খুঁজে পাইনি। খারাপ SFF-8087-> Sata কেবল হিসাবে পরিণত। সাহায্যের জন্য ধন্যবাদ!
ক্রিস স্মিথ

0

এর অর্থ হ'ল ডিস্কে আপনার কিছু ত্রুটি রয়েছে, এটি এলএসআইয়ের একটি এসএএস নিয়ন্ত্রকের একটি সাটা ডিস্ক এবং ত্রুটির কারণে সমস্ত বকেয়া অনুরোধ বাতিল করা হয়েছিল।

বেশিরভাগ ক্ষেত্রেই আপনার ডিস্কে একটি মাঝারি ত্রুটি থাকে যা এই ত্রুটির জন্য ট্রিগার। এই ত্রুটিটি নিজে থেকে কোনও মাঝারি ত্রুটি বোঝায় না এবং আসল ডিস্ক ব্যর্থতার উত্স কী তা জানতে আপনাকে অন্যান্য ইঙ্গিতগুলির জন্য লগগুলি পরীক্ষা করতে হবে।

সামান্য আরও বিস্তৃত সংস্করণে: http://blog.disksurvey.org/blog/2014/03/27/sata-handling-of-medium-erferences-log-info-0x0x31080000/


আকর্ষণীয় পোস্ট, ভাগ করে নেওয়ার জন্য ধন্যবাদ! SATA একটি কৃপণ প্রোটোকল তবে ডিস্কগুলি সস্তা এবং আমার যা প্রয়োজন তা করেন। আমি ত্রুটিযুক্ত তারটি প্রতিস্থাপন করার পরে বার্তাটি আর দেখা যায়নি।
ক্রিস স্মিথ

1
এলএসআই লগইনফোর আরও ডিকোডিংটি এটির ডিসিফার করার জন্য আমি তৈরি একটি ইউটিলিটির মাধ্যমে পাওয়া যাবে: ব্লগ.ডিস্কুরভেআর.ইগ.
বারুচ এমনকি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.