আই / ও ত্রুটিগুলি পূর্ণ ডেমসগ, স্মার্ট ওকে, চারটি ডিস্ক প্রভাবিত


8

আমি একটি রিমোট সার্ভারে কাজ করছি (ডেল পাওয়ারেড) যা একটি নতুন ইনস্টল। এটিতে চারটি ড্রাইভ (2 টিবি) এবং 2 এসএসডি (250 গিগাবাইট) রয়েছে। একটি এসএসডি-তে ওএস (আরএইচইএল 7) রয়েছে এবং চারটি যান্ত্রিক ডিস্ক অবশেষে একটি ওরাকল ডাটাবেস ধারণ করতে চলেছে।

একটি সফ্টওয়্যার RAID অ্যারে তৈরি করার চেষ্টা করার ফলে ডিস্কগুলি ক্রমাগত ত্রুটিযুক্ত হিসাবে চিহ্নিত হয়। Dmesg চেক করা নীচের ত্রুটিগুলির বেশ কয়েকটি ফলাফল প্রকাশ করে,

[127491.711407] blk_update_request: I/O error, dev sde, sector 3907026080
[127491.719699] sd 0:0:4:0: [sde] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[127491.719717] sd 0:0:4:0: [sde] Sense Key : Aborted Command [current]
[127491.719726] sd 0:0:4:0: [sde] Add. Sense: Logical block guard check failed
[127491.719734] sd 0:0:4:0: [sde] CDB: Read(32)
[127491.719742] sd 0:0:4:0: [sde] CDB[00]: 7f 00 00 00 00 00 00 18 00 09 20 00 00 00 00 00
[127491.719750] sd 0:0:4:0: [sde] CDB[10]: e8 e0 7c a0 e8 e0 7c a0 00 00 00 00 00 00 00 08
[127491.719757] blk_update_request: I/O error, dev sde, sector 3907026080
[127491.719764] Buffer I/O error on dev sde, logical block 488378260, async page read
[127497.440222] sd 0:0:5:0: [sdf] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[127497.440240] sd 0:0:5:0: [sdf] Sense Key : Aborted Command [current]
[127497.440249] sd 0:0:5:0: [sdf] Add. Sense: Logical block guard check failed
[127497.440258] sd 0:0:5:0: [sdf] CDB: Read(32)
[127497.440266] sd 0:0:5:0: [sdf] CDB[00]: 7f 00 00 00 00 00 00 18 00 09 20 00 00 00 00 00
[127497.440273] sd 0:0:5:0: [sdf] CDB[10]: 00 01 a0 00 00 01 a0 00 00 00 00 00 00 00 00 08
[127497.440280] blk_update_request: I/O error, dev sdf, sector 106496
[127497.901432] sd 0:0:5:0: [sdf] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[127497.901449] sd 0:0:5:0: [sdf] Sense Key : Aborted Command [current]
[127497.901458] sd 0:0:5:0: [sdf] Add. Sense: Logical block guard check failed
[127497.901467] sd 0:0:5:0: [sdf] CDB: Read(32)
[127497.901475] sd 0:0:5:0: [sdf] CDB[00]: 7f 00 00 00 00 00 00 18 00 09 20 00 00 00 00 00
[127497.901482] sd 0:0:5:0: [sdf] CDB[10]: e8 e0 7c a0 e8 e0 7c a0 00 00 00 00 00 00 00 08
[127497.901489] blk_update_request: I/O error, dev sdf, sector 3907026080
[127497.911003] sd 0:0:5:0: [sdf] FAILED Result: hostbyte=DID_OK driverbyte=DRIVER_SENSE
[127497.911019] sd 0:0:5:0: [sdf] Sense Key : Aborted Command [current]
[127497.911029] sd 0:0:5:0: [sdf] Add. Sense: Logical block guard check failed
[127497.911037] sd 0:0:5:0: [sdf] CDB: Read(32)
[127497.911045] sd 0:0:5:0: [sdf] CDB[00]: 7f 00 00 00 00 00 00 18 00 09 20 00 00 00 00 00
[127497.911052] sd 0:0:5:0: [sdf] CDB[10]: e8 e0 7c a0 e8 e0 7c a0 00 00 00 00 00 00 00 08
[127497.911059] blk_update_request: I/O error, dev sdf, sector 3907026080
[127497.911067] Buffer I/O error on dev sdf, logical block 488378260, async page read

এই ত্রুটিগুলি চারটি যান্ত্রিক ডিস্কের জন্য ঘটে, (এসডিসি / এসডিডি / এসডিই / এসডিএফ) স্মার্টটেল চারটি ডিস্ক দীর্ঘ এবং সংক্ষিপ্ত পরীক্ষায় পাস করেছে। আমি বর্তমানে ব্যাডব্লকগুলি চালাচ্ছি (মোড টেস্ট লিখুন ~ 35 ঘন্টা, সম্ভবত আরও 35 টি)।

গবেষণার উপর আমি যে ত্রুটিগুলি সন্দেহ করেছি / বিবেচনা করেছি সেগুলি নীচে রয়েছে

  • ব্যর্থ এইচডিডি - মনে হয় না যে 4 "পুনর্নির্মাণ" ডিস্কগুলি ডিওএ হ'ল না?

  • স্টোরেজ কন্ট্রোলার ইস্যু (খারাপ তারের?) - দেখে মনে হচ্ছে এটি এসএসডি'র উপরও প্রভাব ফেলবে?

    • কার্নেল ইস্যু, স্টক কার্নেলের একমাত্র পরিবর্তনটি ছিল কমড-ওরাকলিজম সংযোজন। আমি সত্যিই দেখছি না কীভাবে এটি এই ত্রুটিগুলির কারণ ঘটবে, এএসএম মোটেও সেট আপ করা হয়নি।

আরেকটি লক্ষণীয় ঘটনা হ'ল ডিস্কগুলি শুরুর চেষ্টা করার সময় (প্রারম্ভিক সমস্যা সমাধানের অংশ) কমান্ডটি using dd if = / dev / শূন্যের = / dev / sdX ব্যবহার করে এই ত্রুটিগুলি পেয়েছিল,

dd: writing to ‘/dev/sdc’: Input/output error
106497+0 records in
106496+0 records out
54525952 bytes (55 MB) copied, 1.70583 s, 32.0 MB/s
dd: writing to ‘/dev/sdd’: Input/output error
106497+0 records in
106496+0 records out
54525952 bytes (55 MB) copied, 1.70417 s, 32.0 MB/s
dd: writing to ‘/dev/sde’: Input/output error
106497+0 records in
106496+0 records out
54525952 bytes (55 MB) copied, 1.71813 s, 31.7 MB/s
dd: writing to ‘/dev/sdf’: Input/output error
106497+0 records in
106496+0 records out
54525952 bytes (55 MB) copied, 1.71157 s, 31.9 MB/s

এখানকার কেউ যদি এর কারণ কী হতে পারে সে সম্পর্কে কিছুটা অন্তর্দৃষ্টি ভাগ করে নিতে পারলে আমি কৃতজ্ঞ হব। আমি এখানে ইভেন্টের রেজার অনুসরণ করতে এবং সরাসরি এইচডিডি'র দিকে যেতে আগ্রহী, কেবলমাত্র চারটি ব্যর্থ এইচডিডি বাক্সের বাইরে যাওয়ার সম্ভাবনা থেকে উদ্ভূত doubt

আমি শারীরিক পরিদর্শন করার জন্য এবং এই যন্ত্রটি সম্পর্কে আমার মূল্যায়ন উচ্চতর প্রতিবেদন করার জন্য আগামীকাল সাইটে ড্রাইভিং করব। আমার শারীরিকভাবে পরীক্ষা করা উচিত এমন কিছু থাকলে (কেবল / সংযোগ / বিদ্যুৎ সরবরাহের বাইরে) দয়া করে আমাকে জানান।

ধন্যবাদ।


আপনি যখন স্মার্টকে "ঠিক আছে" বলছেন, আপনি কি কেবল সামগ্রিক স্বাস্থ্যকে বোঝাতে চান? পুনর্নির্বাচিত বা মুলতুবি খাতগুলির জন্য কোনও পৃথক কাঁচা কাউন্টার কি শূন্য নয়? চালনাযোগ্য না হওয়া সত্ত্বেও চালকরা তাত্ক্ষণিকভাবে প্রথম খারাপ খাতে নিজেকে ব্যর্থ ঘোষণা করে না। ব্যবহার smartctl -x /dev/sdaবা কিছু। তবে এটি অত্যন্ত সন্দেহজনক যে এটি সমস্ত ডিস্কে একই এলবিএ।
পিটার কর্ডস

উত্তর:


14

আপনার ddপরীক্ষাগুলি চারটি ডিস্ক একই এলবিএ ঠিকানায় সমস্ত ব্যর্থ দেখায় । যেহেতু এটি অত্যন্ত অসম্ভব যে চারটি ডিস্কগুলি সমস্ত একই স্থানে ব্যর্থ হয়, তাই আমি দৃ strongly়ভাবে সন্দেহ করি এটি নিয়ামক বা ক্যাবলিংয়ের কারণে issues


1
আরও পরীক্ষা না করে বলা মুশকিল। যাইহোক, আমি প্রথম নিয়ন্ত্রণ / প্রতিস্থাপন করব বলে মনে করি তারগুলি হ'ল ব্যাকপ্লেনের সাথে নিয়ামকটি সংযুক্ত করে।
shodanshok

4
6/12 জিবিএস এসটিএ / এসএএস হিসাবে উচ্চ তথ্য-হারের কেবলগুলি কেবল বৈদ্যুতিক ধারাবাহিকতা সম্পর্কে নয়, প্রধানত সিগন্যাল স্পষ্টতা এবং কম শব্দ সম্পর্কে। সংযোগকারীদের শারীরিকভাবে সাফ করার এবং তারগুলি পুনরায় সেট করার চেষ্টা করুন। ত্রুটিটি যদি অব্যাহত থাকে তবে এগুলি পরিবর্তন করে দেখুন এবং শেষ পর্যন্ত একটি আলাদা নিয়ামক চেষ্টা করুন।
shodanshok

2
একই-এলবিএ কেবিলিংয়ের সমস্যা বলে মনে হয় না। যদি না এই সেক্টরের ডেটা কিছু স্ক্র্যাম্বলিংয়ের জন্য কিছু খারাপ-বিট-সিকোয়েন্স (অল-জিরো পরাজিত স্ব-ক্লকিংয়ের বর্ধিত রান প্রতিরোধের) বা এসটিএ / এসএএস লিঙ্কের উপরে ইসিসি হিসাবে না ঘটে। আমি নিশ্চিত নই যে এই লিঙ্কটি কী এনকোডিং ব্যবহার করে। নিয়ামক যদিও প্রশংসনীয়; একাধিক ডিস্কের প্রতিটি একই এলবিএর এক ধরণের সাধারণ ফ্যাক্টর ব্যাখ্যা প্রয়োজন।
পিটার

3
@ djsmiley2k চারপাশের ddসমাপ্তি একই রকম, রামের ঠিকানা ব্যর্থ করে দেওয়া কঠিন । তদুপরি, পিইআরসি-এর ডিআআআআআএম হ'ল ইসিসি সুরক্ষিত এবং ইসিসি র‌্যামও ব্যর্থ হলেও এটি তুলনামূলক অস্বাভাবিক। তাই বলা হয়, নিয়ামক পারেন বিষয় উত্স হতে তাই হয়, যদি তারের পরিবর্তন সাহায্য না, অপ নিয়ামক সোয়াপিং চেষ্টা করা উচিত।
shodanshok

2
ভাল আমার বন্ধুরা, আপনি ঠিক বলেছেন। তারগুলি + নিয়ন্ত্রকগুলি অদলবদল করে এখন GB০০ জিবি ডিডি শূন্য প্রক্রিয়াতে এবং এ পর্যন্ত কোনও ত্রুটি নেই। দেখে মনে হচ্ছে এখন সবকিছু ঠিকঠাক চলছে। আপনি ভাগ করেছেন এমন সমস্ত জ্ঞানের জন্য আবার ধন্যবাদ Thanks আমি আপনার সম্প্রদায়ের কাছে আপনার দক্ষতা এবং ভাগ করে নেওয়ার আগ্রহের জন্য সর্বদা কৃতজ্ঞ। :)
Scu11y
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.