হার্ডডিস্কগুলি অজানা কারণে অফলাইনে পড়ছে


11

আমার নিচে 7 টি সিস্টেম সেটআপ চলছে। এখন এবং তারপরে একটি পৃথক ডিস্ক অফলাইনে পড়ে, তবে কাছাকাছি পরিদর্শন করার সময় ডিস্কটি ভাল এবং ত্রুটিযুক্ত নয় এবং কমপক্ষে অন্য এক বছরের জন্য নির্লজ্জভাবে কাজ করে। যেহেতু এটি 7 টি সিস্টেমে ঘটেছিল তা আমি অসম্ভব বলে মনে করি যে এখানে একটি অংশ রয়েছে যা অভিনয় করছে (যেমন তারের), তবে এটি পরিবর্তে কিছু অংশের সংমিশ্রণ যা সামান্য বেমানান।

সমস্যাটি হ'ল অসম্পূর্ণতা যেখানে সঠিক পয়েন্টটি চিহ্নিত করা।

(যদি আপনার পরিবর্তে এমন কোনও কর্মক্ষেত্র থাকে যেখানে আপনি কমান্ড লাইন থেকে হার্ডডিস্কের ভার্চুয়াল পুনরায় আসন করতে পারেন তবে আপনি /server/ -তাই-বিবেচিত-মৃত )

সার্ভার হার্ডওয়্যার: ডেল 1950, ডেল আর 815, ডেল আর 715।

অপারেটিং সিস্টেম:

$ uname -a
Linux franklin 3.2.0-4-amd64 #1 SMP Debian 3.2.41-2+deb7u2 x86_64 GNU/Linux

নিয়ন্ত্রক:

$ lspci |grep 22: 
22:00.0 Serial Attached SCSI controller: LSI Logic / Symbios Logic SAS2008 PCI-Express Fusion-MPT SAS-2 [Falcon] (rev 03)
$ sas2flash -listall
LSI Corporation SAS2 Flash Utility
Version 15.00.00.00 (2012.11.06) 
Copyright (c) 2008-2012 LSI Corporation. All rights reserved

    Adapter Selected is a LSI SAS: SAS2008(B2)   

Num   Ctlr            FW Ver        NVDATA        x86-BIOS         PCI Addr
----------------------------------------------------------------------------

1  SAS2008(B2)     15.00.00.00    0f.00.00.04    07.29.00.00     00:22:00:00

    Finished Processing Commands Successfully.
    Exiting SAS2Flash.

একক এলএসআই এসএএস 2 এক্স 36 এক্সপেন্ডার চিপ সহ এসএএস / সাটা-এক্সপেনড্ডার সুপারমিক 4 4 এস এস / এসএটি এক্সপেন্ডার ব্যাকপ্লেন

cat /sys/devices/pci0000:20/0000:20:03.0/0000:22:00.0/host5/port-5:0/expander-5:0/port-5:0:21/end_device-5:0:21/target5:0:21/5:0:21:0/model
SAS2X36         
cat /sys/devices/pci0000:20/0000:20:03.0/0000:22:00.0/host5/port-5:0/expander-5:0/port-5:0:21/end_device-5:0:21/target5:0:21/5:0:21:0/rev
0717

ডিস্ক:

$ cat /sys/devices/pci0000:20/0000:20:03.0/0000:22:00.0/host5/port-5:0/expander-5:0/port-5:0:1/end_device-5:0:1/target5:0:1/5:0:1:0/model
Hitachi HDS72404
$ cat /sys/devices/pci0000:20/0000:20:03.0/0000:22:00.0/host5/port-5:0/expander-5:0/port-5:0:1/end_device-5:0:1/target5:0:1/5:0:1:0/rev
A3B0

একটি সিস্টেমে ডিস্ক:

$ cat /sys/devices/pci0000:20/0000:20:0b.0/0000:23:00.0/host5/port-5:0/expander-5:0/port-5:0:8/end_device-5:0:8/target5:0:8/5:0:8:0/model
ST3000DM001-9YN1
$ cat /sys/devices/pci0000:20/0000:20:0b.0/0000:23:00.0/host5/port-5:0/expander-5:0/port-5:0:8/end_device-5:0:8/target5:0:8/5:0:8:0/rev
CC4C

syslog:

sd 5:0:22:0: [sdw] Unhandled error code
mpt2sas1: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
sd 5:0:22:0: [sdw] Unhandled error code
mpt2sas1: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
sd 5:0:22:0: [sdw]
mpt2sas1: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
sd 5:0:22:0: [sdw] CDB: Write(10): 2a 00 3a 92 b9 00 00 01 00 00
end_request: I/O error, dev sdw, sector 982694144
sd 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
sd 5:0:22:0: [sdw] CDB: Write(10): 2a 00 3a 92 b7 00 00 01 00 00
end_request: I/O error, dev sdw, sector 982693632
sd 5:0:22:0: [sdw] Unhandled error code
sd 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
sd 5:0:22:0: [sdw] CDB: Read(16):
sd 5:0:22:0: [sdw] Unhandled error code
 88 00 00 00 00 01 43 e2 f2 d0 00 00 00 10 00 00
end_request: I/O error, dev sdw, sector 5433914064
sd 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
sd 5:0:22:0: [sdw] CDB: Write(10): 2a 00 3a 92 bd 00 00 01 00 00
end_request: I/O error, dev sdw, sector 982695168
sd 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
md/raid:md4: Disk failure on sdw, disabling device.
md/raid:md4: Operation continuing on 9 devices.
scsi 5:0:22:0: [sdw] Unhandled error code
scsi 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
scsi 5:0:22:0: [sdw] CDB: Write(10): 2a 00 3a 92 b8 00 00 01 00 00
end_request: I/O error, dev sdw, sector 982693888
scsi 5:0:22:0: [sdw] Unhandled error code
scsi 5:0:22:0: [sdw]  Result: hostbyte=DID_NO_CONNECT driverbyte=DRIVER_OK
scsi 5:0:22:0: [sdw] CDB: Write(10): 2a 00 3a 92 bc 00 00 01 00 00
end_request: I/O error, dev sdw, sector 982694912
mpt2sas1: removing handle(0x0021), sas_addr(0x500304800182694c)

9
গুরুত্বপূর্ণ প্রশ্ন জিজ্ঞাসা শুরু করার জন্য +1 :)
সোভেন

একটি খারাপ কেবল, এতে শিল্ডিংয়ের অভাব রয়েছে যা চেকসাম নিয়ে সমস্যা সৃষ্টি করতে পারে। [এভাবে সমস্যাগুলি পড়ার ও লেখার কারণ হয়]। আপনি তারগুলি প্রতিস্থাপন চেষ্টা করেছেন?
ভিক্ষু

তারের পরিচিত জিনিস দিয়ে প্রতিস্থাপন করা হয়েছে। এছাড়াও আমি আশা করব যে লিনাক্স এসসি বাস পুনরায় সেট করার পরে কমান্ডটি পুনরায় চেষ্টা করবে।
ওলে টাঞ্জ

2
আমি এখন পর্যন্ত যা খনন করতে পেরেছি, সেগুলি থেকে বার্তাগুলি ইঙ্গিত দেয় যে সংযোগের সমস্যা রয়েছে - স্মার্ট সতর্কতা নয় .. সম্ভবত বিআইওয়াইয়ের আরও অভিজ্ঞতার সাথে অন্য কেউ সহায়তা করতে পারে। আমি কেবল জানি এটি এসএএসএর তুলনায় কমান্ড / সারি না থাকার কারণে তারা বড় বড় সেটআপগুলিতে এস-এটিএ ডিস্ক থেকে দূরে থাকে। আমি কয়েকটিকে এটি দেখার জন্য বলব।
পৌষ

@ পউসকা আপনি যা খনন করেছেন তার সাথে কি (লিঙ্কগুলির সাথে?) বিস্তারিত বর্ণনা করতে পারেন?
ওলে টাঞ্জ

উত্তর:


1

আমরা এখানে তথ্য মিস করছি। আপনি পরামর্শ দিচ্ছেন যে এই স্টোরেজ সেটআপটিতে আপনার প্রতি সার্ভারে 24-45 টি ডিস্ক রয়েছে।

  • আপনি কোন নির্দিষ্ট নিয়ন্ত্রক ব্যবহার করছেন?
  • ডিস্কের সংখ্যার কারণে আপনার কোনও বাহ্যিক ঘেরে কিছু ড্রাইভ থাকতে পারে। দয়া করে ব্যবহৃত বাহ্যিক ড্রাইভ ঘেরের মেক / মডেল সরবরাহ করুন।
  • আপনি কোন নির্দিষ্ট ড্রাইভের মডেলগুলি ব্যবহার করছেন? হয় সব ডিস্ক ডেস্কটপ গ্রেড ড্রাইভ?
  • আপনি কোন ফাইল সিস্টেম ব্যবহার করছেন?
  • ডিস্ক এবং RAID বিন্যাস বর্ণনা করুন।
  • এটি কি সর্বদা সমস্যা ছিল নাকি সময়ের সাথে সাথে এটি বিকশিত হয়েছিল?
  • হয় Supermicro জড়িত এই সেটআপ যে কোন জায়গায়?

ঘেরের সেটআপের উপর নির্ভর করে আপনি স্যাটা টাইমআউট বা বাসের ত্রুটিতে চলেছেন। এই করতে একটি অসুস্থ প্রভাব আছে ড্রাইভ নিয়ামক সংযুক্ত সব।

আর একটি সমস্যা দুর্বল এসএএস / সাটা লিঙ্কের আলোচনার হতে পারে। 1.5 জিবিপিএস এবং 6.0 জিবিপিএস ড্রাইভগুলি একই বোর্ডে মিশ্রিত হওয়ার সময় আমি অবশ্যই কিছু এসএএস প্রসারণকারীগুলিতে এটি অনুভব করেছি।

আরও তথ্য সরবরাহ করুন।


আমি সুপারমাইক্রো সম্পর্কে আপনার প্রশ্নে খুব আগ্রহী। তুমি কি বিস্তারিত বলতে পারো?
হাফগগার

@ হালফগার আপনি জিজ্ঞাসা করা অন্যান্য প্রশ্নগুলির জন্য প্রতিক্রিয়া জানাতে পারেন?
ew white

মূল পোস্টটি আমার নয়। আমি কেবল এই বিবৃতিটি সম্পর্কে কৌতূহলী।
হাফগগার

1
@ হালফগার উফস ... ভাল, আমি পেয়েছি যে সুপারমাইক্রো এসএএস প্রসারিত / ব্যাকপ্লেন এবং জেবিডের কিছু ঘেরগুলি অনেক পরিস্থিতিতে ভবিষ্যদ্বাণীপূর্ণ আচরণ করে না। এসএএস / সাটা স্পিড ডাউনশিফিং এবং লিঙ্ক আলোচনার বিষয়ে আমার উত্তরের নোটটি এমন কিছু যা আমি কেবল সুপারমিক মেশিনের কিছু সংশোধন করে অভিজ্ঞ হয়েছি। দুর্বল আচরণের কারণে আমি তাদের জেবিডগুলি আর জেডএফএসের জন্য আর ব্যবহার করতে পারি না।
ew white
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.