শুধুমাত্র 1 হার্ড ডিস্ক ব্যর্থ হলে একটি RAID 4 ডিস্ক সেটআপ ক্র্যাশ করতে পারে? [বন্ধ]


9

আমি একজন ওয়েব বিকাশকারী। হার্ডওয়ারে আমার খুব বেশি অভিজ্ঞতা নেই। এই কারণে, আমি পরিচালিত সার্ভারগুলি ব্যবহার করি।

এই সকালে, আমাদের সেটআপের একটি ড্রাইভ ব্যর্থ হয়েছে। তবে পুরো সাইটটি নেমে গেছে। আমি আমার ওয়েব হোস্টকে জিজ্ঞাসা করলাম কী ঘটেছিল এবং তিনি জবাব দিয়েছিলেন যে হার্ড ডিস্কটি এমনভাবে ব্যর্থ হয়েছিল যাতে RAID নিয়ামক সঠিকভাবে কাজ করতে পারে না। অ্যারে RAID 4 হিসাবে সেট আপ করা হয়েছিল।

আপনি কি এর আগে কখনও দেখেছেন? এটা কি সম্ভব?

এই ছেলেরা কোন সাহায্যের জন্য ধন্যবাদ। আমার ওয়েব হোস্টটি আমার সাথে সৎ কিনা তা আমার জানতে হবে।


যদি অ্যারেতে একাধিক ডিস্ক মারা যায় তবে RAID ব্যর্থ হবে (যদিও এটি RAID সেটআপের উপর নির্ভর করে)।
Rhys ইভান্স

ছোট গল্পটি হ'ল, আপনার সরবরাহকারী একটি ****** এবং সস্তা দিকে কাজ করে। এটি যতক্ষণ না গ্রাহক হিসাবে আপনাকে সতর্ক করা হয়েছিল ততক্ষণ তা পুরোপুরি গ্রহণযোগ্য হতে পারে তার ড্রাইভিং ব্যর্থতার কারণে তার অবকাঠামো দোষ-সহনীয় নয়।
লুক 404

অভিযানের ধরণটি (উদাহরণস্বরূপ অভিযান 0,1,4,5,6 ইত্যাদি) দিয়ে প্রশ্নটি আপডেট করুন।
ট্রেভর বয়েড স্মিথ

উত্তর:


22

আপনার সরবরাহকারী হার্ড ড্রাইভগুলি ব্যবহার করছেন না যা সম্ভবত রেড-এ ব্যবহৃত হয় না More সাধারণ গ্রাহক এসটিএ ড্রাইভগুলি এই বিভাগে আসে into

সম্ভবত সমস্যাটি হ'ল ড্রাইভটি সংশোধনযোগ্য পঠন ত্রুটি (ইউআরই) অনুভব করা শুরু করে। যখন এটি কোনও গ্রাহক ড্রাইভে ঘটে, ড্রাইভটি সেখানে বসে এবং পড়া শেষ না হওয়া অবধি (সাধারণত 30-60 সেকেন্ডের জন্য) পুনরায় চেষ্টা করে। RAID ড্রাইভটির ত্রুটিটি রিপোর্ট করার জন্য অপেক্ষা করবে (30-60) সেকেন্ড। সুতরাং কয়েকটি ক্ষেত্রের জন্য একটি সাধারণ অনুরোধটি সার্ভারটিকে সহজেই থামতে পারে যখন ব্যর্থ ড্রাইভটি সেইগুলি পুনরায় চেষ্টা করার মাধ্যমে চালিত হয় gr

RAID অ্যারেগুলির জন্য চালিত গাড়িগুলির মধ্যে টাইম লিমিটেড ত্রুটি পুনরুদ্ধার হয় (এসটিএ ড্রাইভের জন্য)। TLER ব্যর্থতাগুলি দ্রুত নিয়ন্ত্রণকারীদের কাছে ফিরিয়ে দেয়, যাতে নিয়ামক বুদ্ধিমানের সাথে এ জাতীয় ব্যর্থতার প্রতিক্রিয়া জানাতে পারে (বেশিরভাগ বুদ্ধিমানভাবে; আশাবাদী)। এসসিএসআই (এসএএসও) কিছুটা আলাদাভাবে কাজ করে। এসসিএসআই কমান্ড সেটটি নিয়ন্ত্রককে ড্রাইভে বিভিন্ন পুনরুদ্ধার প্রচেষ্টা সীমা নির্দিষ্ট করার অনুমতি দেয় (মোডে নির্বাচন: আরডাব্লু ইআরআর পুনরুদ্ধার)। একটি RAID নিয়ামক ড্রাইভগুলি দ্রুত ব্যর্থ হওয়ার জন্য সেট করা উচিত, কন্ট্রোলার তখন পরীক্ষা করতে পারে যদি ড্রাইভটি মনে করে যে এটি টিআর কমান্ডের সাথে সঠিকভাবে কাজ করছে, যদি চেক শর্ত থাকে তবে অ্যারে থেকে ড্রাইভটি ব্যর্থ করে দেয়।


ভাল ব্যাখ্যা।
sbrattla

11

হ্যাঁ, এটি সম্ভব, এমনকি এমন পরিস্থিতিতেও যেখানে আপনি ভাবেন যে অ্যারে ব্যর্থতা থেকে বেঁচে থাকা উচিত ছিল।

অ্যারে কেন ব্যর্থ হয় সে সম্পর্কে কিছু সম্ভাবনা:

  • RAID মোড দ্বারা চালিত হতে পারে তার চেয়ে বেশি ড্রাইভ ব্যর্থ হয়েছে। উদাহরণ স্বরূপ:
    • RAID 0 (স্ট্রাইপিং) কোনও ড্রাইভ ব্যর্থতা টিকতে পারে না।
    • RAID 1 1 ড্রাইভ ব্যতীত সকলের ব্যর্থতা থেকে বাঁচতে পারে।
    • RAID 4/5 1 ড্রাইভ ব্যর্থতা থেকে বাঁচতে পারে।
    • RAID 6 2 ড্রাইভ ব্যর্থতা থেকে বাঁচতে পারে।
    • কোন ড্রাইভ ব্যর্থ হয় তার উপর নির্ভর করে RAID 10 ড্রাইভের 50% পর্যন্ত ব্যর্থতা থেকে বাঁচতে পারে।
  • RAID সফ্টওয়্যার বা নিয়ামক ফার্মওয়্যারের একটি বাগ।
  • ব্যবহারকারীর ত্রুটি।
    • কেউ খুব বেশি ড্রাইভ টানেছে।
    • কেউ ড্রাইভ টেনেছেন এবং এটিকে কখনও প্রতিস্থাপন করেননি এবং অন্য একটি ড্রাইভ পরবর্তী সময়ে ব্যর্থ হয়েছিল।
    • অ্যারে পর্যবেক্ষণ করা হয়নি, বেঁচে থাকার চেয়ে আরও বেশি ড্রাইভ ব্যর্থ হতে দেয়।
  • গ্রাহক গ্রেড ড্রাইভ সহ সস্তা কন্ট্রোলাররা সাধারণত অন্যথায় বেঁচে থাকার পরিস্থিতিতেও ব্যর্থ বলে পরিচিত।
    • একটি গ্রাহক স্তরের ড্রাইভটি খারাপ পড়া সেক্টর যতক্ষণ না ভাল পঠিত হয় ততক্ষণ প্রায় অনির্দিষ্টকালের জন্য চেষ্টা করবে। একটি সস্তা নিয়ামক এই ধরনের ড্রাইভের ফলাফল ফিরে পেতে প্রায় অনির্দিষ্ট সময়ের জন্য অপেক্ষা করবে। অপেক্ষারটি এত দীর্ঘ হতে পারে যে অপারেটিং সিস্টেমটি ছেড়ে দেয়। তারপরে পুনরায় বুট করার সময় ড্রাইভগুলি নিয়ন্ত্রণকারীর পক্ষে যথেষ্ট পর্যাপ্ত সাড়া দেয় না এবং অ্যারে ব্যর্থ বলে ধরে নেওয়া হয়।
    • অন্যদিকে, একটি এন্টারপ্রাইজ লেভেল ড্রাইভ দ্রুত ছেড়ে দেবে, নিয়ামকটিকে অন্য ড্রাইভ থেকে ডেটা টানতে দেবে। এছাড়াও, একটি ভাল নিয়ামক এমন একটি ড্রাইভ চিহ্নিত করবে যা ব্যর্থ হিসাবে প্রতিক্রিয়া জানাতে এবং এগিয়ে যেতে খুব বেশি সময় নেয়।

1
RAID 1 এ অ্যারের মধ্যে একটি ড্রাইভ বাদে সকলের মৃত্যুর হাত থেকে বাঁচতে হবে । মঞ্জুর, বেশিরভাগ লোকেরা সম্ভবত দুটি ড্রাইভের RAID 1 সেটআপ চালায়, যার অর্থ এটি কেবলমাত্র একটি ড্রাইভের মৃত্যুর হাত থেকে বাঁচতে পারে তবে এটি RAID 1
সিভিএন

আকর্ষণীয় সুতরাং যদি একটি RAID 10 এ 1 ডিস্ক ব্যর্থ হয় তবে আপনি অন্য ডিস্কটি ভেঙে ফেলবেন কারণ এটি কেবলমাত্র একটি ডিস্ক নষ্ট হয়ে গেলে বেঁচে থাকবে না :-) আমি মনে করি আপনার পোস্টটি সম্পাদনা করা উচিত।
ফ্লাই করুন

@ মাইকেলKjörling ভাল পয়েন্ট। আমি আমার পোস্ট সম্পাদনা করেছি।
দীর্ঘায়ু

@FLY আপনি ঠিক বলেছেন, আমি এই পয়েন্টটি দেখেছি। সম্পাদনা করা হয়েছে।
দীর্ঘায়ু

RAID4 RAID3 হওয়া উচিত। RAID3 বাইট প্যারিটি সহ স্ট্রিপিং; RAID4 একটি ইসিসি বাস্তবায়ন ছিল যেখানে এএফাইক কখনও প্রয়োগ করা হয়নি এমন বিপুল সংখ্যক ড্রাইভের প্রয়োজন।
ড্যান ইজ ফিজলিং ফায়ারলাইট

8

যদি এটি একটি রেড 0 বাস্তবায়ন হয় তবে অবশ্যই যখন কোনও একক ড্রাইভ ব্যর্থ হয় আপনি তার সাথে অ্যারে এবং সমস্ত ডেটা হারাবেন।


এটি একটি র‌্যাড 4 বাস্তবায়ন
স্টিভ

11
হাহাহাহা - আপনারা আমাকে প্রায় সেখানে রেখেছিলেন, আসলে কী?
চপার 3

3
@ চপ্পার 3 নেটঅ্যাপ RAID4 ব্যবহার করে। সুতরাং এটি সম্পূর্ণরূপে শোনা যায় নি, যদিও এটি আমাকে খুব ছড়িয়েছিল। হয়তো এটি হোস্টের বলার উপায় যা তাদের কাছে নেট অ্যাপ্লিকেশন ফাইলার বা কিছু আছে।
আশাহীন N00b

1
@ স্টিভরডরিগু আপনি কি নিশ্চিত যে এটি রেড 4?
MDMarra

1
যদি এটি সত্যই RAID4 হয় এবং শুধুমাত্র 1 ড্রাইভ ব্যর্থ হয়েছে, তবে নীতিগতভাবে নূন্যতম কোনও নতুন ড্রাইভ ইনস্টল করে অ্যারে পুনর্নির্মাণ করা উচিত ought সম্ভবত ওয়েব হোস্টের অর্থ হ'ল তিনি যখন এটি করার চেষ্টা করছেন তখন বাকি একটি ড্রাইভ ব্যর্থ হয়েছিল?
ইউজার 3490

2

আমি দেখেছি ফার্মওয়্যার বাগগুলি যখন কোনও ডিস্ক খারাপ হয়ে যায় বা যখন এটি আসন্ন ব্যর্থতার কথা বলা শুরু করে তখন পুরো RAID কেটে যায়। দুঃখিত, আমি আপনাকে নির্দিষ্ট করার জন্য নির্দিষ্ট কিছু নেই, তবে হ্যাঁ, এটি ঘটতে পারে। RAID স্পেসের অংশ হিসাবে নয়, অবশ্যই এটি অবশ্যই একটি বাগ।


1

হ্যাঁ এটা সম্ভব. এটি হওয়ার কথা নয় , তবে এটি অবশ্যই পারে। ইউআরআই (অপরিবর্তনযোগ্য পড়ার ত্রুটি) এবং নিয়ামক ত্রুটি এবং ফার্মওয়্যার বাগ এবং এর মতো প্রবেশ করান।

অতিরিক্ত তথ্য ব্যতীত (যে আপনার হোস্ট সম্ভবত আপনাকে দেবেন না), এক উপায় বা অন্যটি অবশ্যই বলা সম্ভব নয়, তবে যে কেউ প্রচুর RAID অ্যারে নিয়ে কাজ করেছে তার অভিজ্ঞতা রয়েছে যেখানে পুরো অ্যারেটি হারিয়ে গেছে বা ক্র্যাশ হয়ে গেছে it থাকা উচিত ছিল না।

(এবং, যাইহোক , RAID4 খুব বেশি ব্যবহৃত RAID স্তর নয়, তবে কোনও ড্রাইভের ক্ষতি সহ্য করা উচিত mean তবে এর অর্থ এই নয় যে এটি সর্বদা থাকবে)


1

আমার অনেকগুলি এইচডিডি ব্যর্থতা ছিল যেখানে মেকানিকগুলি ব্যর্থ হয়নি, তবে ইলেকট্রনিক্স যোগাযোগের ইন্টারফেস তৈরি করে। তাদের ছোট আকারের কারণে অনেকগুলি বৈদ্যুতিন উপাদান এমনকি ছোটখাটো বৈদ্যুতিক অনিয়মের জন্য খুব সংবেদনশীল (এটি ঘটতে পারে যখন কাছের বড় এ / সি মোটরগুলি চালু / বন্ধ করা হয় ইত্যাদি এবং সস্তার দিকে বিদ্যুৎ সরবরাহ সামান্য থাকে)।

যখন ড্রাইভের অভ্যন্তরীণ শক্তি রূপান্তরকারী বা ক্যাপাসিটারগুলি (এনার্জি স্টোরেজ বাফারগুলি) এইচডিডি এর বাহ্যিক সংযোজকগুলিতে উত্পন্ন বৈদ্যুতিক সংকেতগুলি জ্বালিয়ে ফেলতে পারে এবং নির্দিষ্টকরণের বাইরে চলে যেতে পারে। যেহেতু ড্রাইভটি তামা তারের মাধ্যমে নিয়ামকের সাথে সংযুক্ত রয়েছে এবং সার্ভারগুলিতে অনেকগুলি ড্রাইভ ইনস্টলেশন সহজতর করতে এবং বিশৃঙ্খলা হ্রাস করার জন্য একটি তারের সংযোগ ভাগ করে নেয়, এটি সহজেই বিঘ্নিত করতে পারে বা স্থায়ীভাবে যে কোনও সংখ্যক সংলগ্ন উপাদানকে ধ্বংস করতে পারে।

উপায় দ্বারা দামের সাথে এটির খুব কম সম্পর্ক রয়েছে। এটি সত্য যে ব্যয়বহুল নিয়ামক এবং ড্রাইভগুলি এমন অংশগুলি ব্যবহার করে যা অস্বাভাবিক অবস্থার প্রতি আরও সহনশীল বা আরও ভাল সুরক্ষিত রয়েছে, এবং বাজেটের উপাদানগুলির সাথে আপনি সাব-স্ট্যান্ডার্ড অংশগুলি পাওয়ার সম্ভাবনা বেশি। তবে আমি নিয়মিত $ 50 ড্রাইভ এবং a 500 ড্রাইভে অভিন্ন ক্যাপাসিটারগুলি পেয়েছি। এবং যদি কোনও ব্যর্থ এইচডিডি সরাসরি 12 টি ভোল্টকে সাটা সংযোগকারীটিতে বিদ্যুৎ সরবরাহ থেকে যাত্রা করে কারণ কিছু সংক্ষিপ্ত হয়ে গেছে, আপনার রেড নিয়ামক ভাজা হয়ে যাবে, দামের ট্যাগটি কতগুলি পরিসংখ্যান ছিল তা বিবেচনা করেই।

এটি সাধারণত যা হয় তা নয় তবে এটি আমার অভিজ্ঞতার মধ্যে অবশ্যই শোনা যায় না।


"প্রায়শই সার্ভারগুলিতে অনেকগুলি ড্রাইভ তারের সংযোগ ভাগ করে দেয়" আধুনিক এসএএস বা স্যাটা পরিবেশে নয়। আপনার দৃশ্যটি এখানে যা ঘটেছে তা মহাকাশীয়ভাবে অসম্ভব; আমি মনে করি না যে আমি কখনই কোনও ড্রাইভের ইলেকট্রনিক্স মারা যাবার এবং এর সাথে অন্য উপাদানগুলি নিয়ে যাওয়ার কথা শুনেছি। 12v অবশ্যই কোনও Sata বা SAS নিয়ামককে ভাজাতে পারে তবে যুক্তির উপাদানগুলি খুব কমই যে কোনওভাবেই 12v এর সাথে সংযুক্ত থাকে কারণ 5v বা 3.3v উত্সের তুলনায় 12 থেকে 3.3 বা তারও কম ভোল্টেজ নামানো খুব জটিল। আমি উত্সাহী যেখানে আপনার এই ধরণের ঘটনার প্রধান হতে পারে; আপনি যদি ভাগ করতে চান?
ক্রিস এস

1

হ্যাঁ, আমার ধারণা, কোনও একক ড্রাইভ ব্যর্থতার পরে পুরো অভিযান ব্যর্থ হতে পারে। প্রথম ব্যর্থ ড্রাইভটি কন্ট্রোলার দ্বারা অফলাইনে নেওয়া হবে এবং অভিযানটি এখনও ঠিক কাজ করবে। কিন্তু যখন ব্যর্থ ড্রাইভ প্রতিস্থাপন করা হয়, তখন নিয়ন্ত্রক আক্রমণটি পুনর্নির্মাণ শুরু করে। যদি অন্য কোনও ড্রাইভের একটি সুপ্ত অ-আবিষ্কারের পঠন সমস্যা থাকে তবে ব্যর্থ ড্রাইভটি পুনর্নির্মাণের ফলে আরও বেশি ড্রাইভ অফলাইনে যেতে পারে (যখন রেড পুনর্নির্মাণের সময় পাঠ্য সমস্যাগুলি আবিষ্কার করা হয়) আবার পুরো রেইডের কারণ হতে পারে ব্যর্থ হয়।


এই কারণেই সমস্যাগুলি পড়ার বা লেখার সমস্যা আবিষ্কার করার জন্য, RAID অ্যারেগুলিকে নিয়মিত স্ক্রাব করা দরকার।
ক্রিস এস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.