হার্ড ড্রাইভ প্রতিস্থাপন [বন্ধ]


19

আমি ভাবছিলাম যে মারা যাওয়ার আগে নির্দিষ্ট বছর ব্যবহারের পরে (মোটামুটি) সিস্টেম-ক্রিটিকাল ডাটাবেস সার্ভারে একটি হার্ড ড্রাইভকে প্রতিস্থাপন করা ভাল ধারণা কিনা?

উদাহরণস্বরূপ, আমি 3 বছর ব্যবহারের পরে একটি হার্ড ড্রাইভ প্রতিস্থাপনের কথা ভাবছিলাম। যেহেতু আমার কাছে সার্ভারগুলিতে অনেকগুলি হার্ড ড্রাইভ রয়েছে, তাই আমি আটকে যেতে পারি যা হার্ড ড্রাইভগুলি প্রতিস্থাপন করা হয়েছে।

এটি কি একটি ভাল ধারণা, বা লোকেরা কেবল ব্যর্থতার জন্য অপেক্ষা করে?

উত্তর:


33

গুগল ডিস্ক ড্রাইভে একটি গবেষণা করেছে এবং ডিস্কের বয়স এবং ব্যর্থতার মধ্যে খুব কম পারস্পরিক সম্পর্ক খুঁজে পেয়েছে। স্মার্ট পরীক্ষায়ও ব্যর্থতা দেখা যায় না।

আমার স্থানীয় পর্যবেক্ষণ (> 500 সার্ভার) একই রকম। আমার নতুন ডিস্কগুলি দ্রুত ব্যর্থ হয়েছে যখন পুরানোগুলি এখনও চাগে।

আমার সাধারণ নিয়মটি হ'ল যদি আমরা ডিস্কের সমস্যাগুলি (স্মার্ট বা সিস্টেম ত্রুটিগুলি) দেখি তবে আমরা তা অবিলম্বে এটি প্রতিস্থাপন করব। যদি তা না হয় তবে সার্ভারটি করার পরে ড্রাইভগুলি সাইকেল চালিয়ে যায়।

গুগল স্টাডি http://static.googleusercontent.com/external_content/untrusted_dlcp/research.google.com/en/us/archive/disk_failures.pdf


আমি সাধারণত যা ভাবছিলাম এটি ছিল, তবে অন্যরা কী করেছিল তা দেখতে চেয়েছিল। ধন্যবাদ
গারফোনজো

2
আমি একমত. আমরা নতুন 2.5 "এসএএস ড্রাইভের সাথে 10 বছরের পুরানো সার্ভারের সাথে 3.5" 9 জিবি এসসিএসআই ড্রাইভ চালিয়ে যাচ্ছি তার তুলনায় অনেক বেশি ব্যর্থতার হার আমরা দেখছি!
জেমস ও গর্মন

@ জেমস ও গর্মন ম্যানুফ্যাকচারিং প্রক্রিয়াগুলি পরিবর্তন ... আমাকে কিছুটা ইঞ্জিনিয়ারিং "ট্রেড-অফ" এর অংশ হিসাবে নতুন ড্রাইভগুলিতে কী করা হয়েছে তা অবাক করে দেয়।
অ্যাভেরি পেইন

1
মাইক্রোসফ্ট টেকনেটেরও ফল্ট টলারেন্স সম্পর্কিত একটি নিবন্ধ রয়েছে যা হার্ড ড্রাইভ / মেকানিকাল উপাদান ব্যর্থতার উপর সংক্ষিপ্তভাবে স্পর্শ করে ( টেকনেট.মাইক্রোসফটকম /en-us/library/bb742464.aspx ) - তারা "বাথটব বক্ররেখা" সম্পর্কে কিছুটা কথা বলে যে যান্ত্রিক উপাদান ব্যর্থতা অনুসরণ প্রবণতা।
voretaq7

@ অ্যাভারি পেইন নতুন ড্রাইভগুলি দেখুন, নোট করুন যে 2.5 "ড্রাইভগুলিতে অনেক বেশি কঠোর সহনশীলতা রয়েছে - ফলস্বরূপ" 3.5 "ড্রাইভটিতে" গ্রহণযোগ্য "যান্ত্রিক beাল হিসাবে ব্যবহৃত হত 2.5" ড্রাইভে বিপর্যয়কর ব্যর্থতা ডেকে আনতে পারে। টেকনেট নিবন্ধটি আরও দেখুন আমি বাথটব বক্ররেখার সাথে যুক্ত ছিলাম - যান্ত্রিক উপাদানগুলি সাধারণভাবে উচ্চতর শিশু মৃত্যুর শিকার হয় এবং অবশেষে "বৃদ্ধ বয়স" না মারা অবধি তুলনামূলকভাবে স্থিতিশীল থাকে। 2.5 "ড্রাইভগুলি এখনও" শিশু মৃত্যু "অঞ্চলে রয়েছে - আমার অভিজ্ঞতা অনুসারে অপারেশন কমপক্ষে 1 বছর।
voretaq7

13

না।

একটি সক্রিয় উত্পাদন সার্ভারে হার্ড ড্রাইভ প্রতিস্থাপনের ক্ষেত্রে সবচেয়ে বড় সমস্যা হ'ল এটি করা পুনর্নির্মাণকে ট্রিগার করে। বিশেষত যদি আপনি RAID5 ব্যবহার করে থাকেন এবং বিশেষত আপনি যদি বড় ড্রাইভ ব্যবহার করে থাকেন তবে পুনর্নির্মাণে বাধ্য করা একটি অপরিবর্তনযোগ্য ব্যর্থতার খুব গুরুত্বপূর্ণ ঝুঁকি তৈরি করে। পুনর্নির্মাণের সময় অ্যারে হারানোর ঝুঁকিটি 3 বছরের পুরানো ড্রাইভ জায়গায় রেখে দেওয়ার সাথে জড়িত ঝুঁকির চেয়ে অনেক বেশি।

একটি চূড়ান্ত উদাহরণ গ্রহণ করে, আপনি যদি 2TB ডিস্ক সমন্বিত 6 ডিস্ক RAID5 অ্যারে প্রতিটি ডিস্ককে ধারাবাহিকভাবে প্রতিস্থাপন করেন, তবে পুনর্নির্মাণগুলির মধ্যে একটির সময় অপরিশোধনযোগ্য পড়ার ত্রুটির আপনার তাত্ত্বিক ঝুঁকি 58% এর আশেপাশে রয়েছে (আমার ন্যাপকিন গণিত অনুসারে); দয়া করে আপনার নিজের করুন এবং নোটগুলি তুলনা করুন)। অন্য কথায়: আপনার "প্রতিরোধমূলক" ডিস্ক প্রতিস্থাপন কার্যত নাশকতার চেয়ে কম কিছু নয়

কেবলমাত্র যখন আমি কোনও পুরানো সার্ভারে রিফ্রেশ ড্রাইভগুলি বিবেচনা করব তখন এটি "পুনর্নির্মাণ" চলাকালীন হবে, যেমন একটি কাজ থেকে ডেকে আউট হওয়ার পরে এবং নতুন ভূমিকা সহ সেবারে ফিরিয়ে দেওয়ার আগে। এমনকি সেই সময়ে, ক্ষমতা এবং কার্য সম্পাদনের প্রয়োজনীয়তাগুলি ড্রাইভের বয়সের চেয়ে অনেক বেশি গুরুত্বপূর্ণ হবে।


1
পুনর্নির্মাণটি ট্রিগার করার জন্য +1
গ্রেগম্যাক

ঝুঁকি 58% কেন আপনি দয়া করে ব্যাখ্যা করতে পারেন? যদি ডিস্কটি নিয়মিত টহল দেয় তবে কেন এটি আরও পুনরুদ্ধারের উপর জোর দেবে?
মিরসিয়া ভুটকোভিচি

@ মিরসিভাটকোভিসি কারণ একটি রেড -5 বিন্যাসে, সমস্ত ড্রাইভগুলি পুনরায় নির্মাণের সময় এবং বনাম মাঝে মাঝে এলোমেলোভাবে এখানে বা সেখানে নিয়মিত সক্রিয় থাকবে। অন্য কথায়, সমস্ত ড্রাইভের "লোড" এগিয়ে চলেছে, এবং এটি করতে গিয়ে, আপনার ২ য় ব্যর্থ ড্রাইভকে চালিত করার ঝুঁকিও তত বাড়তে পারে।
অ্যাভেরি পেইন

@ অ্যাভরি পেইন আমি জানি যে আপনি পুনর্নির্মাণের সময় ডিস্কগুলিকে বেশি চাপ দিন। আমি বুঝতে চেষ্টা করছি যে কেন একটি পুনর্নির্মাণ ডিস্কগুলিকে একটি ধারাবাহিকতার চেয়ে বেশি চাপ দেবে।
মিরসিয়া ভুটকোভিচি

@MirceaVutcovici সঠিক চিত্র (এবং কিভাবে গণিত করার জন্য) বিতর্কিত, কারণ বটম লাইন আপনি ডাটা 10 টেরাবাইট পড়া করতে হবে তা হল ছয় বার , একটি সমতা ডিস্ক কোনো পঠিত ত্রুটি সংশোধন করার সুবিধার ছাড়া, যাতে কার্য সম্পাদন করতে আপনাকে ছয়টি পুনর্নির্মাণ কোনও ত্রুটি ছাড়াই 60 টেরাবাইট ডেটা পড়ার সম্ভাবনা আপনার পক্ষে নয়।
স্কাইহক

3

আমি এটা দেখিনি। সার্ভারগুলিকে উত্পাদনের বাইরে নিয়ে যাওয়া - 5 বছর অবধি ওয়ারেন্টির অধীনে রাখি। স্ট্যান্ডার্ড রেড 5 আপনাকে একটি ডিস্ক ব্যর্থতা থেকে বাঁচতে দেয় যাতে আমরা কেবল

কয়েকটা ড্রাইভ হাতে রেখে থাকি আমরা এখনই একটি পুনর্নির্মাণ শুরু করতে পারি এবং সমালোচনামূলক সার্ভারগুলিতে, আমরা একটি হটস্পায়ার অন্তর্ভুক্ত করি বা রেড 10 যেতে পারি you've সম্প্রতি একটি সার্ভারে আপনার ব্যাকপ্লেন সমস্যা হতে পারে। কাছাকাছি নির্মাণ থেকে খুব নতুন কম্পন বা ধুলো হতে পারে।


এই সম্পূর্ণ সত্য নয়। যদি আপনার ডিস্কের একটি বড় সংখ্যা একই থেকে থাকে তবে আপনি যখন পুনর্নির্মাণের চাপ যুক্ত করেন তখন আপনি যুগপত ব্যর্থতার অনেক বেশি ঝুঁকি নিয়ে যান। অন্য উত্তরে যেমন উল্লিখিত হয়েছে, পুনর্নির্মাণের সময় একটি ইউআরআই-র ক্রমবর্ধমান সম্ভাব্যতা র‌্যাড 5 বৃদ্ধি করে যা আপনার অ্যারেটিকে রেইড 5 বৈধতার প্রান্তিকের নীচে নিয়ে যায়।
ম্যাজেলান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.