RAID1 বা 5 এর পরিবর্তে RAID0, এই কি পাগল?


14

আমি আমাদের এসকিউএল সার্ভারের একটি ক্লাস্টারের জন্য একটি RAID0 সেটআপ ব্যবহার করার বিষয়টি বিবেচনা করছি। আমি পরিস্থিতিটির রূপরেখা দেব এবং কেন এটি খারাপ ধারণা হতে পারে তা সন্ধান করব। এছাড়াও যদি আপনার কেস কেস, হোয়াইট পেপারস বা অন্য ডকুমেন্টেশন ব্যবহার করে থাকেন তবে আপনি আমাকে এই বিষয়টিতে নির্দেশ করতে পারেন, এটি দুর্দান্ত।

আমাদের 2 টি ডাটাসেন্টারে 3 টি সার্ভার রয়েছে যা একটি এসকিউএল ক্লাস্টারের অংশ। তারা সকলেই একটি উপলভ্যতা গোষ্ঠীতে এসকিউএল সার্ভার চালাচ্ছেন। প্রাথমিকের ঠিক পাশের জায়গায় একটি প্রতিরূপ রয়েছে এবং অন্য একটি ডাটাবেসটারে রয়েছে। তারা স্বয়ংক্রিয়ভাবে ফেলওভারের সাথে সিঙ্ক্রোনাস প্রতিলিপি চলছে। সমস্ত ড্রাইভগুলি এন্টারপ্রাইজ শ্রেণীর এসএসডি। তারা এসকিউএল সার্ভার 2017 বা 2019 চালিয়ে যাবে।

আমি ভাবছি যে কয়েকগুলি, যদি কোনও সত্যিকারের অসুবিধাগুলি রয়েছে সেগুলি নিয়ে RAID0 অ্যারেগুলিতে চালানোর একাধিক সুবিধা হবে। বর্তমানে কেবলমাত্র নেতিবাচক হিসাবে আমি প্রাথমিক সার্ভারে অপ্রয়োজনীয়তার অভাব দেখাচ্ছি, তাই এটি ব্যর্থতা বৃদ্ধি করে। পেশাদার হিসাবে:

  1. যদি কোনও ড্রাইভ ব্যর্থ হয়, যদি না কোনও ধীরে ধীরে অবনমিত অবস্থায় চালিত না হয় তবে কেউ যদি কোনও ম্যানুয়ালি নিজেই এটিতে কাজ করে সে সম্পর্কে বিজ্ঞপ্তি না পাওয়া যায় তবে সার্ভারটি তাত্ক্ষণিকভাবে সম্পূর্ণ অপারেশনীয় ক্ষমতা বজায় রাখার জন্য একটি গৌণ ব্যর্থ হবে। এটি একটি ব্যর্থতা সম্পর্কে আমাদের অবহিত করার একটি অতিরিক্ত সুবিধা হবে, সুতরাং আমরা শীঘ্রই কারণটি তদন্ত করতে পারি।

  2. এটি প্রতি টিবি ক্ষমতাতে সামগ্রিকভাবে ব্যর্থতার সম্ভাবনা হ্রাস করে। যেহেতু আমাদের সমতা বা আয়না ড্রাইভের দরকার নেই, তাই আমরা অ্যারে প্রতি ড্রাইভের সংখ্যা হ্রাস করি। কম ড্রাইভের সাথে ড্রাইভ ব্যর্থতার কম সম্ভাবনা কম।

  3. এটা সস্তা. আমাদের প্রয়োজনীয় ক্ষমতার জন্য কম ড্রাইভের প্রয়োজন বোধহয় কম ব্যয়।

আমি জানি এটি প্রচলিত ব্যবসায়িক চিন্তা নয়, তবে এমন কিছু আছে যা আমি বিবেচনা করছি না? আমি কোনও ইনপুট প্রো বা কন পছন্দ করি।

আমি কোয়েরি পারফরম্যান্স লাভের জন্য এটি করার চেষ্টা করছি না, যদিও অর্থবোধক ব্যক্তিরা যদি এটিকে বিন্দুতে নির্দ্বিধায় মনে করেন। আমার প্রাথমিক উদ্বেগটি এমন কোনও নির্ভরযোগ্যতা বা অপ্রয়োজনীয় সমস্যা যা আমি ভেবে দেখিনি সেগুলি বিবেচনা বা সমাধান করতে ব্যর্থ।

ওএস পৃথক মিররড ড্রাইভে রয়েছে তাই সার্ভারটি নিজেই আপ থাকা উচিত। এই ড্রাইভগুলির মধ্যে একটি প্রতিস্থাপন এবং আবার মিরর করা যেতে পারে। এটি ছোট এবং এতে সিস্টেম ডিবি ছাড়া অন্য কোনও ডাটাবেস ফাইল নেই। আমি এটি কয়েক মিনিটেরও বেশি সময় নিয়ে ভাবতে পারি না। যদি ডেটার অ্যারেগুলির কোনও একটি ব্যর্থ হয়, আমরা ড্রাইভটি প্রতিস্থাপন করি, অ্যারের পুনর্নির্মাণ, পুনরায় সংস্থাপক এবং এজি দিয়ে পুনরায় সংযোগ স্থাপন করুন। আমার ব্যক্তিগত অভিজ্ঞতায়, পুনরুদ্ধার একটি RAID5 ড্রাইভ পুনর্নির্মাণের চেয়ে অনেক বেশি দ্রুত হয়েছে। আমার কখনই কোনও RAID1 ব্যর্থতা হয়নি, তাই আমি জানি না যে পুনর্নির্মাণটি আরও দ্রুত হবে কিনা not পুনরুদ্ধারগুলি ব্যাকআপ থেকে আসবে এবং প্রাথমিকের সাথে মেলে এগিয়ে চলে যাবে, তাই প্রাথমিক সার্ভারে লোড বৃদ্ধি খুব ন্যূনতম হওয়া উচিত কেবলমাত্র উদ্ধার প্রতিরূপের সাথে কয়েক মিনিটের লগগুলিকে সিঙ্ক করে।


1
এই প্রশ্নে আলোচনাটি চ্যাটে সরানো হয়েছে
পল হোয়াইট 9

উত্তর:


19

আমার মনে হয় এর একটি খুব গুরুত্বপূর্ণ দিক রয়েছে যা আপনি নিজের মূল্যায়নে অনুপস্থিত:

আপনি কিভাবে পুনরুদ্ধার পরিকল্পনা করবেন?

যখন রেইড 5 ড্রাইভ হারায়, এটি স্বয়ংক্রিয়ভাবে পুনরুদ্ধার না হওয়া অবধি অবনমিত অবস্থায় চলে যাবে। (কমপক্ষে যদি আপনার হাতে গরম অতিরিক্ত থাকে তবে))

যখন কোনও রেড0 ড্রাইভ হারিয়ে ফেলেন, এটি কখনই পুনরুদ্ধার করতে পারে না। এর অর্থ হ'ল আপনি অতিরিক্ত কাজটি হারিয়ে ফেলেছেন এবং পুনরুদ্ধার করতে আপনার রেড 0 টি পুনর্নির্মাণ করতে হবে এবং সমস্ত উত্পাদন (কেবলমাত্র ভাঙা ড্রাইভের ডেটা নয়) এখন সেকেন্ডারি থেকে উত্পাদনের ভারে কপি করা উচিত । এটি হল, একক অবনমিত রাইড 5 অ্যারের পরিবর্তে, এটি এখন আপনার সম্পূর্ণ উত্পাদন সেটআপ যা পারফরম্যান্স হিট হয়।

যদি রেইড 5 (বা রেইড 6) রাষ্ট্রের পারফরম্যান্স পেনাল্টি হ্রাস করে তবে আপনি যে সাময়িক সমস্যা মোকাবেলা করতে পারেন তা না হলে আপনার পরিবর্তে সম্ভবত রেড 1 + 0 করা উচিত । হ্যাঁ, এটির ব্যয় আরও বেশি, তবে ডিস্কের দামগুলি সেগুলি হ'ল, এটি ভাল অর্থ ব্যয় হতে চলেছে।

হতে পারে "সক্রিয়ভাবে রাইড 5 স্টেটটি পর্যবেক্ষণ করুন, এবং ড্রাইভ ব্যর্থ হলে প্রাথমিকভাবে লোড স্থানান্তর করুন" এমন কোনও সমাধান যা আপনাকে কোনও ত্রুটি ছাড়াই বেশিরভাগ সুবিধা দেয়? (কোনও স্থানীয় অতিরিক্ত অতিরিক্ত ছাড়াই চলমান শীতলতা ফ্যাক্টরটি হারাতে ছাড়াও অবশ্যই your) যদি আপনার রাইড 5 ড্রাইভ পুনরুদ্ধার সম্পূর্ণ ডাটাবেস ডেটা সিঙ্কের চেয়ে অনেক বেশি সময় নেয় তবে আপনার রাইড সফ্টওয়্যারটি অদ্ভুতভাবে আচরণ করছে, বা আপনি গুরুতর আকারের ডিস্কগুলি রেখেছেন, আমি ভাবব।


16

ড্রাইভ ব্যর্থতা এখানে বিবেচনা করা উচিত।

এক সেকেন্ডের জন্য কল্পনা করুন যে কোনও নির্দিষ্ট দিনে আমাদের ড্রাইভের একটি 1/1000 ব্যর্থতার হার রয়েছে। তাহলে কল্পনা করুন যে আমাদের 3 টি অ্যারেতে 20 টি ড্রাইভ রয়েছে।

একটি অ্যারেতে একক ড্রাইভ ব্যর্থ হওয়ার সুযোগ তাই 20/1000 = 1/50। একই অ্যারেতে দুটি ড্রাইভ ব্যর্থ হওয়ার সুযোগটি 20/1000 * 20/1000 / 2 = 200/1000000 = 1/5000 এর কাছাকাছি কিছু। সুতরাং RAID 0 থেকে RAID 5 এ স্যুইচ করে আমরা ইতিমধ্যে আমাদের আরেগুলির একটি মারার সম্ভাবনা কম less

সুতরাং আমরা এটিকে আরও এগিয়ে নিতে পারি - যদি কোনও দিনে অ্যারে ব্যর্থ হওয়ার সুযোগটি 1/50 হয়, তবে দিনে দু'বার অ্যারে ব্যর্থ হওয়ার সম্ভাবনা 1 / (50 * 50) = 1/2500। দু'টি অভিন্ন RAID 0 অ্যারে ব্যর্থ হওয়ার সুযোগ একই ডিস্ক সেটটি ধরে ধরে একটি RAID 5 অ্যারে ব্যর্থ হওয়ার দ্বিগুণ। ব্যর্থতার সম্ভাবনায় এই তাত্পর্যপূর্ণ বৃদ্ধি আপনার উদ্বেগ করা উচিত, কারণ এটি একসাথে একাধিক অ্যারে ব্যর্থ হওয়ার সম্ভাবনাটি ব্যাপকভাবে বৃদ্ধি করে

যেহেতু এই ডিস্কগুলির দীর্ঘকালীন জীবনযাত্রার সম্ভাবনা রয়েছে তাই আপনি সম্ভবত উপরের মতো সংখ্যাগুলি চালনা করতে পারেন এবং এটি সরাসরি নির্ভরযোগ্যতার উপর কী প্রভাব ফেলবে তা সরাসরি দেখতে পারেন - আপনি যদি ড্রাইভের স্পেসিফিকেশন পোস্ট করতে পারেন তবে আমি এই গণনাটি এই পোস্টে যুক্ত করতে পারি। ঝুঁকি তখন গ্রহণযোগ্য কিনা তা আপনার প্রতিষ্ঠানের সিদ্ধান্ত নেওয়ার জন্য।

আরেকটি বিষয় লক্ষণীয় হ'ল একই ব্যাচের (একই কারখানা, একই সময়) মধ্যে নির্মিত এসএসডি ব্যবহার করে ড্রাইভ ব্যর্থতার সম্ভাবনা বাড়ানো যেতে পারে। আপনি যদি সাবধান না হন তবে এই সমস্যাটির কারণে আপনি সমস্ত 3 টি নোড নেমে যেতে পারেন।

দাবি অস্বীকার: উপরের গণনাগুলি সরল করা হয়েছে - তারা এখনও তুলনামূলকভাবে সঠিক।


এই উত্তরের কথোপকথনটি চ্যাটে সরানো হয়েছে
পল হোয়াইট 9

13

আমি ভাবছি যে কয়েকগুলি, যদি কোনও সত্যিকারের অসুবিধাগুলি রয়েছে সেগুলি নিয়ে RAID0 অ্যারেগুলিতে চালানোর একাধিক সুবিধা হবে।

অভ্যন্তরীণ / সরাসরি-সংযুক্ত স্টোরেজ ড্রাইভ সহ এজি চালানোর সময় এটি একটি দুর্দান্ত সাধারণ কনফিগারেশন। বিশেষত এনভিএম বা অন্যান্য পিসিআই ভিত্তিক ফ্ল্যাশ স্টোরেজ ডিভাইসগুলির সাথে।

এটি কেবল সার্ভার ব্যর্থতার মতো ড্রাইভ ব্যর্থতার চিকিত্সার পরিমাণ। অল্প সংখ্যক সলিড স্টেট ড্রাইভের সাথে আপনি সার্ভারের অন্যান্য সলিড-স্টেট উপাদানগুলির তুলনায় ড্রাইভের জন্য সত্যিই উল্লেখযোগ্যভাবে কম এমটিবিএফ রাখবেন না, এবং তাই আপনি প্রতিটি ড্রাইভকে কেবলমাত্র ব্যর্থতা হিসাবে ব্যর্থ হিসাবে গণ্য করেন ড্রাইভ ব্যর্থতার ক্ষেত্রে সার্ভার এবং সার্ভারটি প্রতিস্থাপন / পুনর্নির্মাণ করুন।


2

আপনি যা অর্জন করতে চাইছেন তাতে আমি আগ্রহী? আপনি নিজের উল্লেখ করেছেন যে আপনি এই সেটআপটি থেকে পারফরম্যান্স লাভ পাওয়ার চেষ্টা করছেন না, তাহলে আপনি কী লাভ করার চেষ্টা করছেন?

পারফরম্যান্স ইস্যুতে নোট করুন: আপনি যদি এন্টারপ্রাইজ ক্লাস এসএসডি চালাচ্ছেন তবে আপনার রেডের গণনাটি কি এটির উন্নতি করার জন্য আপনার যে আবশ্যকীয় বাধা আছে তা আসলেই কি?

আপনার 3 টি উপকার গ্রহণ করা, আমি মনে করি না আপনি যথেষ্ট পরিমাণে এটি ভেবে দেখেছেন:

  1. এসকিউএল অবিলম্বে ফেলওভার হবে? ব্যর্থতা স্বয়ংক্রিয়ভাবে ট্রিগার হতে চলেছে কি? সার্ভারটি ড্রাইভটি কেউ হিট করার সাথে সাথে অফলাইনে নিয়ে যাবে? যদি এটি কেবল একটি ডিস্কের খারাপ খাত হয়? যদি এসকিউএল খারাপ খাতে আঘাত না করে, এটি কি ব্যর্থ হবে? আমি এতে 100% নিশ্চিত নই।

  2. এটি কি প্রতি টিবি ক্ষমতাতে সামগ্রিকভাবে ব্যর্থতার সম্ভাবনা হ্রাস করে? আপনার চিন্তাভাবনাটি মনে হয় কম ডিস্কের অর্থ ব্যর্থতার কম পয়েন্ট, তবে আমি এটি সঠিক বলে মনে করি না। আপনার যদি 1 টি ডিস্ক বা 10 ডিস্ক (বা 100 টি ডিস্ক) থাকে তবে 1 ডিস্ক ব্যর্থ হওয়ার প্রতিক্রিয়া একই থাকে তবে RAID 0 এর সাথে এটিও বোঝায় যে এটি একটি বিপর্যয়কর ব্যর্থতা।

  3. RAID5 পেতে আপনার অতিরিক্ত কোনও এসএসডি কি খুব বেশি ব্যয় করতে চলেছে? আমি পেয়েছি কীভাবে RAID1 বা 1 + 0 বাজেট ফুটিয়ে তুলতে পারে তবে 1 টি অতিরিক্ত ডিস্ক?

অপ্রয়োজনীয় কোনও ছাড়াই, যদি কোনও ডিস্ক ব্যর্থ হয় এবং RAID অফলাইনে চলে যায়, আপনি যখনই RAID পুনর্নির্মাণ না করেন এবং আপনার সমস্ত ডাটাবেসগুলি স্ক্র্যাচ থেকে পুনরুদ্ধার না করা পর্যন্ত সেই নোডটি অফলাইন থাকবে। এটি করার জন্য আপনি কোন প্রক্রিয়া গ্রহণ করছেন? আপনি উপলভ্যতা গ্রুপ থেকে ডাটাবেসটি সরাতে পারবেন না কারণ এটি ডিআর-র প্রতিরূপ বন্ধ করবে, তবে আপনি যদি কিছু পদক্ষেপ না নেন তবে অন্য দুটি সার্ভার তাদের লগ ফাইলগুলি ছাঁটাতে সক্ষম হবে না। এটা কি ঠিক আছে? দীর্ঘ সপ্তাহান্তের শুক্রবার রাতে ব্যর্থ হলে কী হবে? এখনও কি ঠিক আছে? আপনার সেকেন্ডারিরা কি পরিমাণে ডেটা তৈরি করতে পারে?

আমার শেষ প্রশ্নগুলি পুনর্নির্মাণ সময়ের কাছাকাছি হবে যা আপনি উল্লেখ করেছেন দ্রুত হবে। আপনি কি 100% নিশ্চিত যে এটি আরও দ্রুত হতে চলেছে? কত তাড়াতাড়ি?

ব্রেন্ট ওজার সার্ভার সেটআপটি এখনও নতুন এসকিউএল ইনস্ট্যান্স স্থাপনের জন্য আমার যেতে গাইড। গাইডের প্রথম বিন্দুটি যাচাইযোগ্য যে আপনি কোনও ড্রাইভের জন্য RAID0 ব্যবহার করছেন না।

==== আপডেট ====

একটি অতিরিক্ত চিন্তা, যখন আপনার মাধ্যমিক সার্ভারগুলি আপনার প্রাথমিকের সাথে সিঙ্কের বাইরে চলে যায় তখন কী ঘটে? এমনকি সিঙ্ক্রোনাস প্রতিলিপি সহ, আপনার সেকেন্ডারিগুলি এখনও স্বয়ংক্রিয়ভাবে অ্যাসিঙ্কে ফিরে যেতে পারে এবং আপনি একবার অটো-ফেলওভারের ক্ষমতা হারাতে পারেন কারণ কোনও ফেইলওভারের ফলে ডেটা ক্ষতি হয়। যখন এটি ঘটতে পারে তার কয়েকটি উদাহরণ:

  1. একটি খুব বড় সূচক পুনর্নির্মাণ - অনুলিপি এক বা উভয় উভয়ই পিছনে পড়ে যেতে পারে
  2. মাধ্যমিকটি প্যাচ করার সময় RAID0 এ ডিস্ক ব্যর্থতা। প্রাথমিকের অফলাইন হওয়ার কারণে আপনি যে সার্ভারটি প্যাচ করছেন সেটি অনলাইনে ফিরে আসতে সক্ষম হবে না।

এগুলি প্রান্তের কেস, তবে সেই সময়ের মধ্যে কী কী হারিয়েছে তার উপর নির্ভর করে সিস্টেট্রোফিক হতে পারে।


আপনার # 3 তে যুক্ত করে যোগ করা, যদি অতিরিক্ত ডিস্কের (বা তিন) ব্যয়টি বাজেট তৈরি করে বা ভেঙে দেয়, তবে কোনও ডিস্ক ব্যর্থ হলে অর্থ স্থানটি কোথা থেকে আসবে?
একটি সিভিএন

@ গ্রেগ এই বিষয়টি যে আমি সমস্ত কিছু ভেবেও ভাবতে পারি নি এই কারণেই আমি এই প্রশ্নটি করছি। আমি অনুমান করি যে আমি বলব যে আমি যেখানে দেখছি সামগ্রিকভাবে দক্ষতা উন্নত করতে পারে। আপনার প্রশ্নের উত্তর দিতে: 1. হ্যাঁ। অ্যারের ব্যর্থতা তত্ক্ষণাত এজিটিকে অন্য নোডে ব্যর্থ করে তুলবে। এটি একটি পুনরুদ্ধারযোগ্য বিট ত্রুটি ছিল কিনা তার উপরে একটি খারাপ ক্ষেত্র নির্ভর করে, তবে ডিস্কটি কোনও ধরণের র‌্যাডে ছিল কিনা তা ব্যর্থতার কারণ হতে পারে। 2. কম ডিস্ক অ্যারে ব্যর্থতার সম্ভাবনা হ্রাস করবে। RAID0 অ্যারের ব্যর্থতার সম্ভাবনা বাড়িয়ে তুলবে। ৩. না, অর্থ সাশ্রয় হয় k
zsqlman

@ গ্রেগ গুড ফলোআপ প্রশ্ন এবং কিছু আমি পুরোপুরি বেরিয়ে আসেনি। সার্ভারগুলি ট্রিপল হওয়ার সাথে সাথে রিডানডেন্সির অসংখ্য স্তর রয়েছে। সমস্ত ডাটাবেস পুনরুদ্ধার করা সহজে স্ক্রিপ্ট করা যাবে। যদি কোনও নোড ব্যর্থ হয়, আমরা টগল ব্যাকলগ সমস্যাটি সরিয়ে এজি থেকে সেই প্রতিলিপিটি লাথি দেব এবং আমরা নোডটি সরিয়ে না নিলেও কিছু দিনের লগ বৃদ্ধির জন্য আমাদের প্রচুর জায়গা রয়েছে। পুনরুদ্ধারের সময় সম্পর্কে, আমার কাছে কেবলমাত্র একটি ডেটা পয়েন্ট রয়েছে এবং পরীক্ষার জন্য আরও স্পেয়ার হার্ডওয়ার নেই। আমাদের কেবল 1 রেড ব্যর্থতা ছিল এবং এটি পুনরুদ্ধার করতে 2+ দিন সময় নিয়েছে এবং আমরা 8 দিনের মধ্যে পুনরুদ্ধারগুলি করতে পারি।
zsqlman

@ জেএসকিএলম্যান - আমি যখন আপনার ডেটা হারাতে পারে তার অতিরিক্ত সময় যুক্ত করেছি কারণ আপনার কাছে রেড নেই। এছাড়াও, হ্রাস ব্যর্থতার জন্য আপনি যে যুক্তি প্রয়োগ করেছেন তা আমি এখনও ত্রুটিযুক্ত বলে মনে করি। RAID- র মধ্যে কম ডিস্কের সাথে ব্যর্থ হওয়া একটি ডিস্কের প্রতিক্রিয়া হ'ল RAID-তে রিডানড্যান্সি সহ 1 ডিস্ক ব্যর্থ। ডিস্কের সংখ্যা হ্রাস করা কোনও একটি ডিস্ক ব্যর্থ হওয়ার ঝুঁকি হ্রাস করে না - প্রতিটি ডিস্ক অন্য ডিস্কের মতোই ব্যর্থ হওয়ার সম্ভাবনা থাকে।
গ্রেগ

আপনি সঠিক যে প্রতিটি ডিস্কে ব্যর্থতার একই প্রতিক্রিয়া রয়েছে। কম ডিস্ক মানে ব্যর্থতার সম্ভাবনা কম।
zsqlman
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.