হট স্পেয়ার হোস্ট বনাম কোল্ড স্পেয়ার হোস্ট?


8

আমাদের বেশ কয়েকটি হোস্ট রয়েছে যেখানে আমাদের অভিন্ন স্পেয়ার হোস্ট রয়েছে, যা প্যাচড এবং আপডেট করা হয়েছে সুতরাং এটি একই সফ্টওয়্যার এবং কনফিগার করার খুব কাছাকাছি is ব্যর্থতার ক্ষেত্রে নেটওয়ার্কের কেবলটি স্যুইচ করা হয় এবং ডিএইচসিপি সার্ভারটি নতুন ম্যাক ঠিকানার সাথে আপডেট হয়। এটি সর্বোত্তম ক্ষেত্রে, কারণ এখানে আরও কিছুটা প্রয়োজন যা পরিবর্তনের প্রয়োজন হয়।

আমি মনে করি যে এটি অতিরিক্ত রাখার জন্য গরম অতিরিক্ত হোস্ট এবং বিদ্যুতের অপচয় হ'ল এবং যেহেতু ব্যর্থতার ক্ষেত্রে কনফিগার সংশোধন করা দরকার, আমি নিম্নলিখিতগুলি জিজ্ঞাসা করতে চাই:

গরম খুচরা হোস্ট কি পুরানো স্কুল এবং এখন আরও ভাল উপায় আছে?

গরম বাতলে রাখা হোস্টের পরিবর্তে, এটি কী ঠান্ডা বাজানো, হার্ড ড্রাইভগুলি নেবে এবং প্রাথমিক হোস্টে রাখবে এবং রেডকে 1 থেকে 1 + 1 এ পরিবর্তন করতে হবে? ব্যর্থতার ক্ষেত্রে আমাকে যা করতে হবে তা হ'ল নেটওয়ার্ক কেবলগুলি পরিবর্তন করা, ডিএইচসিপি সার্ভার আপডেট করুন, হার্ড ড্রাইভগুলি নিয়ে যান এবং এগুলি ঠান্ডা অতিরিক্ত রেখে powerোকাতে হবে power সুবিধাটি যেমনটি আমি দেখছি তা হ'ল 2x2 ডিস্কগুলি সর্বদা সিঙ্ক থাকে, সুতরাং শুধুমাত্র একটি হোস্ট বজায় রাখার জন্য এবং ব্যর্থ হলে কোনও কনফিগার পরিবর্তন প্রয়োজন হয় না।

এটা কি ভাল ধারণা?


1
এই প্রকৃত "হোস্টগুলি" প্রকৃত পরিষেবাগুলির সাথে বা ভিএম হোস্টগুলি অতিথিদের সাথে রয়েছে?
নাথান সি

2
ভিএমওয়্যার এফটি এবং হাইপার-ভি রেপ্লিকাটি ভার্চুয়ালাইজেশন বিকল্প হিসাবে উপলব্ধ (পাশাপাশি সরল পুরাতন এইচএ) আমি একক উদ্দেশ্য হোস্টের জন্য কিছুটা পদক্ষেপের বাইরে যাওয়ার জন্য একটি উত্সর্গীকৃত গরম খুচরা থাকার ধারণাটি পাই।
joeqwerty

উত্তর:


6

সোব্রিক ব্যাখ্যা করে যে কীভাবে ম্যানুয়াল হস্তক্ষেপ আপনার প্রস্তাবিত সমাধানটিকে সর্বোত্তম হতে পারে এবং বিভিন্ন উপাদানগুলির ব্যর্থতার সম্ভাবনা সম্পর্কে ew white আলোচনা করে । এই আইএমও উভয়ই খুব ভাল পয়েন্ট দেয় এবং দৃ strongly়ভাবে বিবেচনা করা উচিত।

তবে একটি বিষয় রয়েছে যে এ পর্যন্ত কেউ মন্তব্য করেনি বলে মনে হয়, যা আমাকে খানিকটা অবাক করে দেয়। আপনি প্রস্তাব:

[বর্তমান হট স্পিয়ার হোস্টকে] একটি ঠান্ডা অতিরিক্ত তৈরি করুন, হার্ড ড্রাইভগুলি নিয়ে যান এবং প্রাথমিক হোস্টে রাখুন এবং রেডকে 1 থেকে 1 + 1 এ পরিবর্তন করুন।

এটি ওএস ডিস্কের যে কোনও কিছুই থেকে সুরক্ষা দেয় না।

এটি কেবলমাত্র ডিস্ক ব্যর্থতার বিরুদ্ধে আপনাকে সুরক্ষা দেয়, যা আয়না (RAID 1) থেকে আয়না (RAID 1 + 1) এ গিয়ে আপনি শুরু করার প্রভাবকে খুব হ্রাস করেন। আপনি প্রতিটি আয়না সেটে ডিস্কের সংখ্যা বাড়িয়ে একই ফলাফল পেতে পারেন (উদাহরণস্বরূপ, 2-ডিস্ক RAID 1 থেকে 4-ডিস্ক RAID 1 তে যান) পাশাপাশি সাধারণ অপারেশনগুলির সময় পঠন পারফরম্যান্সের উন্নতি করার সম্ভাবনা রয়েছে।

ঠিক আছে, তাহলে আসুন কিছু উপায় এটি ব্যর্থ হতে পারে

  • ধরা যাক আপনি সিস্টেম আপডেট ইনস্টল করছেন এবং কোনও কিছু প্রক্রিয়াটিকে অর্ধ-পথে ব্যর্থ করে দেয়; সম্ভবত একটি শক্তি এবং ইউপিএস ব্যর্থতা রয়েছে , অথবা হতে পারে আপনার একটি অদ্ভুত দুর্ঘটনা ঘটেছে এবং একটি পঙ্গু কার্নেল বাগটি আঘাত করেছে (লিনাক্স আজকাল বেশ নির্ভরযোগ্য, তবে এখনও ঝুঁকি রয়েছে)।
  • হতে পারে কোনও আপডেট এমন একটি সমস্যার পরিচয় দেয় যা আপনি পরীক্ষার সময় ধরেন নি (আপনি পরীক্ষা সিস্টেমের আপডেটগুলি করেন, তাই না?) আপনি প্রাথমিকটি ঠিক করার সময় মাধ্যমিক সিস্টেমে ব্যর্থতা প্রয়োজন requ
  • ফাইল সিস্টেমের কোডে কোনও বাগের কারণে উদ্দীপনাজনিত, ডিস্কে অবৈধ লেখার কারণ হয়ে থাকে।
  • হয়তো একটি চর্বি-ওস্তাদ (অথবা এমনকি দূষিত) টি প্রশাসকের করে rm -rf ../*বা rm -rf /*পরিবর্তে rm -rf ./*
  • হতে পারে আপনার নিজের সফ্টওয়্যারের কোনও বাগ এর ফলে ডাটাবেসের সামগ্রীগুলিকে ব্যাপকভাবে দূষিত করে।
  • হতে পারে কোনও ভাইরাস লুকিয়ে থাকতে পারে।

হতে পারে, সম্ভবত, সম্ভবত ... (এবং আমি নিশ্চিত যে আপনার প্রস্তাবিত পদ্ধতির ব্যর্থ হতে পারে এমন আরও অনেক উপায় রয়েছে)) তবে শেষ পর্যন্ত এটি আপনার "দুটি সেট সবসময় সিঙ্কে থাকে" "সুবিধার" হয়ে যায়। কখনও কখনও আপনি চান না যে এগুলি পুরোপুরি সিঙ্কে রয়েছে।

ঠিক কী ঘটেছে তার উপর নির্ভর করে, আপনি যখন কোনও গরম বা ঠান্ডা স্ট্যান্ডবাই চালু রাখতে চান এবং সঠিক ব্যাকআপ নিতে চান। যে কোনও উপায়ে, হার্ডওয়্যার স্টোরেজ ডিভাইস ব্যর্থতা (ডিস্ক ক্র্যাশ) বাদ দিয়ে ব্যর্থতা মোডে অনেক কিছু জড়িত থাকলে মিররগুলির RAID মিরর (বা RAID মিরর) আপনাকে সাহায্য করবে না। জেডএফএসের 'রেইডজএন' এর মতো কিছু সম্ভবত কিছু দিক থেকে কিছুটা ভাল করতে পারে তবে অন্যের ক্ষেত্রে মোটেই ভাল নয়।

আমার কাছে, যদি উদ্দেশ্যটি কোনও ধরণের বিপর্যয় ফেইলওভার হয় তবে এটি আপনার প্রস্তাবিত পদ্ধতির শুরু থেকেই কোনও অগ্রগতি করবে।


ব্যাকআপ এবং কনফিগারেশন পরিচালনার জন্য এটি কি, না?
ew

@Wwite একেবারে, তবে একটি রেড মিরর ভাঙার চেয়ে ডিস্ককে শারীরিকভাবে সরিয়ে নেওয়া, যে কোনও তৈরি করতে, ইতিমধ্যে একটি (সম্ভবত সম্ভাব্য ভাল) কনফিগারেশন (সফ্টওয়্যার এবং সেটিংস) রয়েছে এমন একটি সেকেন্ডারি হোস্টে স্যুইচ করার প্রয়োজন হলে এটি অনেক সহজ হওয়া উচিত any প্রয়োজনীয় কনফিগারেশন পরিবর্তন (নেটওয়ার্ক ক্যাবলিং, ডিএনএস, আইপি সেটিংস, ...), এবং তারপরে আপনার স্ট্যান্ডবাই হোস্ট এমনকি কোনও ভাল করার আগে আপনাকে প্রথমে স্যুইচআপ করার জন্য যা যা ভুল হয়েছে তা ঠিক করতে হবে। এই মুহুর্তে আপনি ঠিক ঠিক পাশাপাশি এটি ঠিক করতে পারেন। (বা বিশেষত যদি আপনি ভিএম চালানোর অবস্থাতে থাকেন তবে কোনও প্রাসঙ্গিক স্ন্যাপশটে ফিরে যান))
সিভিএন

ওহ, অবশ্যই। যদি আমার প্রতিলিপি সমাধান আছে, উপরের পরিস্থিতিগুলি আবরণে একটি আরপিও / আরটিও বিবেচনা এবং অফসেট (10-15 মিনিট) রয়েছে।
ew

@Wwite আমি আপনার বক্তব্যটি বিতর্ক করছি না (এবং আসলে আপনার উত্তরটিকে সমর্থন করেছিলাম), কেবলমাত্র অন্য একটি উপায় যুক্ত করে আমি দেখলাম কেউই কীভাবে উল্লেখ করেনি যে ওপির প্রস্তাবিত সমাধান কীভাবে সর্বাধিক পছন্দসই ফলাফল আনতে ব্যর্থ হতে পারে (যা ব্যর্থতা পুনরুদ্ধার। আমার উত্তর গৃহীত পেয়ে সত্যিই অবাক হয়েছিল।
একটি সিভিএন

5
সান্দ্রা রহস্যজনক উপায়ে কাজ করে ...
ew

11

হ্যাঁ, এটি কিছুটা পুরানো স্কুল। আধুনিক হার্ডওয়্যার যে প্রায়শই ব্যর্থ হয় না । আপনার অ্যাপ্লিকেশনগুলিকে আরও উচ্চ-উপলভ্য (সর্বদা সম্ভব নয়) তৈরি করার দিকে মনোনিবেশ করুন বা আপনার পৃথক হোস্টকে আরও স্থিতিশীল করতে প্রয়োজনীয় আইটেমগুলিতে মনোনিবেশ করুন ...

হোস্টদের জন্য:

  • আরও ভাল হার্ডওয়্যার কিনুন।
  • আপনার সমর্থন চুক্তি রয়েছে তা নিশ্চিত করুন।
  • REGISTER আপনার সার্ভারে 'সমর্থন চুক্তি (খুচরা যন্ত্রাংশ নিবন্ধন ডেটার উপর ভিত্তি করে স্থানীয়ভাবে মজুদ করা হয়!)
  • রিডানড্যান্ট পাওয়ার সাপ্লাই, (হার্ডওয়্যার?) RAID, রিডানড্যান্ট ফ্যান ব্যবহার করুন।
  • সার্ভার যদি উপরের অপ্রয়োজনীয় বৈশিষ্ট্যগুলিকে সামঞ্জস্য করতে সক্ষম না হয়, ব্যর্থতার ক্ষেত্রে স্ব-মেরামত করতে সক্ষম হতে একটি অতিরিক্ত চেসিস বা উপাদানগুলি হাতে রাখুন।

ব্যর্থতার ফ্রিকোয়েন্সি হ্রাস করার জন্য, আমি দেখতে পাচ্ছি: ডিস্ক, র‌্যাম, বিদ্যুত সরবরাহ, ফ্যানগুলি প্রায়শই ... কখনও কখনও সিস্টেম বোর্ড বা সিপিইউ। তবে শেষ দুটি যেখানে আপনার সমর্থন চুক্তিটি শুরু করা উচিত।


চলন্ত অংশগুলি প্রথমে মারা যায় - ধন্যবাদ র‌্যাড ডিস্ক, রেড, অন্যথায় তারা আমার ঘন ঘন ব্যর্থতা হতে পারে।
সোব্রিক

2
কেবলমাত্র "আপনার সার্ভারগুলির সমর্থন চুক্তিগুলি নিবন্ধন করুন" এর জন্য +1। এমনকি আমার সীমাবদ্ধ অভিজ্ঞতায় এটি আপনার পক্ষে মনে হয় তার চেয়েও সাধারণ যে আমি কোনও নতুন সাইটে SHTF পরিস্থিতির সময় সমর্থনকে কল করি এবং সমর্থনটির কোনও ধারণা নেই যে নির্দিষ্ট হার্ডওয়্যারটির উপস্থিতি রয়েছে এবং এর সাথে একটি চুক্তি সংযুক্ত রয়েছে।

প্রশ্নে থাকা সার্ভারগুলি সমস্ত আইবিএম, এবং এখন সম্ভবত 5 বছর বয়সী। এখনও অবধি আমাদের কেবল একটি মেইনবোর্ড এবং একটি সিপিইউ ব্যর্থ হয়েছে।
জুঁই লগনেস

1
আইবিএম এবং এইচপি শক্ত। ডেল কখনও কখনও। Supermicro তবে আমি পালন বলতে চাই দুই সার্ভার প্রতি স্পেয়ার্স;)
ewwhite

1
আমার এইচপি সার্ভারে, প্রাথমিক ইসিসি প্রান্তিকতা ছাড়িয়ে গেছে এবং একটি সতর্কতা ট্রিগার করে । অ্যাপ্লিকেশনগুলিতে কোনও প্রভাব পড়ার আগে সাধারণত র‌্যামটি প্রতিস্থাপন করা হয়। আমি এটি কয়েকশত সার্ভার জুড়ে বছরে প্রায় 10 বার দেখছি।
ew

9

এটি বরং অদক্ষ - স্যুইচটি তৈরি করতে ম্যানুয়াল হস্তক্ষেপের উপর নির্ভরতার কারণে নয়।

আক্ষরিক অর্থে, প্রাথমিকগুলিতে অভিন্ন সার্ভার, তাত্ক্ষণিকভাবে প্রস্তুত ready এমন জায়গায় আমি কাজ করেছি hot তবে ডিআর সুইচওভার একটি স্বয়ংক্রিয় প্রক্রিয়া - আমরা ক্যাবলিং, কিছুটা ফিডিং এবং একটি স্যুইচ কথা বলছি না, তবে বোতামটি টিপলে এমন একটি প্রক্রিয়া একটি সাইট থেকে অন্য সাইটে সমস্ত কিছু ফ্লিপ করে।

এই পদ্ধতিটি অসুস্থতার জন্য ব্যয়বহুল, তবে এটি একটি ব্যবসায়িক সিদ্ধান্ত - গ্রহণযোগ্য ঝুঁকি বনাম লক্ষ্য সরবরাহের জন্য প্রয়োজনীয় অর্থ। একটি নিয়ম হিসাবে, পুনরুদ্ধার সময়ের উদ্দেশ্য সম্পর্কে একটি সূচকীয় বক্ররেখা রয়েছে - এটি যতটা শূন্যের কাছাকাছি আসে, তত বেশি ব্যয় হয়।

তবে আপনার প্রশ্নটি আসলে এটিই। কি হল আপনার পুনরুদ্ধারের সময় উদ্দেশ্য, এবং কি এটা অর্জন সবচেয়ে কার্যকর উপায়। বুট হওয়ার জন্য সার্ভারের জন্য অপেক্ষা করতে কয়েক মিনিট সময় লাগবে। যখন সকাল 4 টায় পপ হয়ে যায় তখন কাউকে অ্যাডজাস্টমেন্ট এবং 'পুনরুদ্ধার কাজগুলি' করতে কতক্ষণ সময় লাগে?

এবং কতক্ষণ গ্রহণযোগ্য আউটেজ?

আমি পরামর্শ দেব যে আপনি যদি 'হট রিকভারি' করছেন তবে আপনি ক্লাস্টারিং করতে চান think আপনি ভিএমওয়্যারের ভাল ব্যবহারের সাথে ক্লাস্টারিংয়ে মোটামুটি সস্তা হতে পারেন - কোনও ভিএম থেকে 'ব্যর্থ' - এমনকি কোনও শারীরিক থেকেও - এর অর্থ আপনি অনর্থক হার্ডওয়্যার চালাচ্ছেন না। (আচ্ছা, 2 এন এর পরিবর্তে এন + 1)

যদি আপনার আরটিও যথেষ্ট দীর্ঘ হয় তবে বক্সটি স্যুইচ করুন। আপনি দেখতে পাবেন যে আরটিও যথেষ্ট যে ব্যাকআপ থেকে একটি শীতল পুনর্নির্মাণ ঠিক আছে।


2
কেবল পুনরুদ্ধারের সময় বক্ররেখার জন্য +1; আমি সর্বদা ক্লায়েন্টদের বলি যে তারা কিট এবং সেটআপ ব্যয়ের জন্য 99% আপটাইম পান, তবে প্রতিটি অতিরিক্ত 9 জন তাদের সিদ্ধান্ত নেয় যে তাদের প্রয়োজন ব্যয় কোথাও দু' থেকে দশগুণ বাড়িয়ে দেবে।
ম্যাডহ্যাটার

রাতের বেলা ডাউনটাইম ভাল না, তবে সিইওকে কিনে নিলেন। কাজের সময়কালে, প্রতি 6 মাসে 30 মিনিট সম্ভবত ঠিক থাকে। কোনও ভিএম-তে ব্যর্থ হওয়া একটি আকর্ষণীয় ধারণা। এটি কেভিএম দিয়ে করা যায়? প্যাচ এবং কনফিগার পরিবর্তনগুলির সাথে আমার কী এখনও ভিএম বজায় রাখা দরকার, বা সেগুলি স্বয়ংক্রিয়ভাবে করা যায়?
জুঁই লগনেস

ভিএম ভার্চুয়াল মেশিন, কেভিএমের সাথে কিছুই করার থাকে না। (কিবোর্ড / ভিডিও / মাউস)। এবং হ্যাঁ, আপনাকে ওএস উদাহরণটি আপ টু ডেট রাখতে হবে এবং এগুলি সমস্ত স্বাভাবিকভাবে কাজ করে তা চেক করে। তবে আপনি প্রাথমিক ডিভাইসে যেমন করেন তেমন আপডেট আপডেট পদ্ধতিটি ব্যবহার করতে সক্ষম হওয়া উচিত।
সোবারিক

যদিও গুরুত্ব সহকারে - আপনার সার্ভারটি প্রায়শই পড়েছে? আমি সম্পূর্ণ বলতে চাইছি, হার্ডওয়্যার সম্পর্কিত কারণে? বেশিরভাগ 'সার্ভার গ্রেড' হার্ডওয়ারের টুকরা N + 1 স্থিতিস্থাপকতা চালায়।
সোবারিক

3
এ প্রসঙ্গে kvm এ @sobrique সম্ভবত কার্নেল ঘোরা ভিত্তিক ভার্চুয়াল মেশিন - linux-kvm.org
গ্রান্ট

5

এটি যে পুরানো স্কুল এটি অগত্যা কোনও গরম অতিরিক্ত ব্যবহারকে খারাপ ধারণা দেয় না।

আপনার প্রধান উদ্বেগ যুক্তিযুক্ত হওয়া উচিত, আপনি যে ঝুঁকিগুলি চালান সেগুলি কী কী এবং কীভাবে একটি অতিরিক্ত খুচরা চালানো এগুলি প্রশমিত করে। কারণ আমার ধারণা অনুসারে আপনার গরম অতিরিক্ত কেবল হার্ডওয়্যার ব্যর্থতা সম্বোধন করে, এটি যদিও অস্বাভাবিক নয়, কেবলমাত্র আপনি চালিত একমাত্র ঝুঁকিপূর্ণ ঝুঁকি বা সম্ভবত সবচেয়ে বেশি সম্ভাবনা নেই। দ্বিতীয় উদ্বেগ হ'ল বিকল্প কৌশলগুলি আরও ঝুঁকি হ্রাস বা উল্লেখযোগ্য সঞ্চয় সরবরাহ করে।

একাধিক ম্যানুয়াল ব্যর্থতা ওভার পদক্ষেপের সাথে একটি গরম খুচরা দৌড়াতে বেশি সময় লাগবে এবং ভুল হওয়ার সম্ভাবনা রয়েছে, তবে আমি এইচএ ক্লাস্টার স্যুটগুলি বড় ক্লাস্টার এফ * সিএসকে রূপান্তরিত করে স্বয়ংক্রিয় ফেইলওভারও বোধ করি।

আরেকটি বিষয় হ'ল একই স্থানে গরম বা ঠান্ডা স্ট্যান্ডবাই স্থানীয় বিপর্যয়ের ক্ষেত্রে ব্যবসায়ের ধারাবাহিকতা সরবরাহ করে না।


2

গরম বা এমনকি শীতল অতিরিক্ত থাকার ধারণাটি অ্যাপ্লিকেশন (গুলি) প্রথম স্থানে কীভাবে তৈরি হয় তা নির্ভরশীল ।

আমার অর্থ হ'ল যদি অ্যাপ্লিকেশনটি এমনভাবে তৈরি করা হয়েছে যাতে ডেটা এবং পরিষেবা লোড একাধিক মেশিনে ছড়িয়ে পড়ে থাকে তবে কোনও একক মেশিনের সিস্টেমটি নিচে নেওয়ার ধারণাটি চলে যেতে হবে। এই পরিস্থিতিতে আপনার একটি অতিরিক্ত অতিরিক্ত দরকার নেই। পরিবর্তে যখন কোনও পৃথক মেশিন / উপাদান মারা যায় তখন আপনাকে হ্যান্ডেল করার জন্য পর্যাপ্ত অতিরিক্ত ক্ষমতা প্রয়োজন।

উদাহরণস্বরূপ, একটি স্ট্যান্ডার্ড ওয়েব অ্যাপ্লিকেশনটির জন্য সাধারণত একটি ওয়েব সার্ভার এবং একটি ডাটাবেস সার্ভার প্রয়োজন। ওয়েব সার্ভারের জন্য, কেবল 2 বা ততোধিক ভারসাম্য লোড করুন। যদি কেউ মারা যায় তবে বড় কথা নয়। অংশগ্রহণকারী মেশিনগুলিতে সমস্ত ডেটা সিঙ্ক করে'র সাথে মাল্টি-মাস্টার হতে আর্কিটেক্ট করাতে হওয়ায় ডেটাবেসটি সাধারণত আরও কঠিন। সুতরাং একটি একক ডিবি সার্ভারের পরিবর্তে আপনি 2 (বা আরও বেশি) দিয়ে শেষ করেন যা উভয়ই আপনার ডেটা প্রয়োজনীয়তার জন্য পরিবেশন করছে। গুগল, অ্যামাজন, ফেসবুক ইত্যাদির মতো বৃহত পরিষেবা প্রদানকারীরা এই পথে চলে গেছে। বিকাশের সময় আরও সুস্পষ্ট ব্যয় হয়, তবে আপনার যদি স্কেল বাড়ানোর প্রয়োজন হয় তবে এটি লভ্যাংশ প্রদান করে।

এখন, যদি আপনার অ্যাপ্লিকেশনটি এমনভাবে কাঠামোগত না হয় বা অ্যাপ্লিকেশনটিকে retro ফিট করা সহজভাবে নিষেধ করে তবে হ্যাঁ আপনি সম্ভবত একটি অতিরিক্ত অতিরিক্ত চাইবেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.