দ্বৈত সিপিইউগুলি ফল্ট সহনশীলতা সরবরাহ করে?


16

ধরা যাক যে আমি দুটি ইন্টেল জিওন কিনে সার্ভার ক্লাস হার্ডওয়্যারগুলিতে ইনস্টল করেছি ... একটি সিপিইউ যদি ব্যর্থ হয় তবে অন্যটি এখনও কাজ করবে এবং স্ল্যাকটি তুলবে, ফলে ফল্ট সহনশীলতা সরবরাহ করবে?

এটি খুব সম্ভবত বলে মনে হচ্ছে না, তবে আমি অনুমান করেছি যে আমি কোনও অনুমানের পরিবর্তে জিজ্ঞাসা করব।

উত্তর:


29

একটি সাধারণ দ্বৈত-সকেট সিস্টেমে, না, যদিও এমন সার্ভার রয়েছে যা প্রসেসর এবং র‍্যামের হট-সোয়াপিংয়ের অনুমতি দেয়। সুতরাং এসব কি অস্তিত্ব, কিন্তু তারা বাজারের খুব খুব উচ্চ শেষে করছি।

এটি সত্যই কোনও বড় বিষয় নয় - আপনার সার্ভারের যা কিছু ব্যর্থ হতে পারে, প্রসেসর তালিকার ঠিক নীচে, সেই ছোট্ট ব্রাসের রাইজারগুলির পাশে যা ম্যাসবোর্ডটিকে চেসিস বন্ধ করে দেয়।


1
দুর্বলভাবে ইনস্টল করা থার্মাল-পেস্ট পিক লোডের সময় সিপিইউর ওভারহিটিং ঘটায়। আমি নিশ্চিত যে স্বতঃস্ফূর্ত পিতল রাইজার ব্যর্থতার চেয়ে এরকম আরও অনেকগুলি ঘটনা রয়েছে।
12

8
@ অ্যাডডিংকিং আমি মনে করি আপনি এটি খুব গুরুত্বের সাথে নিয়েছেন।
পিটার

5
এমনকি গরম অদলবদলযোগ্য সিপিইউ সহ, সিস্টেম এখনও তাদের মধ্যে একটির হঠাৎ ব্যর্থতা সহ্য করবে না। মনে করুন ওএস কার্নেলটি বর্তমানে মারা যাওয়া সিপিইউতে কার্যকর করছে, এটি অন্য সিপিইউতে কেবল এক্সিকিউশনটি পুনরায় শুরু করতে পারে না। হট-অদলবদলযোগ্য সিপিইউগুলির জন্য, কার্নেলটিকে প্রথমে প্রথমে সিপিইউ বন্ধ করে দিতে হবে।
প্যাট্রিক

4
@ প্যাট্রিক: হ্যাঁ, ঠিক আছে। আপনি জানেন - ভুল;) এটি উচ্চতর সিপিইউর জন্য অনুমোদিত আচরণ - অনুমোদিত, এটি মূল ফ্রেম যেখানে সিপিইউর 5000+ মার্কিন ডলার হয়। তবুও, তারা লেনদেনের মেমরি ব্যবহার করে এবং লেনদেন অন্য সিপিইউতে পুনরায় শুরু হবে।
টমটম

5
@ টমটম: অবশ্যই, তবে আমরা সম্মানজনক ট্যান্ডেম (এবং এর আধুনিক সময়ের উত্তরসূরি) এর মতো জিনিসগুলি বলছি, ভ্যানিলা x86-64 আর্কিটেকচারের মতো নয়।
পিসকভোর

9

X86 পণ্য হার্ডওয়্যার সম্পর্কে কথা বলা, যদি কোনও সিস্টেম চলমান থাকে এবং একটি সিপিইউ ব্যর্থ হয় তবে জিনিসগুলি স্বাভাবিকভাবে থামবে। তবে সিস্টেমটি একটি রিবুটের পরে ঠিকঠাকভাবে কাজ করবে, যদিও কিছুটা ধীর গতির।

একাধিক সিপিইউ বেশিরভাগ সেখানে সমান্তরাল প্রক্রিয়াকরণ করার জন্য আছে, আসলে দোষ সহনশীলতার জন্য নয়। তবে এমন একটি সিস্টেম পাওয়া খুব সুন্দর যা এখনও বুট হয় এমন কোনও সিপিইউ (বা আরও) ব্যর্থ হয়।

আমি বলব যে মার্ক হেন্ডারসনের পরামর্শের চেয়ে আপনার সিপিইউ ব্যর্থ হওয়ার সম্ভাবনা কিছুটা বেশি, তবে এটি এখনও খুব কমই অসম্ভব। আমার অভিজ্ঞতায় বেশিরভাগ ক্ষেত্রেই ঘটে যখন সিস্টেমটি ঘন ঘন গরম করে এবং নিজেকে নিচে নামায় (এটি একটি খারাপ শীতাতপনিয়ন্ত্রিত অফিস সার্ভার রুমে বেশ সহজ)। সিপিইউগুলি এগুলি পছন্দ করে না।

অবশ্যই আপনার যদি একটি দুর্দান্ত আইবিএম মেইনফ্রেম বা অনুরূপ থাকে তবে একটি সিপিইউ (বোর্ড) গরম করা যথেষ্ট "সহজ"।


হুঁ, তবে হার্ড রিবুটের ক্ষেত্রেও: আইআইআরসি যদি সিপিইউ # 0 ব্যর্থ হয় তবে আপনি এখনও স্ক্রুড নন - কোনও পোষ্ট নেই, যার অর্থ আর কোনও বুট নেই, কারণ প্রথম প্রথম সিপিইউ প্রথম প্রারম্ভিক প্রক্রিয়াটির জন্য ব্যবহৃত হয়।
পিসকভোর

আমি জানি না যদি সে ঘটনাটি ঘটে থাকে। আমার এটি সার্ভারে পরীক্ষা করা উচিত। আমি ভেবেছিলাম এটি কোনও ব্যাপার না এবং যতক্ষণ না 1 সিপিইউ রয়েছে ততক্ষণ সিস্টেম ভাল করে বুট করবে।
আসিক

5

যদি কোনও সিপিইউ ব্যর্থ হয় - যা অন্য উত্তরগুলির তুলনায় অত্যন্ত অসম্ভাব্য - মূলত সিস্টেমটি পুনরুদ্ধার করতে পারে না এমন কিছুই নেই। যেভাবে এটি ব্যর্থ হয় তার উপর নির্ভর করে এটি অদ্ভুত উপায়ে স্মৃতিটিকে কলুষিত করতে বা প্রক্রিয়া টেবিলটি ধ্বংস করতে পারে বা কে কী জানে। আপনার যদি এমন কিছু সক্রিয় পর্যবেক্ষণ ব্যবস্থা থাকে যা সিপিইউতে এটি ভালভাবে কাজ করছে কিনা তা নিশ্চিত করার জন্য ট্যাবগুলি রাখে (এবং এটি বলতে সক্ষম হয়ে, সিপিইউর মৃত্যুর সময় যে কোনও পরিবর্তন ফিরিয়ে আনতে সক্ষম হয়), এটিও অন্য একটি সিস্টেম হতে পারে এটি ব্যর্থ হতে পারে এবং সফ্টওয়্যার ব্যর্থতা প্রোগ্রামগতভাবে নির্ধারণ করা বেশ ডাং কঠিন (মূলত আপনি কেবল একই পদ্ধতিতে এটি করতে পারেন কেবল একই সময়ে অন্য একই সিপিইউ হুবহু একই জিনিস করে ফলাফলের সাথে তুলনা করা - যা ধীরে ধীরে ধীরে ধীরে শেষ হয়ে যাবে নিচে যে সেখানে '

এটি বলেছে যে, সিপিইউ ব্যর্থতা যতই বিরল, কোনও সিস্টেমে সিপিইউ গণনা বাড়ানো আসলে আপনার ব্যর্থতার হারকে আরও বাড়িয়ে তুলবে, কারণ এখন আপনার কাছে দ্বিগুণ ব্যর্থতা থাকতে পারে। আপনার পাশাপাশি অন্যান্য সাবসিস্টেমগুলিও ব্যর্থ হতে পারে যেমন সিপিইউগুলির ক্যাচগুলি সিঙ্ক্রোনাইজ করে রাখে এবং বিদ্যুৎ খরচ এবং তাপ আউটপুট বৃদ্ধি সামগ্রিকভাবে সিস্টেম ব্যর্থতার পিছনে কারণগুলিতে অবদান রাখে (এবং অবশ্যই, সক্রিয় শীতল অনুরাগীরা অন্য একটি ব্যর্থতার বিন্দু)।


1
+1 চিহ্নিত করার জন্য যে সিপিইউ দ্বিগুণ করা মেশিনের ব্যর্থতার সম্ভাবনা বৃদ্ধি করে। আরও "চলমান অংশ" এর অর্থ ব্যর্থতা হওয়ার বেশি সুযোগ।
ইভান অ্যান্ডারসন

4

আপনি ঠিক কী ধরণের ব্যর্থতাগুলি পরিচালনা করতে চান তা আপনাকে নির্ধারণ করতে হবে। যদি আমরা নেটওয়ার্ক / সিপিইউ / কম্পিউটারগুলির সংগ্রহকে নেটওয়ার্ক হিসাবে একসাথে কাজ করে দেখি তবে এক ধরণের ব্যর্থতা হ'ল নোড কেবল উত্তর দেওয়া বন্ধ করে দেয়। আরও গুরুতর ব্যর্থতা হ'ল যখন কোনও নোড ডেটা দূষিত করতে শুরু করে এবং অন্যকে ত্রুটিযুক্ত তথ্য প্রেরণ করে। এটিকে বাইজেন্টাইন ব্যর্থতা বলা হয় এবং সবচেয়ে খারাপ ক্ষেত্রে এটি কৌশলগত "মিথ্যা" মাধ্যমে নেটওয়ার্কের কার্যক্রমকে সক্রিয়ভাবে ব্যাহত করছে। এটি তুলনামূলকভাবে সহজ করে দেখাতে যে কোনও সিস্টেমই তার তৃতীয় বা তার বেশি নোড বাইজেন্টাইন যেতে পারে না।

আপনার যা করা দরকার তা হ'ল আপনি কী ধরণের ব্যর্থতা আশা করছেন তা ঠিক করে নেওয়া এবং এটি বিবেচনা করে আপনার সিস্টেমটি ডিজাইন করুন এবং এক্ষেত্রে দূষিত নোডগুলির একটি স্বেচ্ছাসেবী সংখ্যার পরিচালনা করার সমস্যাটি অবিশ্বাস্য fact আপনার ক্ষেত্রে, আপনার মধ্যে কমপক্ষে চারটি সিপিইউ প্রয়োজন যদি তাদের মধ্যে একটি ত্রুটিযুক্ত থাকে।

একদিকে নোট: কোয়ান্টাম পদার্থবিজ্ঞানে কোনও অসম্ভাব্যতা নেই, তবে মহাবিশ্বের বয়সের তুলনায় যদি আরও কিছুক্ষণ অপেক্ষা করতে হয় তবে একটি নির্দিষ্ট আচরণ পর্যবেক্ষণের সুযোগ পাওয়া যায়, আমাদের এটি বলার দরকার নেই যে এটি সম্ভব। আপনি যখন আপনার সিস্টেমটি ডিজাইন করেন তখন এটি মনে রাখবেন। ;)


2

সিপিইউ ব্যর্থতা সম্ভবত বিরল। ব্যর্থতার ফলে ওএস স্তরে সম্ভবত অন্যান্য সমস্যা দেখা দেবে। আমি এটিকে কোনও ধরণের দোষ-সহনশীলতা হিসাবে ভাবি না।


1

অন্য উত্তরগুলির মতো, খুব কম দেখা যায় যে একটি সিপিইউ ব্যর্থ হয়, এবং গড় সার্ভারগুলিতে আপনি হট অদলবদল করতে পারবেন না, আপনি যা করতে পারেন ব্যর্থটিকে প্রতিস্থাপন না করা পর্যন্ত একটি সিপিইউ দিয়ে সার্ভারটি রেখে দেওয়া হবে, অবশ্যই এটি পদ্ধতি সম্পূর্ণ অফলাইন এবং আপনার সার্ভারের একটি স্টপ করা দরকার


1
আচ্ছা আমি এটিকে সুপার বিরল বলব না। সবেমাত্র আমার একটি সার্ভারে ঘটেছে। বর্তমানে এটির সমস্যা সমাধানের প্রক্রিয়া চলছে। ফ্যান ব্যর্থতার কারণে ডুয়াল সিপিইউ সার্ভারটি কেবলমাত্র সিপিইউর একটি হারিয়েছে।
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.