প্রসেসর বিতরণ করা কম্পিউটিংয়ে ব্যর্থতা যা ক্র্যাশ বা বাইজেন্টাইন নয়


13

বিতরণ করা কম্পিউটিং মডেলগুলিতে দুটি প্রধান ধরণের প্রসেসর ব্যর্থতা রয়েছে:

(1) ক্র্যাশ ব্যর্থতা: একটি প্রসেসর বন্ধ হয়ে যায় এবং আর কখনও শুরু হয় না। (২) বাইজেন্টাইন ব্যর্থতা: প্রসেসরগুলি বিদ্বেষমূলক, দূষিত আচরণ করে।

আমার প্রশ্নটি হ'ল:

অধ্যয়ন করা হয়েছে এমন আরও কিছু প্রসেসর ব্যর্থতা কী কী ক্র্যাশ বা বাইজেন্টাইন ব্যর্থতা হ্রাস করে না?

এছাড়াও, আরও নির্দিষ্ট প্রশ্ন:

একটি মডেল গবেষণা করা হয়েছে যেখানে, কিছু সম্ভাবনা সঙ্গে, একটি প্রক্রিয়া সময় পদে পদে হয় , এবং অন্যথায় বন্ধ? সুতরাং প্রতিটি প্রক্রিয়া যেমন ছিল ঠিক তেমনই বন্ধ হয়ে যাচ্ছে।t

আমি এই ব্যর্থতাগুলি কীভাবে sensকমত্য এবং অন্যান্য বিতরণ চুক্তির সমস্যার সাথে সম্পর্কিত তা সম্পর্কে আমি আগ্রহী।

ধন্যবাদ.


@ অ্যারন: বেশ কয়েক বছর আগে আমার "বিতরণ ব্যবস্থা" এবং "ফল্ট-সহনশীল সিস্টেম" এর উপর একটি অন্য একটি কোর্স ছিল, তবে আমি আসলে এই বিষয়গুলিতে আছি না। তবুও আমি মনে করি কীওয়ার্ড ডায়নামিক ফল্ট মডেল আপনাকে সহায়তা করতে পারে।
এমএস দৌস্তি

1
আমার ধারণা, আত্ম-স্থিতিশীলতার ক্ষেত্রে ব্যর্থতার মডেলটি ক্র্যাশ ব্যর্থতা বা বাইজেন্টাইন ব্যর্থতা হ্রাস করে না। বাইজেন্টাইন ব্যর্থতার সাথে এটি সম্পর্কিত একটি উপায়: আপনি সাময়িকভাবে বাইজেন্টাইন আচরণ করতে পারেন , তবে এবং যদি এইরকম আচরণ বন্ধ হয়ে যায় তবে একটি স্ব-স্থিতিশীল সিস্টেমকে একটি সঠিক অবস্থায় পৌঁছাতে হবে।
Jukka Suomela

1
আপনার আরও সুনির্দিষ্ট প্রশ্ন সম্পর্কে: যদি কোনও প্রসেসরের সম্ভাব্যতা সহ "চালু" থাকে তবে এটি আমার কাছে অনেকটা একটি অ্যাসিনক্রোনাস মডেলের মতো মনে হয় যেখানে প্রসেসরগুলি সর্বদা চালু থাকে তবে বার্তাগুলি বলে, তাদের গন্তব্যে পৌঁছানোর প্রত্যাশায় বলে। আপনি সম্ভবত এটি পরিষ্কার করতে পারেন যে আপনি যে মডেলটি মনে রেখেছিলেন তার থেকে এটি কীভাবে আলাদা? p1/p
Jukka Suomela

1
@ অ্যারন: আমি জানি না যে এই ধরণের মডেলগুলি কতটা অধ্যয়ন করেছে। তবে আমি অনুমান করি চলমান সময় সহ আপনার যদি কোনও ডিস্ট্রিমেন্টিক সিঙ্ক্রোনাস অ্যালগরিদম , আপনি কেবল অ্যাসিঙ্ক্রোনাস মডেলটিতে অনুকরণ করতে সিনক্রোনাইজার ব্যবহার করতে পারেন , এবং আমার ধারণা প্রত্যাশিত চলমান সময়টি মতো কিছু হবে । ( -synchroniser কেবল গ্যারান্টী বা নিশ্চয়তা আপনার প্রতিবেশীদের কখনও বেশী বেশী 1 বার ধাপ এগিয়ে বা সিমুলেশন আপনি পিছনে ।)ATαAT/pαA
Jukka Suomela

2
@ অ্যারন: আমি মিশেল রায়নালের সাথে বিতরণ করা কম্পিউটিংয়ের তত্ত্ব নিয়েছি এবং তিনি একটি তৃতীয় মডেল বর্ণনা করেছেন, যেখানে বার্তা এলোমেলোভাবে বাদ দেওয়া যেতে পারে। এই মডেলটিতে একটি বার্তা নিঃশব্দে বিতরণ করতে ব্যর্থ হতে পারে, তবে এর অর্থ এই নয় যে নোড ব্যর্থ হয়েছে। এটি নোড ব্যর্থতা "ন্যায্য ক্ষতিগ্রস্থ চ্যানেল মডেল" এর পরিবর্তে লিঙ্ক ব্যর্থতা সম্পর্কে, আপনি এখানে আরও পড়তে পারেন: ডিটেক্টর ওরাকলস ব্যর্থতার পরিচিতি সমীক্ষা হিসাবে শান্ত ইউনিফর্ম নির্ভরযোগ্য ব্রডকাস্ট - মিশেল রায়নাল ( ftp.irisa.fr/techreપોર્ટ/2000/ পিআই -1356.ps.gz )
এম। আলাগান

উত্তর:


12

অনুরোধ অনুযায়ী প্রশ্নের মন্তব্য থেকে অনুলিপি করা।

আমি মিশেল রায়নালের সাথে বিতরণ করা কম্পিউটিংয়ের তত্ত্ব নিয়েছি এবং তিনি একটি তৃতীয় মডেল বর্ণনা করেছেন, যেখানে বার্তা এলোমেলোভাবে বাদ দেওয়া যায়। এই মডেলটিতে একটি বার্তা নিঃশব্দে বিতরণ করতে ব্যর্থ হতে পারে, তবে এর অর্থ এই নয় যে নোড ব্যর্থ হয়েছে। এটি নোড ব্যর্থতা "ন্যায্য ক্ষতিগ্রস্থ চ্যানেল মডেল" এর পরিবর্তে লিঙ্ক ব্যর্থতা সম্পর্কে, আপনি এখানে আরও পড়তে পারেন: ডিটেক্টর ওরাকলস ব্যর্থতার পরিচিতি সমীক্ষা হিসাবে শান্ত ইউনিফর্ম নির্ভরযোগ্য ব্রডকাস্ট - মিশেল রায়নাল (ftp.irisa.fr/techreપોર્ટ/2000/ পী-1356.ps.gz)


10

বাইজেন্টাইন দোষ-সহনশীলতার সাথে জড়িত উচ্চ সংস্থান ব্যয়ের কারণে, ক্রমবর্ধমান দৃump় অনুমান সহ ব্যর্থতা মডেলগুলি অবশ্যই বিশ্লেষণ করা হয়েছে, বিশেষত সীমাবদ্ধ প্রকারের ফল্টগুলি সহ্য করার জন্য রিসোর্স প্রয়োজনীয়তাগুলিতে আঁকানো। ( আজাদমনেশ এবং কিহেকাফার, ২০০২ ) একটি খুব সুন্দর শৈলী প্রদান করে (চিত্র ১ দেখুন)

সম্পূর্ণ অসম্পূর্ণ বাইজেন্টাইন আচরণের মধ্যে-এর মধ্যে ব্যর্থতা মোডের ধরণ ( নোডের প্রয়োজন) এবং সৌম্য ক্র্যাশ ত্রুটি ( নোড), যা আপনার সন্ধান করছে এবং যা উপরের অন্যরা ইতিমধ্যে উল্লিখিত হয়েছে, তা প্রতিসম শ্রেণীর (বাদ পড়া) ত্রুটি , যেখানে কিছু রিসিভারের মাধ্যমে বার্তা প্রাপ্ত হয় না, তবে কোনও নোড দ্বারা কোনও মান-ত্রুটিযুক্ত (বিরোধী) বার্তা পাওয়া যায় না, যার জন্য ত্রুটিগুলি সহ্য করতে কেবল নোডের প্রয়োজন হয় । উপরের কাগজটিও মিশ্র পরিস্থিতির জন্য সংস্থানগুলির প্রয়োজনীয়তার সংক্ষিপ্তসার জানায়।3f+1f+12f+1f

মডেল ব্যর্থতা মোড অনুমানের আরেকটি উপায় হ'ল নোড-কেন্দ্রিক দৃষ্টিভঙ্গি থেকে দূরে সরে যাওয়া, যেখানে বার্তা ক্ষতি প্রেরকের ত্রুটি হিসাবে চিহ্নিত করা হয়, লিঙ্ক-ফল্ট মডেলের দিকে, যা কেবল দ্বৈত দৃষ্টিভঙ্গি হয়, একবার যখন তারা অসুবিধাগুলি তৈরি করতে পারে towards সিস্টেম বিবেচনা করা হয়। এই মডেলটি ( শ্মিড, ওয়েইস এবং রুশবি, ২০০২ ) তদন্ত করেছেন , ( ধূসর, 1978 ) এর অসম্পূর্ণতার ফলাফলকে লিঙ্ক ফল্টের অধীনে সমন্বিত আক্রমণ সমস্যার সমাধানকারী সমাধান দেখিয়েছিলেন vent


8

আমি জানি না @ এম। আলাগান এই ধরণের ত্রুটি সম্পর্কে কথা বলছিলেন, তবে এগুলি অবশ্যই অভিন্ন দেখায়: ক্ষণস্থায়ী ত্রুটি।

ডিভিএফএসের মডেলটিতে , যেখানে কেউ শক্তি ব্যবহার হ্রাস করার জন্য ফ্রিকোয়েন্সি এবং ভোল্টেজকে সংশোধন করতে পারে, এই কাগজে (পিডিএফ) জু এবং আইডিন ডিভিএফএসের জন্য একটি ত্রুটি মডেল ব্যবহার করেছেন। তারা ক্ষণস্থায়ী ব্যর্থতা বিবেচনা করে, যা উদাহরণস্বরূপ সফ্টওয়্যার ত্রুটির দ্বারা সৃষ্ট দোষ। তারা কেবলমাত্র বর্তমান টাস্কের কার্যকরকরণ বাতিল করে দেয় এবং সেই ব্যর্থতার সাথে প্রসেসর এতে নির্ধারিত পরবর্তী কার্যটি পুনরুদ্ধার ও সম্পাদন করতে সক্ষম হবে (যদি থাকে)।

অস্থায়ী ব্যর্থতা জন্য, Shatz এবং ওয়াং এই একটি নির্ভরযোগ্যতা মডেল চালু কাগজ (1989), যা যে বিকিরণ ইনডিউসড অস্থায়ী ফল্ট একটি পইসন বিতরণের অনুসরণ করুন। পরামিতি পইসন বিতরণের তত্কালীন হল:λ

λ(f)=λpedfmaxffmaxfmin,
যেখানে the প্রক্রিয়াজাতকরণের গতি , একটি ধ্রুবক, যা ডিভিএফএসের সাথে ত্রুটির হারের সংবেদনশীলতা নির্দেশ করে এবং প্রসেসরের তে গড় ফল্ট রেট সাথে সম্পর্কিত । আমরা দেখতে পাই যে শক্তি সাশ্রয়ের গতি হ্রাস করায় ত্রুটি হার দ্রুততর হয়। একটি টাস্ক নির্ভরযোগ্যতা একটি প্রসেসরের উপর মৃত্যুদন্ড কার্যকর গতিতে হল: fminffmaxd0λpfmaxpTipfi
Ri(fi)=eλ(fi)×Execution Time(Ti,fi).

মূল পোস্টের পরে এত দিন এটি পোস্ট করার জন্য দুঃখিত, তবে আমি এই বিষয়টিতে কাজ করার সময় এই প্রশ্নটি পেয়েছি :)। ডিভিএফএস অধ্যয়ন না করার সময়, এই ত্রুটিগুলি এখনও বিদ্যমান, সূত্রগুলি সম্ভবত এখনও বৈধ (বা অভিযোজ্য) are আপনি DVFS ছাড়া অস্থায়ী ব্যর্থতার আরও তথ্য পেতে পারেন এখানে


4

ইতিমধ্যে উল্লিখিত বাদ দেওয়া ব্যর্থতার বিষয়ে মডেলগুলির নীগারটউইগের দিকে নজর রয়েছে , যা বিভিন্ন ধরণের বিবেচনা করে।

এমন কোনও মডেল কি অধ্যয়ন করা হয়েছে যেখানে কিছুটা সম্ভাবনা থাকা সত্ত্বেও কোনও প্রক্রিয়া সময়ে ধাপে চলছে এবং অন্যথায় বন্ধ? সুতরাং প্রতিটি প্রক্রিয়া যেমন ছিল ঠিক তেমনই বন্ধ হয়ে যাচ্ছে।

এটি ক্র্যাশ-পুনরুদ্ধারের মডেলের মতো শোনাচ্ছে। আমি এমন কোনও মডেল সম্পর্কে অবগত নই যেখানে প্রক্রিয়াগুলি সম্ভাব্য / বন্ধ থাকে are প্রসেসগুলি কিছু সময়ের জন্য বাইজেন্টাইন থাকে এবং তারপরে পুনরুদ্ধারও হয় সেখানে বিভিন্ন রূপ রয়েছে, যেখানে সময়ের সাথে সাথে সমস্ত প্রক্রিয়া বাইজেন্টাইন হতে পারে (বেশিরভাগ ক্ষেত্রে ক্লক-সিঙ্কের জন্য বিবেচিত)।

মনে রাখবেন যে যদি আপনি কেবল এই কথাটি বোঝায় যে কোনও প্রক্রিয়া কেবল অগ্রগতি করছে না (এটি তার রাজ্যকে looseিলে করে না, এবং প্রাপ্তিগুলি "বন্ধ" হওয়ার কারণে বার্তাগুলি হারিয়ে যায় না) তবে আপনি যা দেখছেন তাকে অ্যাসিনক্রোনাস হিসাবে উল্লেখ করা হচ্ছে পদ্ধতি. ভাগ করা মেমরি প্রসঙ্গে আপনার প্রশ্নটি তখন এই অ্যাসপনেস পেপারের সাথে ঘনিষ্ঠভাবে সম্পর্কিত হতে পারে ।


1

অন্যান্য ধরণের ব্যর্থতা থাকতে পারে। উদাহরণস্বরূপ, কিছু প্রসেসর (যেমন ব্রডকাস্ট বা মাল্টিকাস্ট প্রোটোকলের অধীনে) অতিরিক্ত লোড হয়ে যেতে পারে এবং সমস্ত আগত বার্তাগুলি প্রক্রিয়া করতে সক্ষম হবে না। প্রসেসরের বিতরণ সিস্টেমে কিছু প্রসেসরের কাছে অফলাইনে উপস্থিত হওয়ার ফলস্বরূপ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.