কসমিক রে: তারা কোনও প্রোগ্রামকে প্রভাবিত করবে এমন সম্ভাবনা কত?


546

আবার আমি একটি নকশা পর্যালোচনায় ছিলাম এবং এই দাবির মুখোমুখি হয়েছিলাম যে একটি নির্দিষ্ট দৃশ্যের সম্ভাবনাটি "মহাজাগতিক রশ্মির ঝুঁকির চেয়ে কম" প্রোগ্রামকে প্রভাবিত করেছিল এবং আমার কাছে ঘটেছিল যে আমার কাছে বেহুদি ধারণা ছিল না তা কী সম্ভাবনা হ'ল

"যেহেতু 2 -128 340282366920938463463374607431768211456 এর মধ্যে 1, সুতরাং আমি মনে করি আমরা এখানে আমাদের সম্ভাবনাগুলি গ্রহণযোগ্য ন্যায্য, এমনকি যদি এই গণনাগুলি কয়েক বিলিয়ন ফ্যাক্টর দ্বারা বন্ধ করা হয় ... তবে আমরা মহাজাগতিক রশ্মির ঝুঁকির ঝুঁকির বাইরে যাব আমাদের বিশ্বাসঘাতক করুন, আমি বিশ্বাস করি। "

এই প্রোগ্রামারটি কি সঠিক? কোন মহাজাগতিক রশ্মি কম্পিউটারে আঘাত করে এবং প্রোগ্রামটির সম্পাদনকে প্রভাবিত করে তার সম্ভাবনা কত?


42
"লটারি জিততে: তারা কোনও প্রোগ্রামকে প্রভাবিত করবে এমন সম্ভাবনা কত?"
কেনেটিএম

27
এটি প্রোগ্রামটি কোথায় কার্যকর হচ্ছে এবং কতটা ভালভাবে এটি রক্ষিত হয়েছে তার একটি অংশে নির্ভর করে। পৃথিবীতে মহাজাগতিক রশ্মিগুলি গভীর স্থানের চেয়ে অনেক কম বা পৃথিবীর কক্ষপথের কাছাকাছি। উদাহরণস্বরূপ, হাবল স্পেস টেলিস্কোপটি এমন কাঁচা চিত্র তৈরি করে যা মহাজাগতিক রশ্মির চিহ্নগুলিতে ছাঁটাইযুক্ত।
অ্যাডাম হলিজে

89
অর্থ কি এই যে এখন থেকে, যখন কেউ পরবর্তী সম্পর্কে জিজ্ঞেস করে finallyব্লক, আমরা সঙ্গে এটি যোগ্যতা অর্জন করতে হবে "সবসময় executes ব্যতীত যদি প্রোগ্রাম প্রস্থান করে, বা এটি একটি মহাজাগতিক রশ্মি আঘাত পরার যদি"?
skaffman

72
বছর আগে একটি প্রোটোটাইপ কণা ডিটেক্টর নিয়ে কাজ করে, আমি এটি "ছাপ!" মুদ্রণের জন্য প্রোগ্রাম করেছি! প্রতিবার এটি মহাজাগতিক রশ্মির দ্বারা আঘাতিত হয়েছিল। শুভ সময় ...
বিটা

8
আমি এখানে কিছু সময়ের মধ্যে পড়েছি সবচেয়ে আকর্ষণীয় প্রশ্নগুলির উপর। একজন সত্যিকারের চোখ খোলা। পুনরায় খোলার জন্য আমাকে বিশ্বাস করুন।
অগ্নেল কুরিয়ান

উত্তর:


308

উইকিপিডিয়া থেকে :

১৯৯০ এর দশকে আইবিএমের অধ্যয়নগুলি থেকে বোঝা যায় যে কম্পিউটারগুলি সাধারণত মাসে প্রতি 256 মেগাবাইট র‍্যামের মধ্যে একটি মহাজাগতিক-রে-প্ররোচিত ত্রুটি অনুভব করে। [15]

এর অর্থ প্রতি মাসে বাইট প্রতি 3.7 × 10 -9 বা সেকেন্ডে বাইট প্রতি 1.4 × 10 -15 prob যদি আপনার প্রোগ্রামটি 1 মিনিটের জন্য চলে এবং 20 এমবি র‌্যাম দখল করে তবে ব্যর্থতার সম্ভাবনাটি

                 60 × 20 × 1024²
1 - (1 - 1.4e-15)                = 1.8e-6 a.k.a. "5 nines"

ত্রুটি পরীক্ষা করা ব্যর্থতার পরিণতি কমাতে সহায়তা করতে পারে। এছাড়াও, জো দ্বারা মন্তব্য হিসাবে চিপগুলির আরও কমপ্যাক্ট আকারের কারণে, ব্যর্থতার হার 20 বছর আগের চেয়ে আলাদা হতে পারে।


10
আরও গুরুত্বপূর্ণ, 1995 সালে সিপিইউগুলির জন্য চিপ বৈশিষ্ট্যটির আকার ছিল প্রায় 0.35 মিমি বা 350nm। এখন আকারটি 35nm এ 1/10 তম।
জো কোবার্গ

18
এটা কি সম্ভব যে ঝুঁকি হ্রাস করার পরিবর্তে, হ্রাস হওয়া আকার ঝুঁকি বাড়িয়ে তুলবে কারণ প্রতিটি বিটটির অবস্থা পরিবর্তন করতে কম শক্তি লাগবে?
রবার্ট

63
হ্রাস করা আকার অবশ্যই ঝুঁকি বাড়ায়। মহাকাশ গাড়ির জন্য শক্ত প্রসেসরগুলি মহাজাগতিক রশ্মির প্রভাব এড়াতে খুব বড় বৈশিষ্ট্যযুক্ত মাপ ব্যবহার করে izes
জো কোবার্গ

22
শুধু মহাজাগতিক রশ্মি নয়, চিপে ব্যবহৃত উপকরণগুলিতে তেজস্ক্রিয় আইসোটোপ অনেক বড় সমস্যা। সিলিকন, সোল্ডার, এনক্যাপসুলেশন ইত্যাদিতে কোনও আলফা বা বিটা ইমিটার থাকে না তা নিশ্চিত করতে নির্মাতারা বিশাল দৈর্ঘ্যে যান।
মার্টিন বেকেট

14
কি দারুন! এর অর্থ হ'ল আমার পিসিতে প্রায় 1 বাইট প্রতি দুই দিন পরে দূষিত হয়।
স্টেফান মনোভ

91

স্পষ্টতই, তুচ্ছ নয়। থেকে এই নিউ সায়েন্টিস্ট নিবন্ধ , একটি ইন্টেল পেটেন্ট আবেদন থেকে উদ্ধৃতি:

"মহাজাগতিক রজনিত কম্পিউটারের ক্রাশ ঘটেছিল এবং আশা করা যায় যে ডিভাইসগুলি (উদাহরণস্বরূপ, ট্রানজিস্টর) চিপসের আকার হ্রাস হওয়ার সাথে সাথে ফ্রিকোয়েন্সি বৃদ্ধি পেতে পারে This এই সমস্যাটি আগামী দশকে কম্পিউটারের নির্ভরযোগ্যতার একটি বড় সীমাবদ্ধ হয়ে উঠবে বলে আশা করা হচ্ছে।"

আপনি এখানে সম্পূর্ণ পেটেন্ট পড়তে পারেন ।


7
চিপের আকার হ্রাসের সাথে এগুলি কেন বাড়বে? অবশ্যই কোনও ছোট বস্তুটি রে দ্বারা আঘাত হানার সম্ভাবনা কম (যেমন কোনও টেনিস বলটি প্রাচীরের দিকে ছুঁড়ে দেওয়া, এটি স্ট্যাম্পে ফেলে দেওয়ার জন্য)
জোনাথন।

7
কারণ উপাদানগুলির আকার সঙ্কুচিত হওয়ার সাথে সাথে এগুলি মহাজাগতিক রশ্মির হিটগুলির প্রতি আরও সংবেদনশীল হয়ে ওঠে।
ire_and_curses

4
হ্যাঁ, ছোট হিট হওয়ার সম্ভাবনা কম, তবে সম্ভবত এই আঘাতটি রাজ্যের উপর প্রভাব ফেলবে।
জন হাসকল

2
@ire_and_curses [উদ্ধৃতি আবশ্যক]
আনকো

8
@ আঙ্কো - এটি একদম স্পষ্ট। প্রদত্ত উপাদানটি ছোট হওয়ার সাথে সাথে কিছু সেট করার জন্য কম ভোল্টেজ এবং কম চার্জের প্রয়োজন। এটি বাইরের স্থান থেকে শক্তির সাথে বিস্ফোরণে আরও সংবেদনশীল করে তোলে। তবে, এখানে আপনার জন্য একটি উদ্ধৃতি দেওয়া: এলএসআই মেমরি ডিভাইসগুলি ছোট হওয়ার সাথে সাথে তারা পারমাণবিক-বিকিরণ-প্ররোচিত নরম ব্যর্থতার জন্য আরও সংবেদনশীল হয়ে ওঠে।
ire_and_curses

55

দ্রষ্টব্য: এই উত্তরটি পদার্থবিজ্ঞানের বিষয়ে নয়, নন-ইসিসি মেমরি মডিউলগুলির সাথে নীরব মেমরির ত্রুটিগুলি সম্পর্কে। কিছু ত্রুটি বাইরের স্থান থেকে, এবং কিছু - ডেস্কটপের অভ্যন্তরীণ স্থান থেকে আসতে পারে।

সিইআরএন ক্লাস্টার এবং গুগল ডেটাসেন্টারগুলির মতো বড় সার্ভার ফার্মগুলিতে ইসিসি মেমরি ব্যর্থতার বেশ কয়েকটি গবেষণা রয়েছে। ইসিসি সহ সার্ভার-শ্রেণীর হার্ডওয়্যার সমস্ত একক বিট ত্রুটি সনাক্ত এবং সংশোধন করতে পারে এবং অনেকগুলি মাল্টি-বিট ত্রুটি সনাক্ত করতে পারে।

আমরা ধরে নিতে পারি যে অনেকগুলি নন-ইসিসি ডেস্কটপ রয়েছে (এবং নন-ইসিসি মোবাইল স্মার্টফোন)। যদি আমরা ইসিসি-সংশোধনযোগ্য ত্রুটি হারের (একক বিটফ্লিপস) জন্য কাগজপত্রগুলি পরীক্ষা করি তবে আমরা নন-ইসিসি মেমরিতে নীরব মেমরির দুর্নীতির হার জানতে পারি।

  • বড় আকারের সিইআরএন 2007 স্টাডি "ডেটা অখণ্ডতা" : বিক্রেতারা " তাদের মেমরির মডিউলগুলির জন্য 10 -12 এর বিট ত্রুটি হার " ঘোষণা করেছেন , " একটি পর্যবেক্ষণ ত্রুটির হার প্রত্যাশার চেয়ে 4 মাত্রার কম "। ডেটা-ইনটেনসিভ টাস্কগুলির জন্য (8 গিগাবাইট / মেমরি রিডিং) এর অর্থ এই যে প্রতি মিনিটে (10 -12 বিক্রেতাদের বিইআর) বা দুই দিনের মধ্যে একবার (10 -16 বিআর) একক বিট ফ্লিপ দেখা দিতে পারে ।

  • ২০০৯ এর গুগলের কাগজ " ওয়্যার্ডে ড্রামের ত্রুটি: একটি বৃহত্তর স্কেল ফিল্ড স্টাডি" বলছে যে প্রতি এমবিট প্রতি 25000-75000 এক বিট এফআইটি ( বিলিয়ন ঘন্টা প্রতি সময় ব্যর্থতা ) থাকতে পারে, যা 1 - 5 বিটের সমান আমার গণনার পরে 8 গিগাবাইট র‍্যামের জন্য প্রতি ঘন্টা ত্রুটি। কাগজটি একই বলে: " প্রতি বছর জিবি প্রতি 2000-600000 এর সংশোধনযোগ্য ত্রুটি হার "।

  • ২০১২ সান্দিয়ার রিপোর্ট "সাইলেন্ট ডেটা দুর্নীতি সনাক্তকরণ এবং সংশোধন বৃহত-স্কেল উচ্চ-পারফরম্যান্স কম্পিউটিংয়ের জন্য :" "ডাবল বিট ফ্লিপগুলি অসম্ভব বলে মনে করা হয়েছিল" তবে ওআরএনএল এর ঘন ক্রে এক্সটি 5 এ তারা "75,000+ ডিআইএমএমের জন্য প্রতিদিন এক হারে" এমনকি ইসিসি সহ। এবং একক বিট ত্রুটি বেশি হওয়া উচিত।

সুতরাং, যদি প্রোগ্রামটিতে বড় ডেটাসেট (বেশ কয়েকটি জিবি) থাকে, বা উচ্চ মেমরি রিডিং বা রাইটিং রেট (জিবি / গুলি বা আরও বেশি) থাকে এবং এটি বেশ কয়েক ঘন্টা ধরে চলতে থাকে তবে আমরা ডেস্কটপ হার্ডওয়্যারে বেশ কয়েকটি নীরব বিট ফ্লিপ করতে পারি। এই হারটি স্মৃতিশক্তি দ্বারা সনাক্তযোগ্য নয় এবং ডিআরএএম মডিউলগুলিও ভাল।

দীর্ঘ ক্লাস্টার হাজার হাজার নন-ইসিসি পিসিতে চলে, যেমন বিওআইএনসি ইন্টারনেট-প্রশস্ত গ্রিড কম্পিউটিংয়ে সর্বদা মেমরি বিট-ফ্লিপ এবং ডিস্ক এবং নেটওয়ার্ক নীরব ত্রুটি থেকে ত্রুটি থাকবে।

এবং বড় মেশিনগুলির জন্য (দশ হাজার সার্ভার) এমনকি একক-বিট ত্রুটি থেকে ইসিসি সুরক্ষা সহ, আমরা যেমন সান্দিয়ার ২০১২ প্রতিবেদনে দেখি, প্রতিদিন ডাবল-বিট ফ্লিপ হতে পারে, তাই আপনার পূর্ণ আকারের সমান্তরাল চালানোর কোনও সুযোগ থাকবে না বেশ কয়েক দিন ধরে প্রোগ্রাম (দ্বিগুণ ত্রুটির ক্ষেত্রে নিয়মিত চেকপয়েন্টিং এবং শেষ ভাল চেকপয়েন্ট থেকে পুনরায় আরম্ভ না করে)। বিশাল মেশিনগুলি তাদের ক্যাশে এবং সিপিইউ রেজিস্টারগুলিতেও বিট-ফ্লিপ পাবে (উভয় আর্কিটেকচারাল এবং অভ্যন্তরীণ চিপের ট্রিগারগুলি যেমন এএলইউ ডেটাপাথে), কারণ এগুলির সমস্তই ইসিসি দ্বারা সুরক্ষিত নয়।

পিএস: ডিআরএএম মডিউলটি খারাপ হলে বিষয়গুলি আরও খারাপ হবে। উদাহরণস্বরূপ, আমি ল্যাপটপে নতুন DRAM ইনস্টল করেছি, যা বেশ কয়েক সপ্তাহ পরে মারা গেছে। এটি প্রচুর স্মৃতি ত্রুটি দেওয়া শুরু করে। আমি যা পাই: ল্যাপটপ হ্যাং, লিনাক্স রিবুট, fsck চালায়, রুট ফাইল সিস্টেমে ত্রুটিগুলি খুঁজে পায় এবং বলে যে এটি ত্রুটিগুলি সংশোধন করার পরে পুনরায় বুট করতে চায়। তবে প্রতিটি পরবর্তী রিবুটে (আমি তাদের মধ্যে প্রায় 5-6 করেছি) মূল ফাইল সিস্টেমটিতে এখনও ত্রুটি রয়েছে।


9
বি এইচ 2011 থেকে অতিরিক্ত সামগ্রী: "। Bitsquatting শোষণ ছাড়া ডিএনএস হাইজ্যাক" media.blackhat.com/bh-us-11/Dinaburg/... তালিকা আধুনিক বহু-গিগাবাইট DRAMs প্রায় 10000-30000 মাপসই / মেগাবিট (100 কম মধ্যে ঘন্টার আছে প্রতি 128MB এর জন্য ত্রুটিগুলি)। গবেষণাপত্রটি এমন নিবন্ধগুলিও তালিকাভুক্ত করে যা এই সিদ্ধান্তে পৌঁছে যে সর্বাধিক নরম ত্রুটিগুলি বিকিরণ থেকে ঘটেছিল, প্রায় সব ক্ষেত্রেই - মহাজাগতিক রশ্মি থেকে, এবং কিছু ক্ষেত্রে পিসির অভ্যন্তরে আলফা-उत्सরণকারী। বিএইচ লেখকরা পরীক্ষা-নিরীক্ষা করেছিলেন এবং জনপ্রিয় সাইটগুলি থেকে 1 বিট পরিবর্তন করে ডোমেনে 50000 প্রবেশাধিকার পেয়েছেন
ওসগক্স

এখানে আরও সাম্প্রতিক গবেষণা যুক্ত করার জন্য কুডোস। এসও ভোটদানের গতিশীলতা এবং কীভাবে তারা সময়ের সাথে জমে থাকে তা প্রদত্ত, এই বিষয়টিতে একটি আপ-টু-ডেট উপস্থাপনা রাখা (এখানে) আউট করা খুব কঠিন।
ফিজ

আমাদেরও একই সমস্যা ছিল। আমরা কোনও সঠিক অধ্যয়ন করি নি, তবে দৃশ্যমান বিট ফ্লিপ সহ আমাদের বেশ কয়েকটি ক্র্যাশ ডাম্প ছিল। আমরা সেই বিট ফ্লিপগুলি পরীক্ষা করেছিলাম এবং দেখা গেছে যে তারা কোড বিভাগে রয়েছে। আমরা সেখানে যা হওয়া উচিত তার সাথে তুলনা করেছি এবং এটি ইচ্ছাকৃত পরিবর্তনের মতো দেখায় নি (যেমন ফলাফলের নির্দেশাবলীর খুব বেশি ধারণা নেই)। শেষ পর্যন্ত আমাদের কাছে সহজ অ্যাপ্লিকেশন ছিল, যে তুলনায় ক্র্যাশ ডাম্পগুলি (আর্কাইভ) প্রকাশিত সংস্করণগুলির সাথে তুলনা করে এবং এই জাতীয় কেসগুলি ফিল্টার করে ফেলে। মজার বিষয় হচ্ছে আমি মনে করি এ জাতীয় বেশিরভাগ মামলা ইরান, আরব থেকে এসেছিল এবং আমি মনে করি দক্ষিণ আমেরিকা থেকে আরও একটি দেশ এসেছে (এখন মনে নেই)।
জিএম

2
গুগলের কাগজে এটি দেখতে আরও মামলার মতো দেখাচ্ছে যে কিছু র‌্যাম খারাপ our আমাদের প্রতি ডিআইএমএম সংশোধনযোগ্য ত্রুটিগুলি প্রতি এমবিট প্রতি 25,000–75,000 এফআইটি (অপারেশনের সময় বিলিয়নে ব্যর্থতা) এবং প্রতি এমবিটিতে 778 - 25,000 এর মিডিয়ান এফআইটি পরিসীমা (ত্রুটিযুক্ত ডিআইএমএমগুলির জন্য মধ্যমা) অনুবাদ করে, পূর্ব-গবেষণাগুলি প্রতি এমবিট প্রতি 200-5,000 ফিট ফিট করে। ডিআইএমএম প্রতি সংশোধনযোগ্য ত্রুটির সংখ্যা অত্যন্ত পরিবর্তনশীল, কিছু ডিআইএমএম অন্যদের তুলনায় বিপুল সংখ্যক ত্রুটি ভোগ করে।
ভের্টেক

31

উইকিপিডিয়া 90 এর দশকে আইবিএমের একটি সমীক্ষা উদ্ধৃত করে যে "কম্পিউটারগুলি প্রতি মাসে 256 মেগাবাইট র্যাম প্রতি এক মহাজাগতিক-রে-প্ররোচিত ত্রুটি অনুভব করে।" দুর্ভাগ্যক্রমে উদ্ধৃতিটি বৈজ্ঞানিক আমেরিকানের একটি নিবন্ধের ছিল, যা আরও কোনও রেফারেন্স দেয় নি। ব্যক্তিগতভাবে, আমি এই সংখ্যাটি খুব বেশি বলে মনে করি, তবে সম্ভবত মহাজাগতিক রশ্মির দ্বারা প্ররোচিত বেশিরভাগ মেমরির ত্রুটিগুলি কোনও আসল বা লক্ষণীয় সমস্যা সৃষ্টি করে না।

অন্যদিকে, যখন সফ্টওয়্যার পরিস্থিতিগুলির কথা আসে তখন সম্ভাব্যতাগুলি নিয়ে কথা বলার লোকদের সাধারণত তারা কী বলছে সে সম্পর্কে কোনও ধারণা থাকে না।


7
কিছুটা উল্টে যাওয়ার সম্ভাবনাটি অবশ্যই প্রোগ্রামটিতে বিটটির নজরে পড়ার সম্ভাবনা দ্বারা গুণিত করতে হবে। আমি অনুমান করছি দ্বিতীয় সম্ভাবনাটি আপনার ভাবার চেয়ে অনেক কম।
মার্ক রান্সম

2
@ মার্ক: সাধারণ কম্পিউটার প্রোগ্রামগুলিতে অন্তর্নির্মিত ধরণের-ত্রুটি-সহনশীলতা থাকে না। যদি ভাঙা কোডটি কার্যকর করা হয় তবে প্রোগ্রাম কোডটিতে একটি বিট ত্রুটি প্রোগ্রামটি ক্র্যাশ না করার সম্ভাবনা বেশি।
রবার্ট হার্ভে

75
হ্যাঁ, তবে বেশিরভাগ মেমরির মধ্যে ডেটা থাকে, যেখানে ফ্লিপটি সেই ভিজিবিপ্লপ হবে না।
জুল

34
@zoul। 'ভিজিবলপ' এ লোল, তবে যদি ই = 1100101 এবং পি = 1110000 হয় তবে আপনি 3 বিট ফ্লিপের দুর্ভাগ্যজনক শিকার !
পলজি

10
@ পল: বা একটি আঙুল ব্লিপ
এমপিএন

30

ঠিক আছে, মহাজাগতিক রশ্মি টয়োটা গাড়িগুলিতে ইলেক্ট্রনিক্সকে দূষিত করে তোলে, তাই আমি বলব সম্ভাবনা খুব বেশি :)

মহাজাগতিক রশ্মি কি সত্যিই টয়োটা হতাশা সৃষ্টি করছে?


23
"ফেডারাল নিয়ন্ত্রকরা অধ্যয়ন করছেন যে টয়োটাতে হঠাৎ ত্বরণ মহাজাগতিক রশ্মির সাথে যুক্ত কিনা।" এজন্য আপনার কখনই আপনার জীবনের উপর ফেডারাল নিয়ন্ত্রকদের শক্তি দেওয়া উচিত নয়।

13
আমার ধারণা এখানে তত্ত্বটি হ'ল মহাজাগতিক রশ্মিগুলি পুরানো মস্তিষ্কে বিট ফ্লিপ করছে যা তাদের ত্রুটির কারণ হতে পারে এবং ভুল প্যাডেল টিপছে।
নাকস

16
"দৃশ্যত"? আমি বলতে চাই যে এই সময়ে এটি একটি বন্য অনুমান। আমার নিজের বুনো অনুমান যে এই ঘটনাটি এম্বেডেড সিস্টেমগুলির (আসলে বেশিরভাগ জটিল কম্পিউটার সিস্টেম) পুরানো দুঃস্বপ্নের একটি ফলাফল - রেসের শর্ত।
মাইকেল বুড়

7
@Knox: আপনার পুরানো রঙ্গপত্র টুপি বেরিয়ে যাও, এটা হল দরকারী!

3
এটি কোনও রসিকতা নাও হতে পারে। এর আগে এমন কিছু মারাত্মক অদ্ভুত জিনিস দেখেছি। বেশিরভাগ লোক মনে করেন তত বিরল নয়।
ব্রায়ান নোব্লাচ

25

ইসিসি দিয়ে আপনি মহাজাগতিক রশ্মির 1 বিট ত্রুটি সংশোধন করতে পারেন। 10% ক্ষেত্রে এড়ানোর জন্য যেখানে মহাজাগতিক রশ্মি 2-বিট-ত্রুটির ফলে ECC কোষগুলি সাধারণত চিপগুলির উপর আন্তঃবিভক্ত হয় তাই কোনও দুটি কোষ একে অপরের পাশে থাকে না। একটি মহাজাগতিক রশ্মি ইভেন্ট যা দুটি কোষকে প্রভাবিত করে তার ফলে দুটি সংশোধনযোগ্য 1 বিট ত্রুটি ঘটবে।

সূর্য বলেছেন: (খণ্ড নং 816-5053-10 এপ্রিল 2002)

সাধারণভাবে বলতে গেলে, ডিআআরএএম মেমরিতে to 10 থেকে 100 এফআইটি / এমবি হারে 1 টি এফআইটি = 1 ডিভাইস 1 বিলিয়ন ঘন্টা ব্যর্থ হয় মহাজাগতিক রশ্মি নরম ত্রুটিগুলি ঘটে। সুতরাং 10 গিগাবাইট মেমরিযুক্ত একটি সিস্টেমে প্রতি 1000 থেকে 10,000 ঘন্টা একটি ইসিসি ইভেন্ট দেখাতে হবে এবং 100 জিবি সহ একটি সিস্টেম প্রতি 100 থেকে এক হাজার ঘন্টা পরে একটি ইভেন্ট দেখাবে। তবে এটি একটি মোটামুটি অনুমান যা উপরে উল্লিখিত প্রভাবগুলির ফাংশন হিসাবে পরিবর্তিত হবে।


17

স্মৃতি ত্রুটিগুলি আসল এবং ইসিসি মেমরির সাহায্য করে। সঠিকভাবে বাস্তবায়ন ইসিসি মেমোরি একক বিট ত্রুটি সংশোধন এবং ডাবল বিট ত্রুটি নির্ণয় করতে পারবে (যদি এমন একটি ত্রুটি সনাক্ত করা হলে সিস্টেম স্থগিত।) আপনি থেকে মানুষ কি একটি সফটওয়্যার সমস্যা হল চলমান দ্বারা সমাধান করা হবে বলে মনে হয় কীভাবে নিয়মিতভাবে অভিযোগ দেখতে পারে Memtest86 এবং খারাপ স্মৃতি আবিষ্কার হচ্ছে। অবশ্যই মহাজাগতিক রশ্মির ফলে ক্ষণস্থায়ী ব্যর্থতা স্মৃতিতে ধারাবাহিকভাবে ব্যর্থ হওয়া পৃথক, তবে আপনার স্মৃতি সঠিকভাবে পরিচালনা করতে আপনার কতটা বিশ্বাস করা উচিত তার বিস্তৃত প্রশ্নের সাথে এটি প্রাসঙ্গিক।

20 এমবি আবাসিক আকারের উপর ভিত্তি করে বিশ্লেষণ তুচ্ছ অ্যাপ্লিকেশনগুলির জন্য উপযুক্ত হতে পারে তবে বৃহত সিস্টেমে নিয়মিত বড় মেমরির স্মৃতি সহ একাধিক সার্ভার থাকে।

আকর্ষণীয় লিঙ্ক: http://cr.yp.to/hardware/ecc.html

পৃষ্ঠাটিতে কর্সের লিঙ্কটি দুর্ভাগ্যক্রমে মারা গেছে বলে মনে হচ্ছে।


মহাজাগতিক রশ্মি বিটফ্লিপগুলি সমানভাবে বিতরণ করা যায় না, বিশেষত যদি আমরা "মহাজাগতিক রশ্মির ঘটনা" -আব্রেলার অধীনে সৌর ঝড়কে অন্তর্ভুক্ত করি। যদি আপনি একই বাইটের মধ্যে দুটি বা ততোধিক বিটফ্লিপগুলি পেয়ে থাকেন তবে সাধারণত ইসি ত্রুটিটি সংশোধন করতে সক্ষম হবে না।
tobixen

@ টোবিক্সেন ডাবল বিট ত্রুটি সনাক্তকরণ খারাপ ডেটা দিয়ে চালিয়ে যাওয়ার চেয়ে ভাল। ইসিসির পরের পদক্ষেপটি হ'ল চিপকিল ডিআইএমএম মিররিংয়ের সাথে ...
জানু

13

এটি একটি আসল সমস্যা এবং সে কারণেই সার্ভার এবং এম্বেড থাকা সিস্টেমে ইসিসি মেমরি ব্যবহৃত হয়। এবং কেন ফ্লাইং সিস্টেমগুলি স্থল-ভিত্তিকগুলি থেকে পৃথক।

উদাহরণস্বরূপ, নোট করুন যে "এম্বেডেড" অ্যাপ্লিকেশনগুলির জন্য নির্দিষ্ট ইন্টেল অংশগুলি স্পিক শীটটিতে ইসিসি যুক্ত করে। একটি ট্যাবলেটের একটি বে ট্রেলের অভাব রয়েছে, যেহেতু এটি স্মৃতিটিকে কিছুটা ব্যয়বহুল এবং সম্ভবত ধীর করে তুলবে। এবং যদি কোনও ট্যাবলেট নীল চাঁদে প্রতি একবার কোনও প্রোগ্রাম ক্র্যাশ করে তবে ব্যবহারকারীর খুব বেশি যত্ন নেই। সফ্টওয়্যার নিজেই HW এর চেয়ে অনেক কম নির্ভরযোগ্য। তবে শিল্প যন্ত্রপাতি এবং স্বয়ংচালিত ব্যবহারের জন্য উদ্দিষ্ট এসকিউগুলির জন্য, ইসিসি বাধ্যতামূলক। যেহেতু এখানে, আমরা আশা করি যে এসডাব্লু অনেক বেশি নির্ভরযোগ্য হবে এবং এলোমেলো আপসেটগুলি থেকে ত্রুটিগুলি আসল সমস্যা হয়ে উঠবে।

আইসিআই 50১৫০৮ এর সাথে শংসাপত্রিত সিস্টেম এবং একই ধরণের স্ট্যান্ডার্ডগুলিতে সাধারণত বুট-আপ উভয় পরীক্ষা থাকে যা সমস্ত র‌্যাম কার্যকরী (শূন্য বা একটিতে কোনও বিট আটকে থাকে না), পাশাপাশি রানটাইম এ ত্রুটি পরিচালনা করে যা ইসিসি দ্বারা চিহ্নিত ত্রুটিগুলি থেকে পুনরুদ্ধার করার চেষ্টা করে এবং প্রায়শই মেমরি স্ক্রাবারের কাজগুলিও ঘটে যা কোনও ত্রুটি যাতে না ঘটে সেদিকে লক্ষ্য রাখে তা নিশ্চিত করার জন্য অবিচ্ছিন্নভাবে মেমরি পড়তে এবং লিখতে হয়।

তবে মূলধারার পিসি সফটওয়্যারটির জন্য? তেমন কিছু না. দীর্ঘকালীন সার্ভারের জন্য? ইসিসি এবং একটি ফল্ট হ্যান্ডলার ব্যবহার করুন। যদি কোনও ত্রুটিযুক্ত ত্রুটি কার্নেলটিকে হত্যা করে, তবে তা হয়ে যায়। অথবা আপনি অদ্ভুতভাবে যান এবং লক-স্টেপ এক্সিকিউশন সহ একটি রিডানড্যান্ট সিস্টেম ব্যবহার করুন যাতে একটি কোর দূষিত হয়ে যায়, অন্যটি প্রথম কোর পুনরায় চালু হওয়ার সময় ধরে নিতে পারে।


মহাজাগতিক রশ্মি বিটফ্লিপগুলি সমানভাবে বিতরণ করা যায় না, বিশেষত যদি আমরা "মহাজাগতিক রশ্মির ঘটনা" -আব্রেলার অধীনে সৌর ঝড়কে অন্তর্ভুক্ত করি। হঠাৎ ফেটে যাওয়ার ফলে বাইটের মধ্যে বেশ কয়েকটি বিটফ্লিপ হতে পারে এবং ইসিসি-অ্যালগোরিদম ব্যর্থতা সংশোধন করতে সক্ষম হবে না।
tobixen

12

যদি কোনও প্রোগ্রাম জীবন-সমালোচিত হয় (এটি ব্যর্থ হলে এটি কাউকে মেরে ফেলবে), এটি এমনভাবে লেখা দরকার যাতে হয় তা ব্যর্থ-নিরাপদ হয়ে যায়, বা এই জাতীয় ব্যর্থতা থেকে স্বয়ংক্রিয়ভাবে পুনরুদ্ধার হয়। অন্যান্য সমস্ত প্রোগ্রাম, ওয়াইএমএমভি।

টয়োটা পয়েন্টে একটি কেস। থ্রটল কেবলটি সম্পর্কে আপনি যা বলবেন তা বলুন তবে এটি সফ্টওয়্যার নয়

Http://en.wikedia.org/wiki/Therac-25 এও দেখুন


থ্রোটলের জন্য সফ্টওয়্যারটিকে কিছু মনে রাখবেন না। থ্রোটলের জন্য সেন্সর এবং তারগুলি দুর্বল বিন্দু। আমার মিতসুবিশি থ্রোটল পজিশন সেন্সরটি এলোমেলো সংখ্যা জেনারেটরে ব্যর্থ হয়েছে ... অনিচ্ছাকৃত ত্বরণ নেই, তবে এটি নিশ্চিত করে যে জ্বালানী মিশ্রণের জন্য ভাল কিছু করতে পারেনি!
ব্রায়ান নোব্লাউচ

3
@ ব্রায়ান: ভাল সফ্টওয়্যারটি আবিষ্কার করতে পারত যে ডেটা পয়েন্টগুলি সংবিধানযুক্ত নয় এবং উপসংহারে এসেছিল যে ডেটাটি খারাপ was
রবার্ট হার্ভে

.. এবং তারপর কি ... ভাল ডেটা প্রয়োজন। এটি খারাপ জানা জেনে কোনও লাভ হয় না। আপনি যাদুতে কাজ করতে পারেন এমন কিছু নয়।
ব্রায়ান নোব্লাউচ

3
@ ব্রায়ান: ঠিক আছে, একটি বিষয় হিসাবে, আপনি যে ডেটা খারাপ তা জানেন এমন তথ্যের ভিত্তিতে আপনি সংশোধনমূলক পদক্ষেপ নিতে পারেন। উদাহরণস্বরূপ, আপনি ত্বরণ বন্ধ করতে পারেন।
রবার্ট হার্ভে

হ্যাঁ আপনি চেকসাম ডেটা (এবং হওয়া উচিত) করতে পারেন। সেরা শেষ থেকে শেষ। তবে এটি কেবল দুর্নীতির সম্ভাবনা হ্রাস করে। আপনার "এটি হ'ল" কল্পনা করুন আপনি যখন ত্রুটি হ্যান্ডলারের শাখা করতে চান ঠিক তখনই মেমরি বা সিপিইউ রেজিস্ট্রারে কিছুটা দূষিত হয়ে যায়।
উপস্থাপিত

11

আমি একবার ডিভাইসগুলিকে প্রোগ্রাম করেছিলাম যা মহাশূন্যে উড়তে হবে, এবং তারপরে আপনি (অনুমিতভাবে, কেউই আমাকে এ সম্পর্কে কোনও কাগজ দেখায় নি, তবে এটি ব্যবসায়ের সাধারণ জ্ঞান বলে মনে হয়) সর্বদা মহাজাগতিক রশ্মি ত্রুটিগুলি প্ররোচিত করার আশা করতে পারে।


8
বায়ুমণ্ডলের উপরে দুটি জিনিস ঘটে: ১) মোট প্রবাহটি উচ্চতর ২) এর অনেকগুলি ভারী, খুব শক্তিশালী কণার আকারে আসে (একটি সামান্য স্থানের মধ্যে কিছুটা প্যাক করার জন্য যথেষ্ট শক্তি সহ)।
dmckee --- প্রাক্তন মডারেটর বিড়ালছানা

রেফারেন্স সম্পর্কিত, বই (যেমন, book.google.com/books?hl=en&lr=&id=Er5_rzW0q3MC ), সম্মেলন (যেমন, Radecs2015.org , seemapld.org , এবং অন্যান্য) রয়েছে, এবং এই বিষয়গুলিতে কাগজপত্র । মহাজাগতিক রশ্মি মহাকাশগুলিতে কোনও রসিকতা নয়। এগুলি অন্যতম মূল কারণ যে অনেক মহাকাশযান র‌্যাড কড়া কম্পিউটার ব্যবহার করে যার বেশিরভাগের কাছে আধুনিক স্মার্ট টোস্টার ওভেনের প্রক্রিয়াকরণ ক্ষমতা রয়েছে।
ডেভিড হামেন

8

"মহাজাগতিক রশ্মি ইভেন্টগুলি" এখানে অনেক উত্তরে অভিন্ন বিতরণ হিসাবে বিবেচিত হয়, এটি সর্বদা সত্য হতে পারে না (অর্থাত্ সুপারনোভাস)। যদিও সংজ্ঞায়িতভাবে "মহাজাগতিক রশ্মি" (কমপক্ষে উইকিপিডিয়া অনুসারে) বাইরের স্থান থেকে এসেছে , আমি মনে করি এটি স্থানীয় সৌর ঝড়কে অন্তর্ভুক্ত করা যথাযথ ( একই ছাতার নীচে ওরফে করোনাল ভর ইজেকশন । আমি বিশ্বাস করি যে এটি একাধিক বিট একটির মধ্যে উল্টাতে পারে সংক্ষিপ্ত সময় স্প্যান, এমনকি ইসিসি-সক্ষম মেমরির দূষিত করার পক্ষে যথেষ্ট।

এটি সুপরিচিত যে সৌর ঝড়ের কারণে বৈদ্যুতিক সিস্টেমগুলি বেশ কিছুটা বিধ্বস্ত হতে পারে (যেমন মার্চ ১৯৮৯-কুইবেক বিদ্যুৎ বিভ্রাট )) এটি সম্ভবত কম্পিউটার সিস্টেমগুলিও প্রভাবিত হতে পারে।

প্রায় 10 বছর আগে আমি অন্য একজনের পাশে বসে ছিলাম, আমরা আমাদের প্রতিটি ল্যাপটপের সাথে বসে ছিলাম, এটি বেশ "ঝড়" সৌর আবহাওয়ার সাথে ছিল (আর্কটিকটিতে বসে, আমরা এটি পরোক্ষভাবে পর্যবেক্ষণ করতে পারি - অনেকগুলি অররা বোরিয়ালিস দেখা হবে)। হঠাৎ - খুব একই তাত্ক্ষণিকভাবে - আমাদের দুটি ল্যাপটপ ক্র্যাশ হয়ে গেছে। তিনি ওএস এক্স চালাচ্ছিলেন, এবং আমি লিনাক্স চালাচ্ছিলাম। আমাদের উভয়ই ল্যাপটপের ক্র্যাশ হওয়ার জন্য ব্যবহৃত হয় না - এটি লিনাক্স এবং ওএস এক্সের ক্ষেত্রে একটি বিরল বিষয় Common সাধারণ সফ্টওয়্যার বাগগুলি যেহেতু আমরা বিভিন্ন ওএসে চালাচ্ছিলাম সেহেতু কম-বেশি এই বিষয়টি অস্বীকার করা যায় (এবং এটি লিপের সময় ঘটেছিল না) দ্বিতীয়)। আমি সেই ইভেন্টটিকে "মহাজাগতিক বিকিরণ" হিসাবে দান করতে এসেছি।

পরে, "মহাজাগতিক বিকিরণ" আমার কর্মক্ষেত্রে অভ্যন্তরীণ রসিকতায় পরিণত হয়েছে। যখনই আমাদের সার্ভারগুলির সাথে কিছু ঘটে এবং আমরা এর জন্য কোনও ব্যাখ্যা খুঁজে পাই না, আমরা তামাশা করে দোষটিকে "মহাজাগতিক বিকিরণ" হিসাবে চিহ্নিত করি। :-)


7

প্রায়শই শব্দগুলি ডেটা দূষিত করতে পারে। চেকসামগুলি বিভিন্ন স্তরে এটির বিরুদ্ধে লড়াই করতে ব্যবহৃত হয়; ডেটা কেবলে সাধারণত একটি প্যারিটি বিট থাকে যা ডেটার পাশাপাশি ভ্রমণ করে। এটি দুর্নীতির সম্ভাবনা ব্যাপকভাবে হ্রাস করে। তারপরে পার্সিং স্তরগুলিতে, আজেবাজে ডেটা সাধারণত উপেক্ষা করা হয়, সুতরাং কিছু দুর্নীতি প্যারিটি বিট বা অন্যান্য চেকসামগুলি পেরিয়ে গেলেও বেশিরভাগ ক্ষেত্রে তা উপেক্ষা করা হবে।

এছাড়াও, কিছু উপাদান শব্দ দূরে রাখতে বৈদ্যুতিক allyালিত হয় (সম্ভবত আমার ধারণা মহাজাগতিক রশ্মি নয়)।

তবে শেষ পর্যন্ত, অন্যান্য উত্তরদাতারা যেমন বলেছেন, সেখানে মাঝে মধ্যে কিছুটা বিট বা বাইট থাকে যা স্ক্যাম্বল হয়ে যায়, এবং তা সম্ভবত কোনও গুরুত্বপূর্ণ বাইট না হয় সেটাই সুযোগ থেকে যায়। সেরা ক্ষেত্রে, একটি মহাজাগতিক রশ্মি খালি বিটগুলির মধ্যে একটিতে স্ক্যাম্বল করে এবং একেবারে কোনও প্রভাব ফেলে না বা কম্পিউটার ক্র্যাশ করে (এটি একটি ভাল জিনিস, কারণ কম্পিউটারটি ক্ষতি করতে ব্যর্থ হয়েছে); তবে সবচেয়ে খারাপ পরিস্থিতি, ভাল, আমি নিশ্চিত আপনি কল্পনা করতে পারেন।


মহাজাগতিক রশ্মি বিটফ্লিপগুলি সমানভাবে বিতরণ করা যায় না, বিশেষত যদি আমরা "মহাজাগতিক রশ্মির ঘটনা" -আব্রেলার অধীনে সৌর ঝড়কে অন্তর্ভুক্ত করি। যদি আপনি একই বাইটের মধ্যে দুটি বিটফ্লিপ পেয়ে থাকেন তবে প্যারিটি বিট চেক ব্যর্থ হবে। বেশ কয়েকটি বিটলিপস এবং ইসিসি-অ্যালগরিদম সম্ভবত একটি ব্যর্থতা সংশোধন করতে সক্ষম হবে না।
tobixen

5

আমি এটি অভিজ্ঞতা অর্জন করেছি - মহাজাগতিক রশ্মির জন্য একটুখানি ফ্লিপ হওয়া বিরল নয়, তবে কোনও ব্যক্তি এটি পর্যবেক্ষণ করার পক্ষে খুব কমই।

আমি ২০০৪ সালে একটি ইনস্টলারটির জন্য একটি সংকোচনের সরঞ্জামে কাজ করছিলাম test আমার পরীক্ষার ডেটা ছিল প্রায় 500 এমবি বা তার বেশি সংক্ষেপিত কিছু অ্যাডোব ইনস্টলেশন ফাইল।

একঘেয়েমি সংকোচনের পরে, এবং সততা পরীক্ষা করার জন্য একটি সংক্ষেপণ রান করার পরে, এফসি / বি একটি বাইট আলাদা দেখায়।

সেই এক বাইটের মধ্যেই এমএসবি উল্টে যায়। আমিও উল্টে গেলাম, এই ভেবে যে আমার একটি ক্রেজি বাগ রয়েছে যা কেবল খুব নির্দিষ্ট অবস্থার অধীনে চলে আসবে - আমিও জানি না যে কোথায় সন্ধান করা শুরু করব।

তবে কিছু আমাকে আবার পরীক্ষা চালাতে বলেছে। আমি এটি চালানো এবং এটি পাস। আমি রাতারাতি 5 বার পরীক্ষা চালানোর জন্য একটি স্ক্রিপ্ট সেট আপ করেছি। সকালে সমস্ত 5 কেটে গেছে।

সুতরাং এটি অবশ্যই একটি মহাজাগতিক রশ্মি বিট ফ্লিপ ছিল।


স্পষ্টভাবে? এটি কি অনিবার্যতম ভেরিয়েবল হতে পারে যা পরবর্তী পরীক্ষাগুলিতে কখনও খারাপ প্রাথমিক মান পায় না?
ডগ 65536

আমি সবসময় ভিএস-এর উপর ডাব্লু 3 বা ডাব্লু 4 এর সাথে সংকলন করি - এছাড়াও যুক্তিযুক্ত শুদ্ধতা, এই ধরণের কোনও বাগ ছিল না।
rep_movsd

আহ, দুঃখিত আমি জানি না যে এই সংকলক বিকল্পগুলি এবং যৌক্তিক বিশুদ্ধতা সম্পূর্ণরূপে অপূর্ণই ছিল। =)
ডগ 65536

কোডটি তখন প্রোডাক্টে রাখা হয়েছিল এবং কয়েকশ জিবি যথাযথভাবে সংকুচিত এবং সংকুচিত করা হয়েছিল তা বিবেচনা করে, অনুরূপ বাগের চিহ্ন নেই was
rep_movsd

4

আপনি ফল্ট সহনকারী হার্ডওয়্যারও একবার দেখতে চান।

উদাহরণস্বরূপ স্ট্রাটাস টেকনোলজি উইনটেল সার্ভার তৈরি করে ftServer যা লক-স্টেপে 2 বা 3 "মেইনবোর্ডস" ছিল, গণনার ফলাফলের তুলনা করে। (এটি কখনও কখনও মহাকাশ যানবাহনেও করা হয়)।

স্ট্র্যাটাস সার্ভারগুলি কাস্টম চিপসেট থেকে ব্যাকপ্লেনের লকস্টেপে বিকশিত হয়েছিল।

একটি অতি অনুরূপ (তবে সফ্টওয়্যার) সিস্টেম হ'ল হাইপারভাইজারের উপর ভিত্তি করে ভিএমওয়্যার ফল্ট টলারেন্স লকস্টেপ।


4

ডেটা পয়েন্ট হিসাবে, এটি কেবল আমাদের বিল্ডে ঘটেছিল:

02:13:00,465 WARN  - In file included from /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/../include/c++/v1/ostream:133:
02:13:00,465 WARN  - /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/../include/c++/v1/locale:3180:65: error: use of undeclared identifier '_'
02:13:00,465 WARN  - for (unsigned __i = 1; __i < __trailing_sign->size(); ++_^i, ++__b)
02:13:00,465 WARN  - ^
02:13:00,465 WARN  - /Applications/Xcode.app/Contents/Developer/Toolchains/XcodeDefault.xctoolchain/usr/bin/../include/c++/v1/locale:3180:67: error: use of undeclared identifier 'i'
02:13:00,465 WARN  - for (unsigned __i = 1; __i < __trailing_sign->size(); ++_^i, ++__b)
02:13:00,465 WARN  - ^

এটি সংকলনের সময় কিছুটা ফ্লিপের মতো ঘটনাক্রমে, উত্সক্রমে একটি উত্স ফাইলে খুব উল্লেখযোগ্য স্থানে দেখায় strongly

আমি অগত্যা এটি "মহাজাগতিক রশ্মি" বলছি না, তবে লক্ষণটি মেলে matches

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.