3 ইয়ারের টুই_সিলি "EEG-ERROR" বনাম "DEGRADED" ডিস্ক দ্বারা কী বোঝায়?


10

আমি একটি 3वेयर 9650SE-16ML কার্ডে একটি দু: খিত RAID অ্যারে পেয়েছি। আমি যা বলতে পারি না তা যদি আমি সবেমাত্র একটি ডাবল-ডিস্ক ব্যর্থতা (বাম্পার!) ভোগ করেছি বা যদি আমি এই ভুলটি পড়ছি। সম্পর্কিত সম্পর্কিত ফলাফল /c0 show all:

Port   Status           Unit   Size        Blocks        Serial
---------------------------------------------------------------
p0     DEGRADED         u0     931.51 GB   1953525168    5QJ07MAH            
p1     ECC-ERROR        u0     931.51 GB   1953525168    5QJ0DCW9            
p2     OK               u0     931.51 GB   1953525168    5QJ0DW9C            
p3     OK               u0     931.51 GB   1953525168    5QJ0CKXJ            

এবং ব্যর্থতা হ'ল (থেকে show alarms):

Ctl  Date                        Severity  Alarm Message
------------------------------------------------------------------------------
c0   [Sun Nov 20 07:47:23 2011]  INFO      Rebuild started: unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Drive ECC error reported: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Source drive error occurred: port=1, unit=0
c0   [Sun Nov 20 08:20:12 2011]  ERROR     Rebuild failed: unit=0
c0   [Sun Nov 20 08:20:12 2011]  INFO      Rebuild paused: unit=0

আমি মনে করি যা ঘটেছিল তা p0 ব্যর্থ হয়েছে এবং তারপরে p1 এর একটি ইসিসি ত্রুটি হয়েছিল (ওরফে, আমার ডেটা চলে গেছে)। কিন্তু ... না হয়তো? এটি পুনরায় নির্মিত 97% এ থাকে তবে এই ত্রুটিটি পেরে উঠতে পারে না।

আমি যতদূর বলতে পারি, পূর্ববর্তী প্রশাসক পর্যায়ক্রমিক যাচাই বন্ধ করে দিয়েছিলেন, যা আমাদের এই অবস্থায় পেয়েছে। এটি বেশিরভাগ লোকদের তাদের 3 ওয়্যার রেডগুলি নিয়ে উদ্বিগ্ন হওয়া উচিত নয়!

হালনাগাদ

কয়েক দিন মারধর করার পরে, আমি IgnoreECC কিছুটা করেছি এবং এটি পুনর্নির্মাণ করা হয়েছে, তবে আমার ডেটাটি হোজেড। হতাশাজনক।


ব্যবহার করে দেখুন হিমায়ক রিকভারি এটা কোন গুরুত্বপূর্ণ ডাটা আছে কিনা পদ্ধতি।
ক্রিস এস

আমি ফ্রিজার ট্রিকের বিপক্ষে নই, তবে একটি নির্দিষ্ট ব্যর্থতা মোডের জন্য নয়, কেবল "আমার ড্রাইভ মারা গেল"?
বিল ওয়েইস

DEGRADED লেবেলযুক্ত ডিস্কটি রিবিল্ড অপারেশনের টার্গেট ডিস্ক।
wazoox

উত্তর:


7

ইসিসি ত্রুটির অর্থ এই যে ড্রাইভে কমপক্ষে একটি অপঠনযোগ্য খাত রয়েছে। তবে, আপনি যদি ভাগ্যবান হন তবে সেই ক্ষেত্রটি প্রকৃতপক্ষে সেই ভলিউমে অবস্থিত ফাইল সিস্টেম ব্যবহার করতে পারে না, তাই আপনি এখনও এই অবস্থায় অ্যারে থেকে আপনার ডেটা অনুলিপি করতে সক্ষম হতে পারেন।

পুনর্নির্মাণের সময় ইসিসি ত্রুটি উপেক্ষা করার কিছু বিকল্প রয়েছে:

/cx/ux start rebuild disk=p [ignoreECC]
/cx/ux set ignoreECC=on|off

যাইহোক, এই বিকল্পগুলি ব্যবহার করার অর্থ একটি খারাপ ক্ষেত্র দ্বারা প্রভাবিত RAID স্ট্রাইপটি ক্ষতিগ্রস্থ হবে (নিশ্চিত না যে কার্ডটি এই ক্ষেত্রে ঠিক কী করবে - এটি পুরো স্ট্রাইপটি জিরো, বা এমনকি এলোমেলো ডেটা দিয়ে প্রতিস্থাপন করতে পারে), তাই " পুনরুদ্ধার করা হয়েছে "অ্যারেতে প্রকৃতপক্ষে সনাক্ত করা যায় না এমন দুর্নীতি থাকতে পারে (যদি ক্ষতিগ্রস্থ স্ট্রাইপটি কোনও ডেটা ফাইলের মাঝখানে থাকে)। পুনর্নির্মাণের চেষ্টা করার আগে অ্যারে থেকে আপনার ডেটা অনুলিপি করা অন্য কোনও জায়গায় নিরাপদ হতে পারে (খারাপ অঞ্চলটি পড়ার চেষ্টা করার সময় কমপক্ষে আপনার ত্রুটিগুলি হওয়া উচিত)।

অপঠনযোগ্য খাতগুলি আগে ধরার জন্য আপনার অ্যারের নির্ধারিত যাচাই সেট আপ করা উচিত, যাতে আপনি এমন কোনও ড্রাইভ প্রতিস্থাপন করতে পারেন যা সবেমাত্র খারাপ হতে শুরু করে।


আমি এখন উপেক্ষা ECC বিট করছি। আমার ডেটা জন্য দুর্দান্ত খুঁজছেন না।
বিল ওয়েইস

1
এবং হ্যাঁ, আমাদের সময়ে সময়ে অ্যারেগুলি যাচাই করা উচিত। আমি অনুমান করতে পারি যে এই লোকটি সেট আপ করেছে তার পারফরম্যান্সের কারণে এটি বন্ধ করে দিয়েছে :(
বিল ওয়েইস

ঠিক আছে, এটি পুনর্নির্মাণের মাধ্যমে পেয়েছে তবে আমার ডেটাতে মনোনীত হয়েছে। হতাশাজনক। এটি আমাদের যাচাই বন্ধ করতে শেখাবে ...
বিল ওয়েইস

4

ডিগ্রেডড স্ট্যাটাসে যাওয়ার জন্য আমি কোনও ফিজিকাল ড্রাইভ (p0) কখনই অনুভব করতে পারি নি, তবে আপনি ECC-ERROR ড্রাইভ বা এমনকি ডিগ্রেড ড্রাইভের মাধ্যমে এগুলি সরিয়ে ফিরে পেতে সক্ষম হতে পারেন

/c0 p1 remove

এবং তারপরে একটি রিসান জারি করা

/c0 rescan

তাদের দিয়ে আবার রাইড ইউনিটে রাখুন

maint rebuild c0 u0 p1

এসটিএ-ড্রাইভস যা আমাকে ইসিসি-ইআরআর দিয়ে ব্যর্থ করেছিল আমি আবার ব্যর্থ হওয়ার কয়েক ঘন্টা আগেও পুনরুত্থান করতে সক্ষম হয়েছিল।


3
বর্তমান অবস্থায় পি 1 ড্রাইভ সরিয়ে ফেলা সম্ভবত অ্যারেটিকে সম্পূর্ণভাবে হোস করবে।
সের্গেই ভ্লাসভ

আমি পি 0 ড্রাইভ দিয়ে এটি করেছি (এই ধারণাটি খারাপ ছিল) এবং এটি পুনর্নির্মাণের চেষ্টা করছি তবে এটি ড্রাইভটিকে প্রায় অবিলম্বে ডিগ্রাড হিসাবে চিহ্নিত করেছে। হতাশাজনক।
বিল ওয়েইস

1
আফির, ড্রাইভটি পুনর্নির্মাণের সময় ডিগ্রাডেড হিসাবে চিহ্নিত করা হয়েছে - দেখুন, উদাহরণস্বরূপ, এখানে । অ্যারে স্ট্যাটাসটি কী গুরুত্বপূর্ণ তা হল (পুনর্নির্মাণ বা অন্য কিছু?)।
সের্গেই ভ্লাসভ

হুঁ। এটি আসলে পুনর্নির্মাণ ... সমস্ত চারটি ড্রাইভই প্রচুর ঝলক দিচ্ছে, এটি একটি ভাল লক্ষণ, তাই না?
বিল ওয়েইস

স্টিলইইইইল পুনর্নির্মাণ ... এটি 4 ঘন্টা পরে 37% এ at হতাশাজনক।
বিল ওয়েইস

2

সম্ভবত আপনার ডেটা চলে গেছে। ইসিসি ত্রুটিটি এই ডিস্কটি থেকে পড়ার সময় একটি পুনরুদ্ধারযোগ্য ত্রুটি means

আপনার যদি ব্যাকআপ না থাকে তবে আপনি অ্যারের বর্তমান অবস্থা ডাম্প করার চেষ্টা করতে পারেন। এটি সম্ভবত সম্ভব হতে পারে কারণ নিয়ন্ত্রণকারী জানেন না যে এটি ডেটা বা কেবল একটি খালি অঞ্চল হারিয়েছে কিনা (এটিতে ফাইল সিস্টেমের কোনও অন্তর্দৃষ্টি নেই)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.