কোনও হার্ডওয়্যার SATA RAID-10 অ্যারেতে থাকা একটি সিঙ্গেল ডিস্ক কীভাবে পুরো অ্যারেটিকে স্ক্রাইচিং থামাতে পারে?


103

প্রস্তাবনা:

আমি একটি কোড-বানর যা ক্রমশ আমার ছোট সংস্থার জন্য সিসএডমিন দায়িত্ব গ্রহণ করা। আমার কোডটি আমাদের পণ্য এবং ক্রমবর্ধমান আমরা সাস হিসাবে একই অ্যাপ্লিকেশন সরবরাহ করি।

প্রায় 18 মাস আগে আমি আমাদের সার্ভারগুলি প্রিমিয়াম হোস্টিং কেন্দ্রিক বিক্রেতার কাছ থেকে একটি স্তর চতুর্থ ডেটা সেন্টারে একটি বেয়ারবোনস র্যাক পুশারে স্থানান্তরিত করেছি। (আক্ষরিক অর্থে রাস্তা জুড়ে net

হোস্টিং সংস্থা থেকে আমাদের লিজ নেওয়া সরাসরি সংযুক্ত স্টোরেজটি প্রতিস্থাপনের জন্য, আমি সুপার মাইক্রো চ্যাসিস, 3 ওয়্যার রেড কার্ড, উবুন্টু 10.04, দুই ডজন সাটা ডিস্ক, ডিআরবিডি এবং এর উপর ভিত্তি করে একটি 9 টিবি টু-নোড এনএএস তৈরি করেছি। এটি সমস্ত প্রেমের সাথে তিনটি ব্লগ পোস্টে নথিভুক্ত করা হয়েছে: একটি নতুন 9 টিবি সটা রেড 10 এনএফএসভি 4 এনএএস গঠন এবং পরীক্ষণ: প্রথম খণ্ড , দ্বিতীয় খন্ড এবং তৃতীয় অংশ

আমরা একটি ক্যাসিট মনিটরিং সিস্টেমও সেটআপ করি। সম্প্রতি আমরা স্মার্ট মানগুলির মতো আরও বেশি সংখ্যক ডেটা পয়েন্ট যুক্ত করছি।

আমি ছাড়া এই সব কাজ করতে পারে না সন্ত্রস্ত boffins ServerFault । এটি একটি মজাদার এবং শিক্ষামূলক অভিজ্ঞতা হয়েছে। আমার বস খুশি (আমরা বালতি বোঝা $$$ রক্ষা করেছি) , আমাদের গ্রাহকরা খুশি (স্টোরেজ ব্যয় হ্রাস পাচ্ছে) , আমি খুশি (মজা, মজা, মজাদার)

গতকাল পর্যন্ত।

আউটেজ এবং পুনরুদ্ধার:

মধ্যাহ্নভোজের কিছু সময় পরে আমরা আমাদের অ্যাপ্লিকেশন থেকে অলস পারফরম্যান্সের প্রতিবেদন পেতে শুরু করেছি, অন অন ডিমান্ড স্ট্রিমিং মিডিয়া সিএমএস। প্রায় একই সময় আমাদের ক্যাকটি পর্যবেক্ষণ সিস্টেম ইমেলের একটি বরফ ঝলক প্রেরণ করে। আরও বলার সতর্কতাগুলির মধ্যে একটি হ'ল আইওস্যাট অপেক্ষা করার একটি গ্রাফ।

এখানে চিত্র বর্ণনা লিখুন

পারফরম্যান্স এতটাই হ্রাস পেয়েছে যে পিংডম "সার্ভার ডাউন" বিজ্ঞপ্তি প্রেরণ শুরু করে। সামগ্রিক বোঝা মাঝারি ছিল, ট্র্যাফিক স্পাইক ছিল না।

অ্যাপ্লিকেশন সার্ভারগুলিতে, এনএএস এর এনএফএস ক্লায়েন্টগুলিতে লগ ইন করার পরে, আমি নিশ্চিত করেছিলাম যে প্রায় সব কিছুই অত্যন্ত বিরতিহীন এবং অত্যন্ত দীর্ঘ IO অপেক্ষার সময় ভোগ করছে। এবং একবার আমি নিজেই প্রাথমিক এনএএস নোডের উপরে pedুকলাম, সমস্যা অ্যারের ফাইল সিস্টেম নেভিগেট করার চেষ্টা করার সময় একই বিলম্ব প্রকট হয়েছিল।

সময় ব্যর্থ হয়েছে, যে ভাল গিয়েছিল। 20 মিনিটের মধ্যে সমস্ত কিছুই পুরোপুরি ব্যাক আপ এবং পুরোপুরি চলার বিষয়ে নিশ্চিত হয়ে গেছে।

ময়নাতদন্তের:

যেকোন এবং সমস্ত সিস্টেমের ব্যর্থতার পরে আমি ব্যর্থতার কারণ নির্ধারণ করতে একটি ময়না তদন্ত করি। প্রথম জিনিসটি আমি বাক্সে ফিরে এসে লগগুলি পর্যালোচনা করা শুরু করলাম। এটি সম্পূর্ণরূপে অফলাইন ছিল। ডেটা সেন্টারে ভ্রমণের সময়। হার্ডওয়্যার রিসেট, ব্যাকআপ আন এবং চলমান।

ইন /var/syslogআমি এই ভীতিকর খুঁজছেন এন্ট্রি পাওয়া যায়নি:

Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_00], 6 Currently unreadable (pending) sectors
Nov 15 06:49:44 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_07], SMART Prefailure Attribute: 1 Raw_Read_Error_Rate changed from 171 to 170
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 16 Currently unreadable (pending) sectors
Nov 15 06:49:45 umbilo smartd[2827]: Device: /dev/twa0 [3ware_disk_10], 4 Offline uncorrectable sectors
Nov 15 06:49:45 umbilo smartd[2827]: Num  Test_Description    Status                  Remaining  LifeTime(hours)  LBA_of_first_error
Nov 15 06:49:45 umbilo smartd[2827]: # 1  Short offline       Completed: read failure       90%      6576         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 2  Short offline       Completed: read failure       90%      6087         3421766910
Nov 15 06:49:45 umbilo smartd[2827]: # 3  Short offline       Completed: read failure       10%      5901         656821791
Nov 15 06:49:45 umbilo smartd[2827]: # 4  Short offline       Completed: read failure       90%      5818         651637856
Nov 15 06:49:45 umbilo smartd[2827]:

তাই আমি অ্যারেতে থাকা ডিস্কগুলির জন্য ক্যাকটি গ্রাফগুলি পরীক্ষা করতে গিয়েছিলাম। এখানে আমরা দেখতে পাই যে, হ্যাঁ, ডিস্ক 7 সিসলগ যেমন বলছে ঠিক তেমনই পিছলে চলেছে। তবে আমরা আরও দেখতে পাই যে ডিস্ক 8 এর স্মার্ট রিড এরোস ওঠানামা করছে।

এখানে চিত্র বর্ণনা লিখুন

সিস্লগ-এ ডিস্ক 8 সম্পর্কে কোনও বার্তা নেই। আরও মজার বিষয় হ'ল ডিস্ক 8-এর জন্য ওঠানাময় মানগুলি উচ্চ আইও অপেক্ষা সময়ের সাথে সরাসরি সম্পর্কিত হয়! আমার ব্যাখ্যাটি হ'ল:

  • ডিস্ক 8 একটি বিজোড় হার্ডওয়ার ত্রুটিটি ভোগ করছে যা ফলস্বরূপ দীর্ঘ ক্রিয়াকলাপের সময় দেয়।
  • কোনওভাবে ডিস্কে এই ত্রুটিযুক্ত শর্তটি পুরো অ্যারেটিকে লক করছে

সম্ভবত আরও সঠিক বা সঠিক বিবরণ থাকতে পারে তবে নেট ফলাফলটি হয়েছে যে একটি ডিস্ক পুরো অ্যারের কার্যকারিতা প্রভাবিত করছে।

প্রশ্নসমুহ)

  • কোনও হার্ডওয়্যার SATA RAID-10 অ্যারেতে থাকা একটি সিঙ্গেল ডিস্ক কীভাবে পুরো অ্যারেটিকে স্ক্রাইচিং থামাতে পারে?
  • আমি কি ভাবতে ভাবছি না যে RAID কার্ডটি এটিকে মোকাবেলা করা উচিত ছিল?
  • আমি কীভাবে কোনও একক দুর্ব্যবহারকারী ডিস্ককে পুরো অ্যারে প্রভাবিত করা থেকে আটকাতে পারি?
  • আমি কিছু অনুপস্থিত করছি?

11
আপনার কাছ থেকে আরও একটি লিখিত প্রশ্ন, +1। পড়তে সর্বদা আনন্দিত (তবে দুর্ভাগ্যক্রমে আমার বোর্ডের উপরে এমনকি একটি ধারণা পেতে এমনকি)।
সমাধিকার 89

1
@ ড্যাফ: এই সেটআপটিতে চলমান বাজেট কিনুন আমরা এইচপি থেকে তুলনীয় থেকে শক্তিশালী% 66% সংরক্ষণ করেছি। আমরা এই বাক্সে আপনাকে বছরের এক বছর জুড়েছি, এটি আর বেশি দিন স্থায়ী হয় না। মনে রাখবেন যে এটি একটি স্টোরেজ বাক্স, বছরে পিলেমেট ব্যয় করে।
স্টু থম্পসন

2
3 ওয়্যার খারাপ নয়, প্রতি সে। আমি ডেল সিস্টেমে পিইআরসি কার্ডের কাছ থেকে খারাপ আচরণ করেছি, যা শালীন সার্ভার হার্ডওয়্যার বলে মনে করা হচ্ছে। 3 ওয়ার কার্ডে বোর্ডে থাকা ব্যাটারি এবং এ জাতীয় হওয়া উচিত, তাই সিদ্ধান্তটি সম্পর্কে আমি খুব খারাপ লাগব না। ঠিক আছে, আপনি এসএএস বনাম সাটা সিদ্ধান্তের জন্য নিন্দা করতে পারেন, তবে আপনি ডেটা হারাচ্ছেন না এবং আপনার প্রশ্ন থেকে মনে হচ্ছে আপনার জায়গায় ব্যাকআপ এবং মনিটরিং রয়েছে, সুতরাং আপনি বেশ ভাল করছেন :-)
বার্ট সিলভারস্ট্রিম

1
@ স্টুথম্পসন: অবশ্যই বাজেট করা এবং ভোক্তা হার্ডওয়্যার ব্যবহার করা সস্তা, এবং বেশিরভাগ ক্ষেত্রে এটি দুর্দান্ত সঞ্চালন করবে, বিশেষত যখন আপনার ক্ষেত্রে এটির পিছনে একটি ভাল এইচএ ধারণা রয়েছে is তবে আপনি যেমন দেখিয়েছেন তেমন কেস রয়েছে, যেখানে খারাপ জিনিস ঘটে যখন গ্রাহক হার্ডওয়্যার কেবল এটি কাটেনি। আমি আপনাকে যথেষ্ট গ্যারান্টি দিতে পারি যে ভাল পিইআরসি (ডেল) বা স্মার্টআরে (এইচপি) কন্ট্রোলারে থাকা একটি একক ত্রুটিযুক্ত এসএএস ডিস্ক আপনাকে রিপ্লেসমেন্ট ডিস্ক পাওয়ার জন্য সমর্থন কল ব্যতীত অন্য কোনও সমস্যা না ঘটায়। উত্পাদনের বছরগুলিতে আমাদের প্রচুর ডেড এসএএস ডিস্ক পড়েছে তবে সেগুলি কখনও সার্ভার নামিয়ে আনেনি।
ড্যাফ

5
বেশিরভাগ SATA ডিস্ক টিএলআর (টাইম লিমিটেড ত্রুটি পুনরুদ্ধার) সমর্থন করে না। যখন একটি সাধারণ Sata ডিস্ক কোনও শারীরিক সমস্যার মুখোমুখি হয় তখন এটি ডিস্ক সাবসিস্টেমগুলিতে "এটি চালিয়ে থাকি" প্রেরণ করে (যা সাধারণত এটি যেমন বলা হয় তেমন করে)। ডিস্কটি "ততক্ষণে" আমি মারা গেছি "থ্রেশহোল্ড না পাওয়া পর্যন্ত এটি খুঁজে পাওয়া প্রতিটি ত্রুটিতে 10-30 সেকেন্ড (সাধারণত) ব্যয় করতে এগিয়ে যায়। এসএএস ডিস্ক এবং এসটিএ ডিস্কগুলি যা টিএলআর সমর্থন করে তাদের এইচবিএ দ্বারা ডিস্ক সাবসিস্টেমটি কনফিগার করা হয়েছে "আমার সমস্যা হয়েছে, আমি কী করব?" সুতরাং এইচবিএ উপযুক্ত তাত্ক্ষণিকভাবে অবিলম্বে সিদ্ধান্ত নিতে পারে। (বংশবৃদ্ধির জন্য সরলীকৃত)
ক্রিস এস

উত্তর:


48

সমালোচনামূলক উত্পাদন পরিবেশে "Sata ব্যবহার করবেন না" বলতে আমি ঘৃণা করি, তবে আমি এই পরিস্থিতিটি প্রায়শই দেখেছি। আপনি বর্ণিত ডিউটি ​​চক্রের জন্য সাটা ড্রাইভগুলি সাধারণত বোঝানো হয় না, যদিও আপনি আপনার সেটআপে 24x7 ক্রিয়াকলাপের জন্য বিশেষভাবে রেট দেওয়া নির্দিষ্ট ড্রাইভগুলি করেছেন । আমার অভিজ্ঞতাটি হ'ল যে সাটা ড্রাইভগুলি অনাকাঙ্ক্ষিত উপায়ে ব্যর্থ হতে পারে, প্রায়শই পুরো স্টোরেজ অ্যারেটিকে প্রভাবিত করে, এমনকি রেড 1 + 0 ব্যবহার করার সময়ও। কখনও কখনও ড্রাইভগুলি এমনভাবে ব্যর্থ হয় যা পুরো বাসটি স্টল করতে পারে। একটি বিষয় লক্ষণীয় হ'ল আপনি নিজের সেটআপে এসএএস প্রসারকারী ব্যবহার করছেন কিনা। এটি কীভাবে ড্রাইভের ব্যর্থতায় বাকী ডিস্কগুলি প্রভাবিত করে তার মধ্যে একটি পার্থক্য তৈরি করতে পারে।

তবে মিডলাইন / নিকটলাইন (7200 আরপিএম) এসএএস ড্রাইভ বনাম এসটিএ নিয়ে যেতে আরও বোধগম্য হতে পারে । এসটিএর তুলনায় এখানে একটি ছোট দামের প্রিমিয়াম রয়েছে, তবে ড্রাইভগুলি আরও পূর্বাভাসে চালিত / ব্যর্থ হবে। এসএএস ইন্টারফেস / প্রোটোকলে ত্রুটি-সংশোধন এবং প্রতিবেদন করা স্যাটা সেট থেকে বেশি শক্তিশালী। এমনকি এমন ড্রাইভগুলির সাথেও যাদের মেকানিক্সগুলি একই , এসএএস প্রোটোকল পার্থক্যটি আপনার ড্রাইভ ব্যর্থতার সময় আপনি যে ব্যথা অনুভব করেছেন তা প্রতিরোধ করতে পারে।


আমি যখন প্রশ্ন লিখছিলাম তখন আমি জানতাম আমার এসএএসের পছন্দটি প্রকাশিত হতে চলেছে। : / আইওপিএস এবং থ্রুপুট আমার সেটআপের দক্ষতার মধ্যে রয়েছে। তবে আমি আরও কিছু সূক্ষ্ম পার্থক্য পুরোপুরি ছাঁটাইনি। আমরা এই বাক্সে একটি 3 বছরের জীবনকাল রাখি। পরের বার এসএএস ব্যবহার করা নিশ্চিত হবে।
স্টু থম্পসন

1
হ্যাঁ, এটি পরের বার বিবেচনা করার মতো কিছু। আমি উল্লেখ করেছি যে নিকটতম লাইন এসএএস ড্রাইভগুলি অগত্যা এসটিএর চেয়ে ভাল সম্পাদন করে না, তবে এটি ত্রুটি পুনরুদ্ধার এবং ড্রাইভ ব্যর্থতার মতো জিনিস যেখানে এসএএস আরও পরিচালিত হয়। আমার কাছে একটি সান ফায়ার x4540 48-ড্রাইভ SATA স্টোরেজ সিস্টেম রয়েছে যার সাথে 6 টি নিয়ামক রয়েছে এবং স্বতন্ত্র ড্রাইভ ব্যর্থতাগুলি সার্ভারটিকে লক করে রাখে। কঠিন পাঠ।
ew white

10
আমার একটি ভাল বন্ধুটি এন্টারপ্রাইজ স্টোরেজ বিশ্বে। তিনি এই সমস্ত কিছু পড়েছিলেন এবং বলেছিলেন "এই লোকটি ঠিক আছে what "
স্টু থম্পসন

@StThompson আপনি কি কাছাকাছি লাইনের এসএএস দিয়ে একটি নতুন বাক্স তৈরি করেছেন? আমি আপনার অভিজ্ঞতা সম্পর্কে পড়তে চাই। আপনার প্রশ্ন ইতিমধ্যে আমাকে অনেক সাহায্য করেছে, আমি সম্ভবত অদূর ভবিষ্যতে একটি অনুরূপ বাক্স তৈরি করব।
chrisiestand

1
পছন্দ করেছেন আমি 13 জানুয়ারিতে সঙ্গ ছেড়েছি; যদি আমি থাকতাম তবে আমরা প্রতিস্থাপন বাক্সটি নিকটবর্তী লাইনের সাথে তৈরি করতাম। হায়রে, এনএএসের অস্তিত্বটি আমার নিজের সাথে খুব ঘনিষ্ঠভাবে আবদ্ধ ছিল এবং ডেটা কোনও পরিষেবা সরবরাহকারীর এসএএন-তে স্থানান্তরিত হয়েছিল।
স্টু থম্পসন

17

কীভাবে একটি সিঙ্গল ডিস্ক অ্যারে নামিয়ে আনতে পারে? উত্তরটি হ'ল এটি করা উচিত নয়, তবে এটি কীভাবে বিভ্রাট সৃষ্টি করছে তার উপর নির্ভর করে। যদি ডিস্কটি আচরণ করে এমনভাবে মারা যায় তবে এটি এটিকে নামানো উচিত নয়। তবে এটি সম্ভব যে এটি কোনও "এজ কেস" পদ্ধতিতে ব্যর্থ হচ্ছে যাতে নিয়ন্ত্রণকারী পরিচালনা করতে পারে না।

এমনটি হওয়া উচিত নয় ভেবে আপনি কি নির্দোষ? না, আমি এটা মনে করি না। এর মতো একটি হার্ডওয়্যার RAID কার্ডের বেশিরভাগ সমস্যা হ্যান্ডেল করা উচিত ছিল।

কীভাবে এটি প্রতিরোধ করবেন? আপনি এর মতো অদ্ভুত প্রান্তের ক্ষেত্রে ধারণা করতে পারবেন না। এটি সিসাদমিন হওয়ার অংশ ... তবে আপনার ব্যবসায়ের উপর প্রভাব ফেলতে না পারার জন্য আপনি পুনরুদ্ধার পদ্ধতিতে কাজ করতে পারেন। এখনই এটি ঠিক করার চেষ্টা করার একমাত্র উপায় হ'ল হয় অন্য একটি হার্ডওয়্যার কার্ড চেষ্টা করা (সম্ভবত আপনি যা করতে চান তা নয়) বা এসআইএস আরও শক্তিশালী কিনা তা দেখার জন্য নিজের ড্রাইভগুলি এসএটিএর পরিবর্তে এসএএস ড্রাইভে পরিবর্তন করা। আপনি রেড কার্ডের আপনার বিক্রেতার সাথেও যোগাযোগ করতে পারেন এবং তাদের কী হয়েছে তা বলতে পারেন এবং তারা কী বলে তা দেখতে পারেন; তারা, সর্বোপরি, উইঙ্কি ড্রাইভ ইলেক্ট্রনিক্সের ইন এবং আউটগুলি জানার ক্ষেত্রে বিশেষজ্ঞ বলে মনে করা হচ্ছে company ড্রাইভগুলি নির্ভরযোগ্যতার পাশাপাশি কীভাবে কাজ করে সে সম্পর্কে তাদের আরও প্রযুক্তিগত পরামর্শ থাকতে পারে ... যদি আপনি সঠিক লোকের সাথে কথা বলতে পারেন।

আপনি কিছু মিস করেছেন? আপনি যদি যাচাই করতে চান যে ড্রাইভে একটি প্রান্ত-ক্ষেত্রে ব্যর্থতা রয়েছে, অ্যারে থেকে এটি টানুন। অ্যারেটি হ্রাস করা হবে তবে আপনার অদ্ভুত ধীরগতি এবং ত্রুটিগুলি আরও বেশি হওয়া উচিত নয় (অবনমিত অ্যারের স্থিতিটি বাদে)। আপনি এখনই বলছেন যে এটি ঠিকঠাকভাবে কাজ করছে বলে মনে হচ্ছে, তবে যদি এটিতে ডিস্ক পড়ার ত্রুটি থাকে তবে আপনার ড্রাইভটি প্রতিস্থাপন করা উচিত should উচ্চ ক্ষমতা সম্পন্ন ড্রাইভে কখনও কখনও ইউআরআই ত্রুটি থাকতে পারে (RAID 5 না চালানোর সর্বোত্তম কারণ, পার্শ্ব নোট) যা অন্য ড্রাইভ ব্যর্থ না হওয়া অবধি প্রদর্শিত হবে না। এবং যদি আপনি সেই একটি ড্রাইভ থেকে প্রান্ত-কেস আচরণটি অনুভব করছেন, আপনি অ্যারেতে অন্য ড্রাইভগুলিতে দূষিত ডেটা স্থানান্তরিত করতে চান না।


1
হ্যাঁ ... আমরা ইতিমধ্যে একটি নতুন প্রতিস্থাপন নীতি রেখেছি "" যদি পড়ার ত্রুটিগুলি ওঠানামা করে তবে এটি ইয়েঙ্ক করুন " । এখন যেহেতু আমি এটি সম্পর্কে চিন্তা করি, আমাদের এই ড্রাইভগুলিতে ব্যর্থতার যথেষ্ট পরিমাণ ছিল। 18 মাসে 22 এর 4 টি। হুমম ....
স্টু থম্পসন

2
18 মাসে 4 ড্রাইভ? এটি সেখানে বেশ রেট ... যদিও এটি ড্রাইভগুলি অনুমানের মধ্যে নাও থাকতে পারে, সেখানে শীতলকরণ / বায়ু প্রবাহের বিষয়টিও দেখার মতো হতে পারে। বা নিয়ন্ত্রকের সাথে সম্ভবত কিছু অদ্ভুত। কিছু চিন্তা ... লগগুলিতে নজর রাখুন। আপনি যদি কেবল কোনও স্ক্রিপ্ট না করে কার্ডে প্রকৃত কাজ নিয়ে 3 ওয়্যারে কারও সাথে যোগাযোগ করতে সক্ষম হন তবে আপনি তাদের দ্বারা এটি চালিয়ে যেতে চান এবং তারা কী বলে তা দেখতে চান।
বার্ট সিলভারস্ট্রিম

1
আপনি ত্রুটিগুলি দেখতে পাচ্ছেন এমন সেটের উপর নির্ভর করে আপনি এটিও পরীক্ষা করে দেখতে পারেন যে কেবলগুলির সাথে খুব খারাপ বা প্রান্তিক কিছু নেই। ত্রুটিগুলি যদি একই বন্দরে কেন্দ্রীভূত বলে মনে হয়, তবে আপনার ব্যর্থতার একটি কাকতালীয় সেট থেকে কম থাকতে পারে।
বার্ট সিলভারস্ট্রিম

4
আমি সবেমাত্র দেখেছি যে এই বাম ড্রাইভের জন্য স্মার্ট মানগুলি ~ 31 ডিগ্রি সেন্টিগ্রেডে চলছে বা অন্য সমস্ত ড্রাইভের চেয়ে ভাল 4 ডিগ্রি সেন্টিগ্রেডের চেয়ে বেশি। যে জিনিসগুলি আপনাকে হুমম্মে করে তোলে ....
স্টু থম্পসন

2
@ ড্যানিয়েলি: ১৪ টি ড্রাইভের মধ্যে (১১ টি উপাত্ত, ৩ টি সিস্টেম) উচ্চতর টেম্পের সাথে একমাত্র এটি ছিল। আমি মোটামুটিভাবে নিশ্চিত করেছি যে বায়ু প্রবাহটি ভাল ছিল, তবে কালকে স্পষ্টতই তা পরীক্ষা করবে।
স্টু থম্পসন

10

আমি কোনও বিশেষজ্ঞ নই, তবে আমি রেড কন্ট্রোলার এবং স্টোরেজ অ্যারের সাথে আমার অভিজ্ঞতার ভিত্তিতে অন্ধকারে একটি বুনো শট নিতে যাচ্ছি।

ডিস্কগুলি বিভিন্নভাবে ব্যর্থ হয়। দুর্ভাগ্যক্রমে, ডিস্কগুলি ব্যর্থ হতে পারে বা ত্রুটিযুক্ত হতে পারে, যেখানে তাদের কর্মক্ষমতা গুরুতরভাবে প্রভাবিত হয় তবে RAID নিয়ামক ব্যর্থতা হিসাবে দেখেন না।

যদি ডিস্কটি সুস্পষ্ট উপায়ে ব্যর্থ হয় তবে ডিস্ক থেকে কোনও প্রতিক্রিয়া অভাব সনাক্ত করতে, পুল থেকে সরিয়ে এবং কোনও বিজ্ঞপ্তি ফায়ার করতে কোনও RAID কন্ট্রোলার সফ্টওয়্যার বেশ ভাল হওয়া উচিত। তবে, এখানে কী ঘটছে সে সম্পর্কে আমার ধারণাটি হ'ল ডিস্কটি একটি অস্বাভাবিক ব্যর্থতায় ভুগছে যা কোনও কারণে নিয়ামক পক্ষের একটি ব্যর্থতা ট্রিগার করে না। সুতরাং নিয়ন্ত্রক যখন প্রভাবিত ডিস্ক থেকে একটি লিখন ফ্লাশ বা একটি পঠন পরিচালনা করছেন, তখন ফিরে আসতে অনেক দিন সময় লাগবে এবং ফলস্বরূপ পুরো আইও অপারেটিং এবং তাই অ্যারেটি ঝুলিয়ে রাখবে। যে কারণেই হোক না কেন, এটি RAID কন্ট্রোলারের পক্ষে "আহ, ব্যর্থ ডিস্ক" যেতে যথেষ্ট নয়, সম্ভবত কারণ ডেটা শেষ পর্যন্ত ফিরে আসবে।

আমার পরামর্শটি হ'ল তাত্ক্ষণিক ব্যর্থ ডিস্কটি প্রতিস্থাপন করা। এর পরে, আমি আপনার রেড কার্ডের কনফিগারেশনটি একবার দেখে নেব (এটি 3 ওয়্যার, আমি ভেবেছিলাম এগুলি বেশ ভাল) এবং এটি ব্যর্থ ডিস্কটিকে কী বলে বিবেচনা করে তা সন্ধান করুন।

পিএস চমৎকার ধারণা ক্যাকটি মধ্যে স্মার্ট আমদানি।


একবার আমি বিন্দুগুলিকে সংযুক্ত করার পরে, আমি প্রথমে মনে করেছিলাম অ্যারে থেকে ডিস্কটি সরিয়ে ফেলা; গরম বাড়তি জায়গা ভরে গেল That এটাই গত রাত। আজ আমি ডিস্কটি টানলাম এবং এটি আরএমএ করলাম। আপত্তিজনক ড্রাইভ: geekomatic.ch/images/wd-re4-flux-read-error.jpg
স্টু থম্পসন

আমি মনে করি যে একটি কারণ প্রতিটি মিশন সমালোচনামূলক সিস্টেমের এমন একটি কার্ড থাকা দরকার যা ডেটা স্ক্রাব করে। আমি এটি গণনা করতে অনেকবার দেখেছি, বিশেষত SATA অ্যারেগুলিতে, তবে উচ্চতর প্রান্তের এসএএস ডিস্কগুলি নিয়ামককে ট্রিগার না করে ব্যর্থ বলে জানা গেছে।
জেনস এরিখ

7

আপনার এন্টারপ্রাইজ শ্রেণীর স্টোরেজ ডিভাইসের বৈশিষ্ট্যগুলি দরকার। বিশেষত, ডাব্লুডি আরই 4 এন্টারপ্রাইজ ড্রাইভের রেড অ্যারেগুলিতে এই আচরণটি প্রতিরোধ করার জন্য দুটি বৈশিষ্ট্য প্রয়োজন। নীচে তালিকাভুক্ত প্রথম প্রযুক্তিটি হার্ড ড্রাইভ যান্ত্রিক উপাদানগুলিতে অকারণে পরিধানের কারণ থেকে আবর্তিত সুরেলা কম্পনকে বাধা দেয়। দ্বিতীয় প্রযুক্তিটি হ'ল আপনার সমস্যাটি কী কারণে হয়েছে, এসটিএ প্রোটোকলে এই বৈশিষ্ট্যটি নেই। এই বৈশিষ্ট্যগুলি পেতে আপনার এসএএস দরকার এবং আপনি যদি এসএটিএ ড্রাইভগুলিকে জোর দেন তবে আপনি এসএএস এসএটি এসএটিএ ইন্টারপোজার কার্ড যেমন এলএসআইএসএস ৯২২২ তে কিনতে পারবেন।

বর্ধিত আরএএফএফ প্রযুক্তি পরিশীলিত ইলেকট্রনিক্সগুলি ড্রাইভটি নিরীক্ষণ করে এবং রিয়েল টাইমে রৈখিক এবং ঘূর্ণন কম্পন উভয়ই সংশোধন করে। ফলাফলটি পূর্ববর্তী প্রজন্মের ড্রাইভের তুলনায় উচ্চ কম্পন পরিবেশে কার্যকর পারফরম্যান্সের উন্নতি।

RAID- নির্দিষ্ট, সময়-সীমাবদ্ধ ত্রুটি পুনরুদ্ধার (TLER) ডেস্কটপ ড্রাইভে সাধারণ বর্ধিত হার্ড ড্রাইভ ত্রুটি-পুনরুদ্ধারের প্রক্রিয়াগুলির কারণে ঘটে যাওয়া ড্রাইভ ফলআউট প্রতিরোধ করে।

http://en.wikipedia.org/wiki/Error_recovery_control#Overview

এছাড়াও নীচের লিঙ্কটি দেখুন:

http://en.wikipedia.org/wiki/Error_recovery_control#Raid_Controllers

আরও দেখুন: ওয়েস্টার্ন ডিজিটাল টিএলআর ডকুমেন্ট ত্রুটি পুনরুদ্ধারের প্রক্রিয়া গভীরতার সাথে ব্যাখ্যা করে। ডাব্লুডি ক্যাভিয়ার RAID সংস্করণ সিরিয়াল এটিএ হার্ড ড্রাইভগুলিতে ত্রুটি পুনরুদ্ধার ফলস্বরূপ প্রতিরোধ:

http://www.3dfxzone.it/public/files/2579-001098.pdf


6

কেবলমাত্র অনুমান: হার্ডডিস্কগুলি ত্রুটির প্রতিবেদন না করে পড়ার ত্রুটিতে পুনরায় চেষ্টা করার জন্য কনফিগার করা হয়েছে। যদিও এটি একটি ডেস্কটপ সেটিংয়ে আকাঙ্ক্ষিত আচরণ, এটি একটি RAID- র ক্ষেত্রে প্রতিক্রিয়াশীল (যেখানে নিয়ামকের এমন কোনও সেক্টর পুনর্লিখন করা উচিত যা অন্যান্য ডিস্কগুলি থেকে পড়া ব্যর্থ হয়, তাই ড্রাইভটি এটি পুনরায় তৈরি করতে পারে)।


খুব সম্ভব। যদি তা হয় তবে এটি স্পষ্টতই শীতল নয় কারণ এগুলিকে "RAID সংস্করণ" ইউনিট হিসাবে উল্লেখ করা হয়। : |
স্টু থম্পসন

একেবারে শীতল নয়, কারণ সেটিংটি "RAID সংস্করণ" এর খুব সংজ্ঞা definition :)
সাইমন রিখটার

6

অন্ধকারে আমার শট:

  • ড্রাইভ 7 ব্যর্থ হয়। এটিতে কিছু ব্যর্থতা উইন্ডো রয়েছে যেখানে এটি উপলব্ধ নেই।

  • ড্রাইভ 8 এর কিছু 'লাইটার' ত্রুটিও রয়েছে; পুনরায় চেষ্টা করে সংশোধন করা হয়েছে।

  • RAID10 সাধারণত "বেশ কয়েকটি RAID1 জোড়ার একটি RAID0" হয়, একই জোড়ায় 7 এবং 8 সদস্য চালিত হয়?

যদি তা হয় তবে মনে হয় আপনি একই জোড়ায় দুটি ডিস্ক ব্যর্থতার ক্ষেত্রে "ঘটতে হবে না" আঘাত করেছেন hit প্রায় একমাত্র জিনিস যা একটি RAID10 হত্যা করতে পারে। দুর্ভাগ্যক্রমে, যদি আপনার সমস্ত ড্রাইভ একই শিপিং লট থেকে আসে তবে তারা একসাথে মারা যাওয়ার সম্ভাবনা আরও বেশি করে।

আমি অনুমান করি যে 7 ড্রাইভের ব্যর্থতার সময়, কন্ট্রোলার 8 টি ড্রাইভের জন্য পুনর্নির্দেশ করেছিল, তাই কোনও ত্রুটি-পুনরায় চেষ্টা বড় বিলম্বের ফলে হিমশীতল কাজের একটি হিমস্রোত সৃষ্টি করে এবং কিছুক্ষণের জন্য কর্মক্ষমতা হ্রাস করে।

আপনি ভাগ্যবান যে ড্রাইভ 8 এখনও মারা গেছে বলে মনে হয় না, তাই আপনার ডাটালাস ছাড়াই ঠিক করতে সক্ষম হওয়া উচিত।

আমি উভয় ড্রাইভ পরিবর্তন করে শুরু করব, এবং ক্যাবলিং পরীক্ষা করতে ভুলবেন না। একটি আলগা সংযোগ এটির কারণ হতে পারে এবং দৃ firm়ভাবে রুট না করা হলে, এটি সংলগ্ন ড্রাইভগুলিতে হওয়ার সম্ভাবনা বেশি। এছাড়াও, কয়েকটি মাল্টিপোর্ট কার্ডে বেশ কয়েকটি দ্বি-পোর্ট সংযোগকারী রয়েছে, যদি ড্রাইভ 7 এবং ড্রাইভ 8 একই থাকে তবে এটি আপনার সমস্যার উত্স হতে পারে।


3
ড্রাইভ 8 হ'ল এটি পরিষেবা বিঘ্ন ঘটায়, আমি ইতিমধ্যে এটি টেনে নিয়েছি। 7 ড্রাইভ করুন, যখন এটি কিছু সেক্টরকে হারিয়েছে, যেমন এই রাজ্যে কিছু সময়ের জন্য ছিল এবং এখনও সাধারণভাবে দুর্দান্ত পারফর্ম করছে। না, তারা ড্রাইভগুলি বিভিন্ন জোড়ায় রয়েছে। (এটি আমার ক্যাকটি / এসএনএমপি ক্যোয়ারীর সম্ভাব্য বিভ্রান্তির পাশাপাশি আমি বিবেচনা করেছি)) কার্ডটিতে ব্যাক পেইনে 16 টি বন্দর, 4 কেবল, 4 টি পোর্ট রয়েছে cable সমস্যাটি যদি কার্ড, কেবল বা ব্যাকপেন হয় তবে আমি ড্রাইভ 8 এর প্রতিস্থাপন সন্নিবেশ করানোর সময় খুব শীঘ্রই যথেষ্ট জানব।
স্টু থম্পসন

3

সাতা ইন্টারপোজার কার্ডগুলি হ'ল আরেকটি সমাধান।

আমি সম্প্রতি খুব একই পরিণতিটি अनुभव করেছি এবং এই থ্রেডটি পেয়েছি। সামগ্রিক টেনারটি হ'ল এসএএস প্রোটোকলটি এসএটিএর চেয়ে রেডের জন্য আরও উপযুক্ত, কারণ এসএটিএর বৈশিষ্ট্যগুলির অভাব রয়েছে। এ কারণেই একই শারীরিক ড্রাইভগুলি এসএএস নিয়ন্ত্রণকারীদের সাথে সজ্জিত করা হয়, তারপরে নিকটলাইন এসএএস হিসাবে বিক্রি করা হয়।

আরও অনুসন্ধান করে, আমি পেয়েছি:

http://www.lsi.com/products/storagecomponents/Pages/LSISS9252.aspx

আমি এগুলির একটি ব্যাচ দিয়ে আমার একটি স্টোরকে আপগ্রেড করতে তদন্ত করছি। এখনই, 3 টিবি সাটা বনাম এসএএস-এর মধ্যে দামের পার্থক্য 400% (ভ্যানিলা দাম, একই ব্র্যান্ড, চশমা এবং দোকান, জার্মানি)। আমি অবশ্যই বলতে পারি না যে এই কৌশলটি ভালভাবে কার্যকর হয়েছে কিনা তবে এটি চেষ্টা করার মতো worth

মন্তব্য খুব স্বাগত :-)


1
ভাল সুন্দর তত্ত্ব। কিছু তথ্য সংগ্রহের পরে, কেবল স্টোরেজ ট্রে নির্মাতারা এই বোর্ডগুলিকে একীভূত করতে পারে এবং এগুলি যুক্ত করার পরে আরও ভাল ত্রুটি পরিচালনার অর্থ এই নয়।
কর্কম্যান

2

আমি ভাঙা ইলেক্ট্রনিক্স সহ একটি এসটিএ ডিস্কটি দেখেছি যে কোনও আরেকা 12 কিছু দৃly়তার সাথে ফার্মওয়্যার আইকিকে লকআপ করে রেখেছি, বাইনারিতে ডিস্কগুলি টেনে বের করে আপত্তিজনক হার্ডড্রাইভ পাওয়া না যাওয়া পর্যন্ত বায়োসকে কোনও মাধ্যম থেকে বুট করার অনুমতি দেওয়া হয়নি until অনুসন্ধান ফ্যাশন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.