নিয়মিত লগিং সিস্টেমের পাশাপাশি বিটিআরএফএসের স্ট্যাটাস কমান্ডও রয়েছে, যা প্রতি ড্রাইভে ত্রুটিগুলি (পড়া, লেখার এবং দুর্নীতি / চেকসাম ত্রুটি সহ) ট্র্যাক করে রাখে:
# btrfs device stats /
[/dev/mapper/luks-123].write_io_errs 0
[/dev/mapper/luks-123].read_io_errs 0
[/dev/mapper/luks-123].flush_io_errs 0
[/dev/mapper/luks-123].corruption_errs 0
[/dev/mapper/luks-123].generation_errs 0
সুতরাং আপনি একটি সহজ রুট ক্রোনজব তৈরি করতে পারেন:
MAILTO=admin@myserver.com
@hourly /sbin/btrfs device stats /data | grep -vE ' 0$'
এটি প্রতি ঘণ্টায় ইতিবাচক ত্রুটির পরিমাণ গণনা করবে এবং আপনাকে একটি ইমেল প্রেরণ করবে। স্পষ্টতই, আপনি ইমেল বিজ্ঞপ্তিটি কাজ করে কিনা তা যাচাই করতে আপনি এই জাতীয় দৃশ্যের (উদাহরণস্বরূপ দুর্নীতি সৃষ্টি বা গ্রেপ অপসারণের মাধ্যমে) পরীক্ষা করবেন।
এছাড়াও, বিটিআরএফএস (যেমন চেকসামিং রয়েছে) এর মতো উন্নত ফাইল সিস্টেমের সাথে খারাপ ড্রাইভের কারণে নিঃশব্দ দুর্নীতি শনাক্ত করতে প্রতি সপ্তাহে কয়েক সপ্তাহ পরপর একটি স্ক্রাব নির্ধারণ করার পরামর্শ দেওয়া হয়।
@monthly /sbin/btrfs scrub start -Bq /data
-B
বিকল্প পুরোভূমিতে মাজা রাখা হবে, যাতে আপনি ফলাফল ইমেল ক্রন আপনাকে যা পাঠায় দেখতে পাবে। অন্যথায়, এটি ব্যাকগ্রাউন্ডে চলবে এবং ফলাফলগুলি ইমেলটিতে না থাকায় আপনাকে ম্যানুয়ালি মনে রাখতে হবে।
আপডেট : মাইকেল কেজারলিংয়ের পরামর্শ অনুসারে উন্নত গ্রেপ, ধন্যবাদ।
আপডেট 2 : স্ক্রাবিং সম্পর্কিত বনাম নিয়মিত পড়ার ক্রিয়াকলাপে অতিরিক্ত নোট (এটি কেবলমাত্র বিটিআরএফএসের ক্ষেত্রে প্রযোজ্য নয়):
Ioan দ্বারা নির্দেশিত হিসাবে, একটি স্ক্রাব বেশিরভাগ সময় নিতে পারে, অ্যারের আকার এবং ধরণের উপর নির্ভর করে (এবং অন্যান্য কারণগুলি), কিছু ক্ষেত্রে এমনকি এক দিনেরও বেশি। এবং এটি একটি সক্রিয় স্ক্যান, এটি ভবিষ্যতের ত্রুটিগুলি সনাক্ত করতে পারে না - একটি স্ক্রাবের লক্ষ্য হ'ল সময়টিতে আপনার ড্রাইভে ত্রুটিগুলি সন্ধান করা এবং সংশোধন করা। তবে অন্যান্য RAID সিস্টেমের মতো, পর্যায়ক্রমিক স্ক্রাবগুলি নির্ধারণ করার প্রস্তাব দেওয়া হয়। এটি সত্য যে কোনও ফাইল পড়ার মতো একটি সাধারণ i / o অপারেশন, যা পড়েছিল তা আসলেই সঠিক কিনা তা পরীক্ষা করে। তবে একটি সহজ আয়না বিবেচনা করুন - যদি ফাইলটির প্রথম অনুলিপিটি ক্ষতিগ্রস্থ হয়, সম্ভবত এমন কোনও ড্রাইভ দ্বারা মারা যেতে পারে যা দ্বিতীয়টি অনুলিপিটি সঠিকভাবে বিটিআরএফএস দ্বারা পড়েছে, তবে বিটিআরএফএস জানতে পারবে না যে দুর্নীতি রয়েছে একটি ড্রাইভে। এটি কেবলমাত্র অনুরোধ করা ডেটা প্রাপ্ত হওয়ার কারণে,এর অর্থ হ'ল আপনি যদি এমন কোনও ফাইল বিশেষভাবে পড়েন যা আপনি জানেন যে একটি ড্রাইভে দূষিত হয়েছে, তবুও কোনও গ্যারান্টি নেই যে এই রিড অপারেশন দ্বারা দুর্নীতি সনাক্ত করা হবে।
এখন, ধরে নেওয়া যাক বিটিআরএফএস কেবল কখনওই ভাল ড্রাইভ থেকে পড়ে, কোনও স্ক্রাব চালিত হয় না যা খারাপ ড্রাইভের ক্ষতি সনাক্ত করতে পারে, এবং ভাল ড্রাইভটিও খারাপ হয় - ফলাফলটি ডেটা ক্ষতি হতে পারে (কমপক্ষে বিটিআরএফএস জানত) কোন ফাইলগুলি এখনও সঠিক এবং এখনও সেগুলি পড়ার অনুমতি দেবে)। অবশ্যই এটি একটি সরল উদাহরণ; বাস্তবে, বিটিআরএফএস সর্বদা একটি ড্রাইভ থেকে পড়বে না এবং অন্যটিকে উপেক্ষা করবে না।
তবে মূল বিষয়টি হ'ল পর্যায়ক্রমিক স্ক্রাবগুলি গুরুত্বপূর্ণ কারণ তারা নিয়মিত পড়ার ক্রিয়াকলাপগুলি প্রয়োজনীয়ভাবে সনাক্ত করতে পারে না এমন ত্রুটিগুলি খুঁজে পাবেন (এবং ঠিক করুন)।
ফল্ট ড্রাইভ : যেহেতু এই প্রশ্নটি বেশ জনপ্রিয়, আমি উল্লেখ করতে চাই যে এই "মনিটরিং সলিউশন" সম্ভবত খারাপ ড্রাইভগুলির সমস্যা সনাক্তকরণের জন্য (উদাহরণস্বরূপ, মরণ ড্রাইভে ত্রুটি সৃষ্টি করে তবে অ্যাক্সেসযোগ্য)।
অন্যদিকে, যদি কোনও ড্রাইভ হঠাৎ করে চলে যায় (মারা যায় এবং ত্রুটি তৈরির তুলনায় সংযোগ বিচ্ছিন্ন বা সম্পূর্ণ মৃত), এটি একটি ত্রুটিযুক্ত ড্রাইভ হবে (জেডএফএস এ জাতীয় ড্রাইভকে ফল্ট হিসাবে চিহ্নিত করবে)। দুর্ভাগ্যক্রমে, বিটিআরএফএস বুঝতে পারে না যে ফাইল সিস্টেমটি মাউন্ট করার সময় একটি ড্রাইভ চলে গেছে, যেমন 09/2015 থেকে এই মেইলিং তালিকা এন্ট্রিতে উল্লেখ করা হয়েছে (এটি সম্ভবত প্যাচ করা হয়েছে):
পার্থক্যটি হ'ল আমাদের কাছে মাউন্টে উপস্থিত কোনও ডিভাইস সনাক্ত করার কোড নেই, এটি একটি মাউন্ট করা ফাইল সিস্টেমে ড্রপ নামার শনাক্ত করার জন্য আমাদের কাছে কোড (এখনও) নেই। অদৃশ্য হয়ে যাওয়া কোনও ডিভাইসটির যথাযথ শনাক্তকরণ কেন অগ্রাধিকার হিসাবে দেখা যাচ্ছে না, আমার কোনও ধারণা নেই, তবে এটি মাউন্ট আচরণ থেকে পৃথক সমস্যা।
https://www.mail-archive.com/linux-btrfs@vger.kernel.org/msg46598.html
ততক্ষণে ডেমসগে অনেকগুলি ত্রুটি বার্তা উপস্থিত থাকবে, তাই ডেমসেগ গ্রেপিং নির্ভরযোগ্য নাও হতে পারে।
বিটিআরএসএফ ব্যবহার করে এমন কোনও সার্ভারের জন্য, ক্রেডিট চেক (ক্রোন জব) থাকা একটি ধারণা হতে পারে যা RAID অ্যারেতে অন্তত একটি ড্রাইভ চলে গেছে, অর্থাৎ আর অ্যাক্সেসযোগ্য না হলে সতর্কতা পাঠায় ...