Fsck কখন বিপজ্জনক?


37

সাম্প্রতিক সমস্যাগুলির ফলস্বরূপ আমি প্রত্যন্ত ডেটাসেন্টারের একটি মেশিনের রুট ফাইল সিস্টেমটি কেবল রিড-রিড-রিমোট পেতে দেখলাম।

পুনরায় বুট করার সময়, এই ত্রুটিটি দেখানো হয়েছিল:

UNEXPECTED INCONSISTENCY: RUN fsck MANUALLY (i.e., without -a or -p options)

প্রস্তাবিত হিসাবে fsck চালানোর পরে এবং নিজেই সংশোধনগুলি গ্রহণ করার পরে Y, ত্রুটিগুলি সংশোধন করা হয়েছিল এবং সিস্টেমটি এখন ঠিক আছে।

এখন, আমি মনে করি যে যদি fsck সমস্ত কিছু স্বয়ংক্রিয়ভাবে চালনা ও মেরামত করার জন্য কনফিগার করা থাকে তবে কিছু ক্ষেত্রে একমাত্র বিকল্প (যেমন এর মতো) ব্যক্তিগতভাবে দূরবর্তী ডেটাসেটারে চলেছে এবং আক্রান্ত মেশিনে একটি কনসোল সংযুক্ত করে।

আমার প্রশ্ন হ'ল ডিফল্টরূপে fsck ম্যানুয়াল হস্তক্ষেপের জন্য কেন জিজ্ঞাসা করে? এই জাতীয় প্রোগ্রাম দ্বারা সংশোধন করা কখন এবং কীভাবে নিরাপদ হবে? সিসাদমিন কিছু সময়ের জন্য (অন্য কোনও ক্রিয়াকলাপ সম্পাদন করার জন্য) কোনও প্রস্তাবিত সংশোধন বাদ দিতে বা এটি পুরোপুরি বাতিল করতে চাইতে পারে এমন কোনটি ক্ষেত্রে?


15
যদি বিকাশকারীরা 100% আত্মবিশ্বাসী হন তবে ত্রুটিটি স্বয়ংক্রিয়ভাবে ঠিক হয়ে যেতে পারে তবে এটি প্রথম স্থানে ত্রুটি হবে না।
ব্যবহারকারী 253751

উত্তর:


42

fsckঅন্তর্নিহিত হার্ডওয়্যার একরকম ক্ষতিগ্রস্থ হলে অবশ্যই অবশ্যই ভালের চেয়ে বেশি ক্ষতি সাধন করে; খারাপ সিপিইউ, খারাপ র‌্যাম, একটি ডাইটিং হার্ড ড্রাইভ, ডিস্ক নিয়ামক খারাপ হয়ে গেছে ... এই ক্ষেত্রে আরও দুর্নীতি অনিবার্য।

যদি সন্দেহ হয়, কেবলমাত্র dd_rescueঅন্য কোনও সরঞ্জামের সাথে দূষিত ডিস্কের চিত্র নেওয়া ভাল ধারণা এবং তারপর আপনি সেই চিত্রটি সফলভাবে ঠিক করতে পারেন কিনা তা দেখুন। এইভাবে আপনার এখনও মূল সেটআপ উপলব্ধ।


4
আমি ব্যর্থ হার্ডওয়্যার সাথে অনেক কাজ করেছি এবং আমি এটির সাথে একমত আছি। আমি শেষ কাজটি করতে চাই তা হ'ল যদি কোনও ধরণের খারাপ হার্ডওয়্যার সন্দেহ হয়। আমি একটি স্বল্প বিদ্যুত ইভেন্ট এবং পরবর্তী পুনরুদ্ধারও দেখেছি যা স্বয়ংক্রিয় fsck দ্বারা দেরীতে ছিল।
জর্ফাস

একটি কংক্রিট উদাহরণ দেওয়ার জন্য: আমি একটি ডিস্ক কন্ট্রোলারের সাথে এমন একটি মেশিনে কাজ করেছি যে "এলোমেলোভাবে" (10 ^ 5 এর মধ্যে প্রায় 1 বার) কোনও ডিভাইসে XXXXXXYY- কে ব্লক করতে একটি লেখা বা একটি লিখনকে 000000YY- এ ব্লক করতে লিখতে পরিণত করবে প্রথম ডিভাইস উদাহরণস্বরূপ, এটি প্রায়শই বুট সেক্টর এবং বুট ডিস্কের বিভিন্ন সমালোচনামূলক ফাইল সিস্টেমের কাঠামোগত কাঠামোগত ভুল এবং কাঠামোগত ভুল তথ্য ব্লাস্ট করে। এ জাতীয় পরিস্থিতিতে (কয়েক মিলিয়ন পঠন) এফএসকে চালানো তথ্য পুনরুদ্ধারের যে কোনও সম্ভাবনা বাদ দিতে পারে।
এরিক টাওয়ার

2
10 ^ 5 এ 1 হ'ল ... এটি এখন পর্যন্ত 10 বাইট এমবি।
নেলসন

1
@ নেলসন: এটি এর সাজান ... ইউনিটটি "একক ব্লক স্থানান্তর" রয়েছে, "বাইটস" নয়। সুতরাং দশটি খারাপ ব্লক প্রতি মিলিয়ন ব্লকে লিখে (এবং ব্লকগুলি বাইটের চেয়ে উল্লেখযোগ্য পরিমাণে বড়)।
এরিক টাওয়ার

21

আপনি যেখানে কাজ করেছেন তার একটি উদাহরণ দেখেছেন fsck, তবে আমি যথেষ্ট ক্ষতিগ্রস্থ ফাইল সিস্টেম দেখেছি যেখানে এটি সফলভাবে কাজ করে না। যদি এটি পুরোপুরি স্বয়ংক্রিয়ভাবে কাজ করে, আপনার কাছে ddডিস্ক ডাম্পের মতো জিনিস বা এমন কিছু করার কোনও সুযোগ নেই যা বেশিরভাগ ক্ষেত্রে মেরামতের চেষ্টা করার আগে করণীয় একটি দুর্দান্ত ধারণা।

এটি কখনও না, কখনও কখনও এমন স্বয়ংক্রিয়র মতো কিছু চেষ্টা করা ভাল ধারণা।

ওহ, এবং আধুনিক সার্ভারগুলিতে সার্ভারে কেভিএম র‌্যাকটি লাগিয়ে না ফেলে এমন কিছু থেকে পুনরুদ্ধারের জন্য দূরবর্তী কনসোল বা কমপক্ষে স্বতন্ত্র উদ্ধার ব্যবস্থা থাকা উচিত।


7
আসলে, যা ভাল নয় তা হ'ল কখনই নয়, কখনই সত্য বলা হয় না isn't ব্যবহারের ক্ষেত্রে এটি একটি ভাল ধারণা: সমস্যার ক্ষেত্রে সার্ভারের প্রধান পার্টিশনগুলি স্ক্র্যাচ থেকে দ্রুত পুনরায় তৈরি করা যেতে পারে। প্রকৃতপক্ষে গুরুত্বপূর্ণ ডেটাটি একটি রিমোট ফাইল সিস্টেমের মাধ্যমে অ্যাক্সেস পায়, সেই ডেটার জন্য যথাযথ অপ্রয়োজনীয়তা। আমি বরং সুযোগ নিতাম fsck -p /এবং fsck -p /varইত্যাদি, সূক্ষ্ম কাজ করা, এবং ম্যানুয়াল হস্তক্ষেপ ছাড়াই সার্ভার আপ পেয়ে, এবং সেই পার্টিশন যা আমি শুধু পুনরায় তৈরি করতে পারেন প্রয়োজনে গুরুত্বপূর্ণ বিপর্যয়ের ছোট, নন-জিরো% সম্ভাবনা ঝুঁকি ।
তোগাম

1
যদি সিস্টেমটি সহজেই ইনস্টল করা যায় তবে আমি কেবল এটিই করি ...
সোভেন

1
এতে বেশি সময় লাগবে। বিকল্পগুলি হ'ল: ক) এটি স্বয়ংক্রিয়ভাবে করার ঝুঁকি। খ) কাউকে fsckপ্রেন করতে বলুন , এবং তারপরে সবকিছু ঠিকঠাক হয়ে যায়। যদি তা হয় তবে প্রায় 2 মিনিট সময় নেয়। ডাউনটাইম যতক্ষণ না এটি ঘটে। গ) অপারেটিং সিস্টেমটি পুনরায় ইনস্টল করুন। 30+ মিনিট সময় নেয়। আপনি সি বিকল্প নির্বাচন করছেন? সম্ভবত আমাদের কাছে একটি মূল পার্থক্য হ'ল fsckআপনি নিজের উত্তরে যা উদ্ধৃত করেছেন তার চেয়ে অনেক বেশি সময় আমি কাজ করেছি । আমার মূল বক্তব্যটি সিস্টেম ডিজাইন ছিল না (এই সস্তা-ও সিস্টেমটি রিমোট কনসোল ব্যবহার করে না), তবে কেবল " কখনই না, কখনও " বলা খুব শক্ত বাক্য ছিল যা সঠিক ছিল না
তোগাম

আসুন শুধু মতানৈক্য করতে রাজি।
সোভেন

0

প্রথমত, আপনার বুঝতে হবে যে আধুনিক (জার্নালাইজড) ফাইল সিস্টেমের সাহায্যে একটি সিস্টেম ক্র্যাশ ফাইল সিস্টেমকে ক্ষতিগ্রস্থ করবে না এবং বুট করার সময় কোনও fsck প্রয়োজন হবে না।

Ext3, Ext4, ZFS, btrfs, xfs এবং সমস্ত আধুনিক এফএস ক্র্যাশ বা সিস্টেম রিসেটের পরে 100% সামঞ্জস্যপূর্ণ।

Ext2 বা vfat এর মতো অ জার্নালাইজড এফএস সিস্টেম রুটফের জন্য একটি বড় এনজিওও।

এখন, আপনার সিস্টেমে বুট করার সময় যদি একটি fsck প্রয়োজন হয়, আপনার নিজের জিজ্ঞাসা করা উচিত: প্রথমে এর কারণ কী ছিল?

আপনার কার্নেল লগগুলি পরে, কখন এবং কী হয়েছে তা অনুসন্ধান করার জন্য। ত্রুটিটি কখন থেকে শুরু হয়েছিল সেই সময় থেকে আপনাকে লগগুলিতে সময়ে ফিরে যেতে হবে। আপনার ডিস্কগুলি স্মার্টেক্টেলের সাহায্যে পরীক্ষা করা উচিত। ইত্যাদি ... আপনার যদি জার্নালাইজড fs এ fsck দরকার হয় তবে এটি কার্যত নিশ্চিত যে আপনার হার্ডওয়্যারটি ব্যর্থ হচ্ছে, ধরে নিলেন fs কোনও অ্যাডমিন দ্বারা (ডিডির মতো ব্লক-স্তরের সরঞ্জাম সহ) বা কোনও বাগ দ্বারা ক্ষতিগ্রস্থ হয়নি।

সুতরাং মূল কারণ অনুসন্ধান (ত্রুটিযুক্ত হার্ডওয়্যার / ফার্মওয়্যার / সফ্টওয়্যার প্রতিস্থাপন / আপগ্রেড করে) তদন্ত ও সমাধান না করেই সমস্যার "সমাধান" করতে fsck ব্যবহার করা বোকামি।

একটি fsck করা, বুট শেষ এবং খুশি হওয়া কমপক্ষে বলার জন্য নির্দোষ। "আপনি যে উদ্ধৃতি দিয়েছিলেন তার চেয়ে অনেক বেশি শতাংশ আমি fsck কাজ করেছিলাম" উল্লেখ করে "fsck কাজ" দিয়ে আপনার অর্থ কী তা আমাকে ভাবিয়ে তুলছে making প্রক্রিয়াটিতে কিছু ফাইল এবং ডেটা হারিয়ে আপনার fsck একটি সুসংগত অবস্থায় ফিরিয়ে আনতে পারে ... আপনি কি ব্যাকআপের সাথে তুলনা করেছেন? অনেক লোক ফাইলগুলি আলগা করে বা ফাইল ডেটা দুর্নীতির বিষয়টি নজরে না নিয়েই পেয়ে যায় ...

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.