ভয়াবহ পরিস্থিতি - একাধিক স্বতন্ত্র ওএস দৃষ্টান্তে ফাইল সিস্টেম একসাথে মাউন্ট করা হয়েছে


14

আমি কীভাবে নিরাপদে এই পরিস্থিতি থেকে মুক্তি পাব?

বিশদগুলি নিম্নরূপ:

একটি জেন ​​সার্ভার ভিএমএসে বরাদ্দকৃত ব্লক ডিভাইস পেয়েছে। তবে এই ডিভাইসগুলি জেনের অভ্যন্তরেও মাউন্ট করা হয়েছে।

বাস্তবে এর মধ্যে 44 টি ব্লক ডিভাইস এইভাবে মাউন্ট করা হয়েছে। বিষয়টিকে আরও খারাপ করার জন্য, প্রতিটি শারীরিক ডিভাইস 4 টি পাথের ওপরে দেখা যায় এবং সেগুলির প্রতিটি পৃথক মাউন্টপয়েন্টে স্থাপন করা হয়। অন্য কথায় ডিভাইসগুলি আসলে প্রতিটি 5 বার মাউন্ট করা হয়।

ভিএম গেস্ট ওএস পাওয়ারপাথ সিউডো ডিভাইসটির মাধ্যমে পাথটি দেখায় (ডাইএমইউতে একটি ফাই: ব্লক ডিভাইস হিসাবে বরাদ্দ)

কিছু ডিভাইস ext2 এবং রিসফারফ হিসাবে ফর্ম্যাট করা হয়।

এখানে আমাকে ফাইল সিস্টেমের দুর্নীতির ঝুঁকির সাথে ব্যাখ্যা করার দরকার নেই।

আমি আশঙ্কা করছি যে কেবল ফাইল সিস্টেমগুলি আনমাউন্ট করা এমনকি দুর্নীতির কারণ হতে পারে এবং মনে করে যে এই মুহুর্তে হোস্টের কাছ থেকে শক্তি টানাই সবচেয়ে নিরাপদ বিকল্প

নোট করুন যে অ্যাপ্লিকেশনগুলি, বেশিরভাগ অংশের জন্য ওরাকল ডাটাবেসগুলি, সমস্ত ভিএমগুলিতে এখনও চলছে এবং ব্যবহৃত হচ্ছে।

Dom0 এ উচ্চ সিপিইউ ব্যবহারের তদন্ত করার সময় আমি এটি আবিষ্কার করেছি। Cwd -> / মিডিয়া / ডিস্ক -12 সহ একটি অবিচ্ছেদ্য "ফাইন্ড" প্রক্রিয়া রয়েছে যা / dev / sdf1 থেকে মাউন্ট করা থাকে যা / dev / emcprr এর অন্তর্গত

যে কেউ জিজ্ঞাসা করার আগে, একবার আমি দেখেছি যে প্রসেসগুলি হত্যা করা যায় না এবং সিপিইউ এবং র‌্যাম ব্যবহার করা অবিরত করা যায় না (ত্রুটিযুক্ত / জম্বি প্রক্রিয়াটির বিপরীতে), যখন অপ্রকাশিত আই / ওএস থাকে, উদাহরণস্বরূপ সিঙ্কটি ফিরে আসে তবে শারীরিকভাবে ডিস্কে এখনও আসে না । সাধারণত টেপ আই / ও-তে ঘটে থাকে।

প্রস্তাবনা !?

পিএস আমি কী এই ধরণের জিনিসটি প্রতিরোধ করার জন্য ডিভাইসগুলি একবার "সংরক্ষিত" হয়ে উঠবেন? নাকি লিনাক্সে এটা সম্ভব নয়?

সম্পাদনা: প্রথমত আমি নিশ্চিত যে হাইপারভাইজারের মধ্যে কে-ডি-ই হ'ল অপরাধী। দেখে মনে হচ্ছে যে ডেস্কটপ আইকন তৈরি করার জন্য কে-ডি-ই ডিভাইসগুলি লগিংয়ের জন্য মাউন্ট করছে। অন্যান্য জেন সার্ভারে একই জিনিসটি ঘটছে না, তবে অন্যান্য সমস্ত সার্ভারগুলি এসইএলএস এবং কেডিএর অনেক পুরানো সংস্করণ চলছে ... ৩.৪ আরও ভাল আচরণ করে V4 আপত্তিজনক বলে মনে হচ্ছে)।

তদতিরিক্ত দুটি অ-সমালোচক ভিএম হ্যাঙ্গ হয়ে গেছে। এগুলি বন্ধ করার পরে ফাইল সিস্টেমের দুর্নীতির কারণে তারা আর বুট শুরু করবে না। প্রধান / উত্পাদন ভিএম এখনও চলছে এবং এর ডেটাবেস এখনও কাজ করছে, তবে স্পষ্টতই এটি একটি টাইম বোমা। গ্রাহক অন্য সার্ভারের অন্য ভিএম-তে পরিবেশটি পুনঃনির্মাণের চেষ্টা করছেন তবে কয়েকটি উপাদান কনফিগার করার বিষয়ে আটকে আছেন, তাই আমরা অপেক্ষা করছি ...

যাই হোক না কেন আমি অনুভব করি যে এর উত্তরের কোনও উত্তরই এখন পর্যন্ত "সেরা অনুশীলনটি সর্বদা নিখুঁতভাবে বন্ধ করা হয়" এর চেয়ে বেশি হয় নি এবং আমি আরও দৃ concrete়তর কিছু পাওয়ার আশাবাদী ... যাইহোক, আমি অনুভব করি যে এই পরিস্থিতি কিছুটা আরও সতর্কতার জন্য ওয়ারেন্ট দিতে পারে চিন্তা। বিশেষত ফাইল সিস্টেমের মেটা ডেটা আপডেটগুলি হাইপারভাইজারের কাছ থেকে সিঙ্ক করার জন্য এবং সম্ভাব্যভাবে বড় ফাইল সিস্টেমের দুর্নীতির কারণ হয়ে দাঁড়াবে কি?


1
এবং এই মুহুর্তে "শাট ডাউন" এর আগে নেওয়া কোনও ব্যাকআপগুলি সম্ভবত সহজেই নষ্ট হওয়া ডেটা ব্যাকআপ করতে পারে, যদিও এই পরিস্থিতিতে ফাইলের সামগ্রীগুলির চেয়ে ফাইল সিস্টেমের মেটা-ডেটা নষ্ট হয়ে যায় more
জোহান

আমি আশঙ্কা করছি আপনি যে কোনও ক্ষেত্রে কমপক্ষে কিছু ডেটা হারাতে চলেছেন। হোস্টকে শারীরিকভাবে বন্ধ করা বা ভিএমগুলি জোর করে শেষ করে দেওয়ার ফলে সমস্ত কিছু গণ্ডগোলের অযাচিত পরিণতি হতে পারে (যেমন এমনকি সেই ফাইল সিস্টেমগুলি যা কেবল একবার মাউন্ট করা আছে)। ক্ষতির পরিমাণ কমাতে আমি যতদূর সম্ভব পরিষ্কারভাবে সবকিছু শেষ করার চেষ্টা করব। এবং অবশ্যই তা নিশ্চিত হচ্ছে না যে এটি আবার না ঘটে।
পিটার্ফ

এটি প্রতিরোধের জন্য, IIUC আপনি অতিথির মাধ্যমে একবার এটি ডিভাইসে অনুমতি স্থাপন করার চেষ্টা করতে পারেন , তবে যেহেতু fs অনুমতিগুলি (ডিভাইস ফাইলগুলিতে) মূল দ্বারা অতিক্রম করা যেতে পারে (যদি আপনার প্যাচ করা কার্নেল না থাকে) এটি হতে পারে সাহায্য করার দরকার নেই।
পিটার্ফ

1
আপনার পোস্টের স্ক্রিপ্ট সম্পর্কিত: যদি ডিভাইসগুলি একাধিক পাথের মাধ্যমে দৃশ্যমান হয় তবে কার্নেল সম্ভবত এটিও জানেন না যে তারা সমস্ত একই ডিভাইস, তাই এটি কীভাবে এটি "রিজার্ভ" করতে পারে? কোনও ডিভাইস dom0 থেকে একাধিক domUs রফতানি করার ক্ষেত্রে, এটি আপনাকে এটি করতে দেয় কারণ আপনি সম্ভবত এটি উদ্দেশ্য হিসাবে করতে চেয়েছিলেন (যেমন কোনও ফাইল সিস্টেম যা এটি সমর্থন করে, বা কেবলমাত্র পঠনযোগ্য কেবল সর্বত্র)।
সেলেদা

@ ক্যালাডা আমি ভেবেছিলাম, তবে "লকিং" ডিভাইসগুলির উপায় রয়েছে: পাওয়ারপথকে (সোলারিসের ক্ষেত্রে করা উচিত) কোনও ডিভাইসের সমস্ত প্যারেন্ট-পাথ সংরক্ষণ করা উচিত (সময়ে এটি আরম্ভ হয়)। অতিরিক্তভাবে এসসিএসআই "রিজার্ভ" কমান্ডগুলি লক্ষ্য ডিভাইস দ্বারা পরিচালিত হয়, সুতরাং একবার লক্ষ্য সংরক্ষণ করা হলে, সেই ডিভাইসের কোনও পাথের বিরুদ্ধে সংরক্ষণের অনুমতি দিতে অস্বীকার করা উচিত। কমপক্ষে এটি আমার সীমাবদ্ধ বোঝাপড়া।
জোহান

উত্তর:


2

যদি ডিস্কগুলি একটি একক মাউন্ট পয়েন্ট থেকে লেখা হয় তবে কোনও ক্ষতি করা হবে না। একটি পরিষ্কার শাটডাউন করুন, (যদি স্থির থাকে তবে তা ব্যাক আপ করুন) যদি মাউন্টগুলি ঠিক করে দেয়। Dom0 এ খালি প্রয়োজনীয় অ্যাপ্লিকেশন ব্যতীত আর কিছু চালাবেন না। যদি ওটিওএইচ, পার্টিশনগুলি একাধিক পাথ থেকে লেখা হচ্ছে, এটি খারাপ এবং দ্বিতীয়টি দ্বারা খারাপ হতে চলেছে। প্লাগ টি টান.


0

আমার কোন দৃ concrete় কারণ নেই তবে আমার অন্ত্র-অনুভূতি আমাকে বলে যে নিম্নলিখিতটি সর্বোত্তম পদ্ধতির হতে পারে:

  1. অ্যাপ্লিকেশন বন্ধ করুন।
  2. নেটওয়ার্কের মাধ্যমে ভিএম থেকে সমস্ত ডেটা একটি ব্যাকআপ স্থানে অনুলিপি করুন।
  3. ভিএম এর মধ্যে থেকে ফাইল সিস্টেমগুলি আন-মাউন্ট করুন।
  4. ভিএম বন্ধ করুন। (এই হোস্টটিতে এখন কেবলমাত্র একটি ভিএম চলছে)
  5. নিশ্চিত করুন যে কোনও ডমইউ স্বয়ংক্রিয়ভাবে শুরু হওয়ার জন্য সেট করা নেই।
  6. হাইপারভাইজারকে কোনও "সমাপ্তি" ক্রিয়া সম্পাদন, বকেয়া আই / ও এর সিঙ্ক ইত্যাদি প্রতিরোধের জন্য হোস্টের শক্তিটি টানুন etc.
  7. ভিএম বুট আপ করুন, এই আশায় যে হাইপারভাইজার নিজেই পাওয়ার-ইয়াঙ্কে বেঁচে থাকবে।
  8. যদি এটি ব্যর্থ হয়, পরিবেশটি আবার তৈরি করুন। (ভিএমএস বুট ডিস্কগুলি ফাইল ভিত্তিক, তবে ডেটা মাউন্ট পয়েন্টগুলি ব্লক ডিভাইস হিসাবে বরাদ্দ হওয়া বাহ্যিক ডিস্কে থাকে)
  9. হাইপারভাইজারটি ডোমইউ সম্পর্কিত কোনও ফাইল সিস্টেম মাউন্ট করছে কিনা তা পরীক্ষা করুন। কোনও ডমইউ শুরু হওয়ার আগে এগুলি আন-মাউন্ট করুন)
  10. কে-ডি-কে স্বতঃ-মাউন্টিং বন্ধ করুন।
  11. ভিএম শুরু করুন এবং একটি পূর্ণ এফএস চেক জোর করুন।

11 এর বিকল্প: ভিএম স্টার্ট-আপ করুন এবং সম্পূর্ণ fsck ছাড়াই ফাইল সিস্টেমগুলি মাউন্ট করুন।

যুক্তিটি হ'ল আমি চাই না যে জেন হাইপারভাইজারের এমন আরও কোনও সুযোগ থাকুক যা ডমইউ ফাইল সিস্টেমে দুর্নীতি ঘটাতে একেবারে প্রয়োজনীয়।


0

আমি কোনও জেন বিশেষজ্ঞ নই এবং এটির সাথে এখনও আমার কোনও অভিজ্ঞতা নেই। তবে আমি আপনার জায়গায় থাকলে আমার পদ্ধতির বিষয়টি হবে: প্রথমে আমি জানি আমি ডেটা হারাতে পারি (সম্ভবত সমস্ত কিছু); দ্বিতীয়ত আমি স্ন্যাপশট তৈরি করার চেষ্টা করব এবং তারপরে ভিএমগুলি স্থগিত করে, নিরাপদ ভিন্ন পরিবেশে পুনরুদ্ধার করব।
আমি আপনাকে মিথ্যা আশা দিতে চাই না, তবে আমি মনে করি আপনি যদি কিছু আদায় করতে পারেন তবে আপনি ভাগ্যবান হবেন।

সতর্কতা : এই পরামর্শগুলি অনুসরণ করা আপনাকে সমস্ত ডেটা হারাতে পারে । এটি ঝুঁকির পক্ষে মূল্যবান কিনা তা দেখার বিষয় আপনার।

প্রচুর ভাগ্যক্রমে, আপনার অ্যাপ্লিকেশনগুলি এখনও কাজ করছে কারণ তারা যে ডেটা ব্যবহার করছেন তা সমস্ত অস্থির মেমরির মধ্যে রয়েছে। আপনার এই পরিস্থিতিটির সুবিধা পাওয়ার চেষ্টা করা উচিত (অ্যাপ্লিকেশন ভিত্তিতে এটি যদি হতে পারে কিনা তা মূল্যায়নের চেষ্টা করুন) এবং অ্যাপ্লিকেশনগুলি যদি এমন বৈশিষ্ট্য সরবরাহ করে তবে একটি লাইভ ডেটা নেটওয়ার্ক শেয়ারে রফতানি করতে হবে। যদি কোনও ডেটা ডিস্কে থাকে findতবে পরিবর্তিত / দূষিত ডিস্ক ডেটার কারণে এই রফতানি ফাংশনটি আপনার বিবৃতি বা ক্র্যাশ (এবং অ্যাপ্লিকেশন বা ওএস ক্র্যাশ) এর মতো অনেকটা "লক" করা যেতে পারে ।

তারপরে আপনি লাইভ স্ন্যাপশটটি করার চেষ্টা করতে পারেন, নিম্নলিখিত নিবন্ধের নির্দেশাবলী: জেনে স্ন্যাপশট তৈরি করা । আমি বাই বাই বাই স্ন্যাপশটের জন্য যাব, যদিও এটি আপনার findআদেশের মতো অনেকটা আটকে যেতে পারে ... তবে, আমি এত আশা করি না।

পূর্ববর্তী কমান্ডটি করার আগে আপনার এই ডকুমেন্টটি সিট্রিক্স থেকে পড়া উচিত যা জেনের স্ন্যাপশট বুঝতে সহায়তা করে (পিডিএফ)

আমি তোমার সৌভাগ্য কামনা করছি।


ধন্যবাদ. গ্রাহকের ডাটাবেস রফতানি আছে। আমি মনে করি তারা এটিকে ভিএম থেকে সরাতে কেবল এফটিপি ব্যবহার করেছে, তবে কোনও নেটওয়ার্ক ভাগ করে নেওয়া এবং সরাসরি এটিতে রফতানি করা সম্ভব।
জোহান

আমি ভিএম স্থগিত করার এবং তারপরে একটি সম্পূর্ণ অনুলিপি অন্য হোস্টের কাছে নিয়ে যাওয়ার এবং তারপর ক) চেষ্টা করব) ঘুম থেকে আবার শুরু করুন, বা খ) এটি বুট করুন, তারপরে একটি রিবুট এবং fsck আসবে। ধারণাটি হ'ল যেহেতু আমার কাছে এখনও মূল হোস্টে স্থগিত করা ভিএম রয়েছে তাই অনুলিপিটি অন্য হোস্টে কাজ না করলে আমি সেটিকে আবার চালু করতে সক্ষম হতে পারি।
জোহান

এছাড়াও এফডব্লিউআইডাব্লু ব্যাকআপে ফিরে যাওয়ার সমস্যাটি হ'ল ভয় করা যায় যে কয়েক দু'মাস ধরে নেওয়া সমস্ত ব্যাকআপ দুর্নীতিগ্রস্থ।
জোহান

@ জোহান এটি সম্ভবত সত্যের চেয়ে বেশি সত্য, বেশিরভাগ ক্ষেত্রে যদি ব্যাকআপ না হয় (যেহেতু সমস্যাটি দেখা দিয়েছে) সম্ভবত দূষিত। ডাটাবেস রফতানির ক্ষেত্রেও একই হতে পারে। শুভকামনা আবার, আপনার এটি প্রয়োজন হবে!
হিউজেনস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.