যখন কোনও ডিএনএস সার্ভার ব্যর্থ হয় তখন ডিএনএসের সময়সীমা এড়ানো


17

আমাদের কাছে প্রায় একশটি হোস্ট 3 আভ্যন্তরীণ ডিএনএস সার্ভারের দিকে ইশারা করে একটি ছোট ডাটাবেসক রয়েছে (9 বাইন্ড করুন)। আমাদের সমস্যাটি তখনই আসে যখন কোনও অভ্যন্তরীণ ডিএনএস সার্ভার অনুপলব্ধ হয়ে যায়। এই মুহুর্তে সমস্ত ক্লায়েন্টরা that সার্ভারটিতে নির্দেশ করে খুব আস্তে কাজ শুরু করে।

সমস্যাটি দেখে মনে হচ্ছে যে স্টক লিনাক্স রিসোলভারটির সত্যই আলাদা ডিএনএস সার্ভারটিতে "ব্যর্থ হওয়া" এর ধারণা নেই। আপনি সময়সীমা এবং এটি ব্যবহারের পুনরায় চেষ্টাগুলির সংখ্যা সামঞ্জস্য করতে পারেন (এবং ঘোরান সেট করুন যাতে এটি তালিকার মধ্য দিয়ে কাজ করবে) তবে প্রাথমিক ডিএনএস সার্ভার অনুপলব্ধ হয়ে গেলে যদি কেউ আমাদের পরিষেবাগুলি আরও ধীরে ধীরে সঞ্চালন করে তবে তা গুরুত্বপূর্ণ নয়। এই মুহূর্তে এটি আমাদের জন্য পরিষেবা বাধাগুলির বৃহত্তম উত্স।

আমার আদর্শ উত্তরটি "আরটিএফএম: টুইঙ্ক /etc/resolv.conf এর মতো ..." এর মতো কিছু হবে তবে এটি যদি কোনও বিকল্প হয় তবে আমি এটি দেখি না।

আমি ভাবছিলাম যে অন্যান্য লোকেরা কীভাবে এই সমস্যাটি পরিচালনা করেছেন?

আমি 3 সম্ভাব্য ধরণের সমাধান দেখতে পাচ্ছি:

  • লিনাক্স-হা / পেসমেকার এবং ফেলওভার আইপ্স ব্যবহার করুন (যাতে ডিএনএস আইপি ভিআইপিগুলি "সর্বদা" উপলব্ধ থাকে)। হায়রে, আমাদের কাছে ভাল বেড়ানোর অবকাঠামো নেই, এবং বেড়া ছাড়া পেসমেকার খুব ভাল কাজ করে না (আমার অভিজ্ঞতায় পেসমেকার বেড়া ছাড়া প্রাপ্যতা হ্রাস করে)।

  • প্রতিটি নোডে একটি স্থানীয় ডিএনএস সার্ভার চালান, এবং স্থানীয় হস্টে রেজোলভ.কনফ পয়েন্ট করুন। এটি কাজ করবে তবে এটি আমাদের নিরীক্ষণ ও পরিচালনা করতে আরও অনেক পরিষেবা দেয়।

  • প্রতিটি নোডে একটি স্থানীয় ক্যাশে চালান। লোকেরা এনএসসিডিটিকে "ভাঙ্গা" হিসাবে বিবেচনা করেছে বলে মনে হয়, তবে ডিএনআরডি মনে করে সঠিক বৈশিষ্ট্যটি সেট করা আছে: এটি ডিএনএস সার্ভারকে উপরে বা নীচে হিসাবে চিহ্নিত করে এবং 'ডাউন' ডিএনএস সার্ভার ব্যবহার করবে না।

যে কোনও কাস্টিং কেবল আইপি রাউটিং স্তরে কাজ করে বলে মনে হয় এবং এটি সার্ভার ব্যর্থতার জন্য রুট আপডেটের উপর নির্ভর করে। মাল্টি-কাস্টিং দেখে মনে হয়েছিল এটি একটি সঠিক উত্তর হবে তবে বাইন্ড সম্প্রচার বা মাল্টি-কাস্টিং সমর্থন করে না এবং আমি যে ডক্সগুলি পেয়েছি সেগুলি মনে হতে পারে যে মাল্টিকাস্ট ডিএনএস নিয়মিত ডিএনএস সমাধানের পরিবর্তে পরিষেবা আবিষ্কার এবং স্বয়ং-কনফিগারেশনের দিকে লক্ষ্য রাখে more ।

আমি কি একটি সুস্পষ্ট সমাধান মিস করছি?


2
আমি প্রস্তাব দিচ্ছি যে আপনি যে সমাধানটির জন্য জিজ্ঞাসা করছেন তার সন্ধানের পাশাপাশি (যা আমি আপনাকে সাহায্য করতে পারি না) আপনার আসল মূল সমস্যাটিতে কাজ করা উচিত এবং ডিএনএস সার্ভারের সাথে নির্ভরযোগ্যতার সমস্যাগুলি সমাধান করা উচিত।
জন গার্ডেনিয়ার্স

মূল সমস্যাটি হ'ল: কেন এই ডিএনএস সার্ভারগুলি আপনাকে এতটা বিরক্ত করার জন্য এত ঘন ঘন নীচে নেমে যায়? বাডিএনএসের মতো বিশেষ পরিষেবাগুলির সাথে আপনার ডিএনএসের প্রতিরূপের কথা বিবেচনা করুন । আপনার বিলম্বিতা নাটকীয়ভাবে ডুবে যাবে এবং আপটাইম আপনাকে /etc/resolv.conf টুইটগুলি সম্পর্কে আর বিরক্ত করবে না।
মিশেল

উত্তর:


15

বিকল্প দুটি। উভয়ই আপনার ডিএনএস সার্ভারগুলিতে ডিএনএস লোড বিতরণ করবে।

  • রেজোলভকনফ-এ ব্যবহার করার চেষ্টা করুন options rotate। এটি প্রাথমিক সার্ভারের ডাউন ডাউন হওয়ার প্রভাবকে হ্রাস করবে। অন্য সার্ভারগুলির মধ্যে একটি ডাউন থাকলে এটি ক্রিয়াগুলি কমিয়ে দেবে।
  • বিভিন্ন ক্লায়েন্টে একটি আলাদা নেমসার্ভার অর্ডার ব্যবহার করুন। প্রাথমিক ডিএনএস সার্ভার বন্ধ থাকলে এটি কিছু ক্লায়েন্টকে স্বাভাবিকভাবে চলতে দেয়। এটি চারপাশে একটি আউট সার্ভিস ডিএনএস সার্ভারের প্রভাব ছড়িয়ে দেয়।

এই বিকল্পগুলির সাথে একত্রিত করা যেতে পারে options timeout:1 attempts:5। সময়সীমা হ্রাস পেলে চেষ্টাগুলি বাড়ান যাতে আপনি ধীর বাহ্যিক সার্ভারগুলি পরিচালনা করতে পারেন।

আপনার রাউটারের কনফিগারেশনের উপর নির্ভর করে আপনি যখন আপনার ডিএনএস সার্ভারগুলি প্রাথমিক ডিএনএস সার্ভারের আইপি অ্যাড্রেসটি ডাউন হবে তখন এটি নিয়ন্ত্রণ করতে পারবেন। এটি উপরের কৌশলগুলির সাথে একত্রিত করা যেতে পারে।

দ্রষ্টব্য: আমি নির্ধারিত ডিএনএস বিভ্রাট ছাড়াই বছর চালাচ্ছি। অন্যরা যেমন উল্লেখ করেছে, আমি ডিএনএস সার্ভারকে ব্যর্থ হওয়ার কারণগুলি সমাধান করার জন্য কাজ করব। উপরোক্ত পদক্ষেপগুলি, অপ্রাপ্যযোগ্য নাম সার্ভারগুলি নির্দিষ্ট করে দিয়ে ভুল কনফিগার করা ডিএনএস সার্ভারগুলিতে সহায়তা করে।


4

"Man resolv.conf" দেখুন। আপনি রেজোলভকনফ-এ একটি টাইমআউট বিকল্প যুক্ত করতে পারেন। ডিফল্টটি 5, তবে রেজোলভকনফের সাথে নিম্নলিখিতগুলি যুক্ত করে এটিকে 1 সেকেন্ডে নামানো উচিত:

বিকল্প সময়সীমা: 1


আপনার দ্বিতীয় অনুচ্ছেদটি পড়ার পরে, আমি উপরেরটি একটি সেন্টোস এবং ডেবিয়ান ভিপিএসে চেষ্টা করেছি। প্রাথমিক ডিএনএস নামানোর পরে, রিসলভারটি প্রত্যাশার মতো ঠিক পারফর্ম করেছিল। একটি টিসিপিডাম্প চালিয়ে, আমি এমনকি প্রথম সার্ভারটি চেষ্টা করে রেজোলভারটি দেখতে পেলাম এবং তারপরে পরবর্তীটি চেষ্টা করে দেখতে পেলাম। কি আচরণ দেখছেন?
নিলাল ডোনেগান

1
সমাধানের জন্য দুটি বড় ব্যবহারের কেস রয়েছে: স্বল্পকালীন প্রক্রিয়াগুলি (যেমন কমান্ড লাইন সরঞ্জামগুলি) এবং দীর্ঘকালীন প্রক্রিয়াগুলি, এবং একই সমাধানকারী কনফিগারেশন উভয়ের পক্ষে কাজ করতে হয়। স্বল্প সময়ের জন্য (একক দেখার) জন্য একটি স্বল্প সময়সীমা নির্ধারণ করা দ্রুত ব্যর্থ হবে। তবে আপনি যদি এমন কোনও বাহ্যিক ঠিকানা সন্ধান করেন যা সেই সময়ের মধ্যে সমাধান হয় না: আপনি একটি নাম খুঁজে পাবেন না, যেহেতু সমাধানকারী এই কোয়েরিটি যদি এক সেকেন্ডে ফিরে না আসে তবে তা ত্যাগ করবে। (ঘরে বাইরে; পরবর্তী মন্তব্যে আরও)
নীল ক্যাটিন

দীর্ঘমেয়াদী প্রক্রিয়াগুলি প্রতিটি অনুসন্ধান, সময়সীমা পুনরায় চেষ্টা করবে এবং তারপরে পরবর্তী সার্ভারে চলে যাবে। তবে এটি সার্ভারের "ডেডনেস" ক্যাশে করে বলে মনে হচ্ছে না।
নিল ক্যাটিন

3

ক্লাস্টারিং সফ্টওয়্যার যেমন হার্টবিট বা পেসমেকার / করোজেনক আপনার বন্ধু এখানে। একটি উদাহরণ হিসাবে, আমরা নিম্নরূপে পেসমেকার / করোজেনসি সেটআপ করেছি:

  • প্রতিটি সার্ভারকে অন্য একটি দিয়ে যুক্ত করুন
  • প্রতি জোড়া 2 ডিএনএস ভিআইপি থাকে, সাধারণত প্রতিটিতে একটি করে
  • বাঁধাই বা সার্ভারটি ব্যর্থ হলে ভিআইপি অন্য সার্ভারে মিলিসেকেন্ডের মধ্যে চলে যায়

উত্পাদন সময় 24x7 হয় তবে আমরা দৃ strongly়ভাবে বিশ্বাস করি যে গ্রাহকদের প্রভাবিত না করে প্রতিটি সার্ভারের জন্য এটি ব্যর্থ হওয়া সম্ভব উচিত। বিকল্প ঘোরানো নিখুঁতভাবে কাজ করা, আমি এটি করব না।


3

প্রতিটি নোডে একটি স্থানীয় ডিএনএস সার্ভার চালান, এবং স্থানীয় হস্টে রেজোলভ.কনফ পয়েন্ট করুন। এটি কাজ করবে তবে এটি আমাদের নিরীক্ষণ ও পরিচালনা করতে আরও অনেক পরিষেবা দেয়।

এফডব্লিউআইডাব্লু, এই সমস্যাটির জন্য আমি খুঁজে পেয়েছি এটিই কেবল কার্যকর সমাধান। আপনাকে কেবল লোকালহোস্টে শোনার জন্য আপনাকে সার্ভারকে সীমাবদ্ধ করতে হবে, তবে এটি আমাদের পরিবেশে DNS আউটেজকে লক্ষ্য করে ব্যবহারকারীদের সম্পূর্ণরূপে বিলোপ করেছে।

একটি আকর্ষণীয় পার্শ্ব প্রতিক্রিয়া হ'ল লোকালহোস্ট সার্ভার যদি কোনও কারণে নীচে চলে যায় তবে স্ট্যান্ডার্ড রেজোলার লাইব্রেরিগুলি স্ট্যান্ডার্ড কেসের তুলনায় পরবর্তী সার্ভারে ফেইলওভারটি পরিচালনা করবে বলে মনে হয়।

আমরা প্রায় 3 বছর ধরে এটি করছি এবং আমি এমন একটি সমস্যাও দেখিনি যা লোকালহোস্টে চলমান কোনও ডিএনএস সার্ভারের ব্যর্থতা / আউটেজের সাথে সম্পর্কিত হতে পারে।


2

যদি কোনও নেমসার্ভ রক্ষণাবেক্ষণের জন্য নেমে চলেছে তবে এসওএর সময়সীমাটি সময়ের আগেই হ্রাস করা স্বাভাবিক প্রক্রিয়া, যাতে রক্ষণাবেক্ষণের সময় পরিবর্তন হয় (রক্ষণাবেক্ষণের আগে এনএস রেকর্ডস সরিয়ে এবং রক্ষণাবেক্ষণের পরে এগুলি ফিরিয়ে দেওয়া) ) দ্রুত প্রচার। নোট করুন যে এটি একটি সার্ভার-সাইড অ্যাপ্রোচ - সমাধানগুলি পরিবর্তন করা একটি ক্লায়েন্ট-সাইড অ্যাপ্রোচ এবং ... যতক্ষণ না আপনি নিজের প্রতিটি ক্লায়েন্টের সাথে কথা বলতে এবং তাদের মেশিনে এই সমন্বয় করতে না পেয়ে ... নাও হতে পারে সঠিক পন্থা আচ্ছা, আমি অনুমান করেছি যে আপনি অভ্যন্তরীণ ডিএনএস সার্ভার ব্যবহার করে কোনও ডেটা সেন্টারে কেবলমাত্র একশত ক্লায়েন্ট বলেছেন, কিন্তু আপনি যখন জোনটি পরিবর্তন করতে পারবেন তখন সত্যিই আপনি কি একশ ক্লায়েন্টের কনফিগারেশন পরিবর্তন করতে চান?

আমি আপনাকে জানিয়ে দেব যে এসওএতে কোন মানগুলি সামঞ্জস্য করতে হবে তবে আমি যখন এই প্রশ্নটি ছড়িয়ে দিয়েছিলাম তখন সেই সঠিক তথ্যটি সন্ধান করার জন্য ওয়েবটি সার্ফ করছিলাম।


3
এই উত্তরটি কেবল প্রামাণিক ডিএনএসের সাথে সম্পর্কিত। প্রশ্নটি ক্লায়েন্ট সফ্টওয়্যার দ্বারা তৈরি পুনরাবৃত্ত ডিএনএস লুকআপ সম্পর্কিত ছিল।
অ্যান্ড্রু বি

1

সম্ভবত আপনি নিজের ডিএনএস সার্ভারগুলি কোনও ভার ভারসাম্যের পিছনে রাখতে পারেন? দৃশ্যত এলভিএস ইউডিপিতে ভারসাম্য বজায় রাখতে পারে। স্পষ্টতই আপনার এলবিকে সর্বোচ্চ উপলব্ধ করুন যাতে এটি ব্যর্থতার একক পয়েন্ট নয়।


0

আমি জানি এটি ট্রাইট শোনাতে পারে তবে কীভাবে সমস্যার স্থায়ী সমাধান হিসাবে আরও স্থিতিশীল, স্বচ্ছল ডিএনএস অবকাঠামো তৈরি করা যায়।


আমাদের মোটামুটি স্থিতিস্থাপক ডিএনএস অবকাঠামো রয়েছে। তবে বছরে ২ বা ৩ বার আমাদের আউটেজ হয় কারণ একটি ডিএনএস সার্ভার ডাউন হয়ে যায় (বা পুনরায় চালু হয়, বা একটি ওএস আপগ্রেড রয়েছে বা যা কিছু)।
নিল ক্যাটিন

1
ভাল ... পুনঃসূচনা এবং আপগ্রেডগুলি অ-উত্পাদন সময়ের জন্য নির্ধারিত হওয়া উচিত। বাকী অংশগুলির জন্য, মনে হচ্ছে আপনি বছরে কয়েকবার ঘটে এমন কোনও কিছু থেকে খুব বড় চুক্তি করছেন। অতিরিক্ত অবকাঠামো, সময়, অর্থ এবং পরিচালন ওভারহেড কি এতটা আপাতদৃষ্টিতে আপাতদৃষ্টিতে দেখা দেয় এমন সমস্যার জন্য মূল্যবান?
joeqwerty

8
আপনার উত্পাদনের সময় 24x7 হলে কী হবে? ডিএনএসের দ্বিতীয় / তৃতীয় / এক্স সার্ভারে ব্যর্থ হওয়া উচিত এবং অন্য সময়ের জন্য অন্য সার্ভারের ব্যর্থতা ক্যাশে করা উচিত। ডিফল্ট 5 দ্বিতীয় সময়সীমা লোডের উপর নির্ভর করে পরিষেবাগুলি নামিয়ে আনতে যথেষ্ট।
রায়ানার

0

আরও একটি নেটওয়ার্ক-কেন্দ্রিক সমাধান একই (ডেডিকেটেড) আইপি এবং যেকোনকাস্ট রাউটিং সহ দুটি ডিএনএস সার্ভার ব্যবহার করবে । (আমি এখনও এই থ্রেডে এই উত্তরটি লক্ষ্য করি নি, তবে এখানে এটি ব্যবহৃত হয়))

যতক্ষণ না উভয় আপ থাকে ততক্ষণ নিকটস্থ সার্ভার ব্যবহার করা হয়। যদি কোনওটি নীচে যায় তবে IP আইপিটির ট্র্যাফিকটি আবার উঠে না আসা পর্যন্ত অন্য নোডে যাত্রা করা হবে। আপনার দুটি বা ততোধিক অবস্থান বা ডেটা সেন্টার থাকলে এটি বিশেষত বোধগম্য হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.