এডাব্লুএস ইএলবি অ্যাপাচি 2 503 পরিষেবা অনুপলব্ধ: ব্যাক-এন্ড সার্ভারটি সক্ষম at


39

আমরা প্রায় দু'বছর ধরে অ্যামাজন অ্যাডব্লিউএস অবকাঠামোতে কয়েকটি ওয়েবসাইট চালাচ্ছি এবং প্রায় দুই দিন আগে ওয়েবসভারটি একমাত্র দু'বার খুঁজে পেয়ে আমার কেবল ত্রুটিটি পেয়ে দিনে একবার বা দু'বার নামতে শুরু করেছে:

HTTP/1.1 503 Service Unavailable: Back-end server is at capacity

কোনও অ্যালার্ম (সিপিইউ / ডিস্ক আইও / ডিবি কান) ক্লাউডওয়াচ দ্বারা ট্রিগার করা হচ্ছে না। আমি ইএলবি এড়াতে ইলাস্টিক আইপি দিয়ে সাইটে যাওয়ার চেষ্টা করেছি এবং এটি পেয়েছি:

HTTP request sent, awaiting response... Read error (Connection reset by peer) in headers. Retrying.

অ্যাপাচি লগগুলিতে আমি সাধারণের বাইরে কিছু দেখতে পাচ্ছি না এবং যাচাই করেছিলাম যে তারা সঠিকভাবে ঘোরানো হচ্ছে। এসএসএইচ দিয়ে "ডাউন" হওয়ার সময় এবং মেশিনটিতে অ্যাক্সেস করতে আমার কোনও সমস্যা নেই এবং আমি প্রক্রিয়া তালিকার দিকে চেয়ে দেখি 151 অ্যাপাচি 2 প্রক্রিয়া আমার কাছে স্বাভাবিক দেখা যাচ্ছে। অ্যাপাচি পুনরায় চালু করা অস্থায়ীভাবে সমস্যার সমাধান করে। এই মেশিনটি একটি ELB এর পিছনে কেবল একটি ওয়েবসারভার হিসাবে কাজ করে। কোন পরামর্শ ব্যাপকভাবে প্রশংসা হবে।

সিপিইউ ব্যবহারের গড়: 7.45%, ন্যূনতম: 0.00%, সর্বাধিক: 25.82%

মেমরির ব্যবহারের গড়: 11.04%, ন্যূনতম: 8.76%, সর্বোচ্চ: 13.84%

সোয়াপ ব্যবহারের গড়: ন / এ, ন্যূনতম: এন / এ, সর্বাধিক: এন / এ

/ Dev / xvda1 এর জন্য ডিস্ক স্পেস ইউটিলাইজেশন মাউন্ট / গড়: 62.18%, ন্যূনতম: 53.39%, সর্বাধিক: 65.49%

আমাকে স্পষ্ট করে তুলি আমি মনে করি যে বিষয়টি ইস্যুটি পৃথক ইসি 2 উদাহরণের সাথে আছে এবং ইসিবি নয়, আমি কেবল এটির রায় দিতে চাইনি যদিও আমি স্থিতিস্থাপক আইপিটিতে পৌঁছাতে পারিনি। আমার সন্দেহ হয় ইসিবি ঠিক আসল ইসি 2 উদাহরণটি আঘাতের ফলাফলগুলি ফিরিয়ে দিচ্ছে।

আপডেট: 2014-08-26 আমার খুব শীঘ্রই এটি আপডেট করা উচিত ছিল তবে "ফিক্স "টি ছিল" খারাপ "উদাহরণের একটি স্ন্যাপশট নেওয়া এবং ফলস্বরূপ এএমআই শুরু করা। তারপর থেকে এটি কমেনি। আমি তখনও স্বাস্থ্য পরীক্ষার দিকে নজর রেখেছিলাম যখন আমি এখনও সমস্যাগুলির মুখোমুখি হয়েছি এবং curl http://localhost/page.htmlযখন আমি লোড ব্যালেন্সারের কাছ থেকে সক্ষমতাজনিত সমস্যা পেয়েছি তখনও স্বাস্থ্য চেক পৃষ্ঠায় ( ) পেতে পারি। আমি নিশ্চিত নই যে এটি একটি স্বাস্থ্য পরীক্ষার সমস্যা ছিল তবে যেহেতু অ্যামাজন সহ কেউই এর চেয়ে ভাল উত্তর দিতে পারে না আমি এটিকে উত্তর হিসাবে চিহ্নিত করছি। ধন্যবাদ.

আপডেট: 2015-05-06 আমি ভেবেছিলাম যে আমি এখানে ফিরে এসে বলতে চাই যে সমস্যার যে অংশটি আমি দৃ believe়ভাবে বিশ্বাস করি সেটি হল স্বাস্থ্য পরীক্ষা সেটিংস। আমি এএমআই-তে তাদের সমস্যা হওয়ার বিষয়টি অস্বীকার করতে চাই না কারণ প্রতিস্থাপন এএমআই চালু হওয়ার পরে এটি অবশ্যই ভাল হয়ে গেছে তবে আমি জানতে পেরেছিলাম যে আমাদের স্বাস্থ্য পরীক্ষা প্রতিটি লোড ব্যালান্সারের জন্য আলাদা ছিল এবং যেটি সবচেয়ে বেশি সমস্যা হচ্ছিল সত্যিই আক্রমণাত্মক অস্বাস্থ্যকর প্রান্তিকতা এবং প্রতিক্রিয়ার সময়সীমা ছিল। আমাদের ট্র্যাফিক অপ্রত্যাশিতভাবে স্পাইক করে এবং আমি মনে করি আক্রমণাত্মক স্বাস্থ্য পরীক্ষার সেটিংস এবং ট্র্যাফিকের স্পাইকগুলির মধ্যে এটি ছিল একটি নিখুঁত ঝড়।


আমি এই সম্পর্কে আরও তথ্য পেয়েছি: মেটা.ডিসকোর্স.আর্গ
আন্দ্রে মেসকিটা

উত্তর:


41

আপনি "ব্যাক-এন্ড সার্ভার সক্ষমতার সাথে সক্ষম হবেন" যখন ইএলবি লোড ব্যালেন্সার তার স্বাস্থ্য পরীক্ষা করে এবং একটি "ভুল পাওয়া যায় না" (বা অন্য সাধারণ ত্রুটি) একটি ভুল কনফিগারেশনের কারণে (সাধারণত নেম ভার্চুয়াল হোস্ট সহ) পায়।

"ELB-HealthChecker" ব্যবহারকারী এজেন্ট ব্যবহার করে লগ ফাইল ফোল্ডারটি গ্রেপ করার চেষ্টা করুন। যেমন

grep ELB-HealthChecker  /var/log/httpd/*

এটি আপনাকে সাধারণত 4x বা 5x ত্রুটি দেয় যা সহজেই স্থির হয়ে যায়। যেমন বন্যা, ম্যাক্সক্লিয়েন্টস ইত্যাদি সমস্যাটিকে অনেক বেশি wayণ দিচ্ছে।

এফওয়াইআই আমাজন: অনুরোধ থেকে প্রত্যাবর্তিত প্রতিক্রিয়া কেন দেখানো হচ্ছে না? এমনকি একটি স্থিতি কোড সাহায্য করবে।


17

আমি নিজেই এই ইস্যুতে দৌড়েছি। স্বাস্থ্যকর দৃষ্টান্ত না থাকলে অ্যামাজন ইএলবি এই ত্রুটিটি ফিরিয়ে দেবে। আমাদের সাইটগুলি ভুল কনফিগার করা হয়েছিল, সুতরাং ELB স্বাস্থ্য পরীক্ষা ব্যর্থ হচ্ছিল, যার ফলে ELB দুটি সার্ভারকে ঘূর্ণন থেকে দূরে সরিয়ে নিয়েছে। শূন্য স্বাস্থ্যকর সাইটগুলির সাথে, ইএলবি 503 পরিষেবা অনুপলব্ধ: ব্যাক-এন্ড সার্ভারটি সক্ষম।


5

[প্রশ্নটি আরও ভাল করে বোঝার পরে সম্পাদনা করুন] ইএলবির কোনও অভিজ্ঞতা না পেয়ে আমি এখনও মনে করি এটি সন্দেহজনকভাবে 503 ত্রুটির মতো শোনাচ্ছে যা অ্যাপাচি যখন টমকেটের মুখোমুখি হয় এবং সংযোগটি প্লাবন করে তখন নিক্ষিপ্ত হতে পারে।

এর প্রভাবটি হ'ল যদি আপাচি ব্যাকএন্ড দ্বারা প্রক্রিয়া করা হতে পারে তার চেয়ে বেশি সংযোগের অনুরোধ সরবরাহ করে, কোনও সংযোগ গ্রহণ না করা পর্যন্ত ব্যাকএন্ড ইনপুট সারিগুলি পূরণ করে। যখন এটি হয়, অ্যাপাচি সম্পর্কিত আউটপুট সারিগুলি পূরণ করা শুরু করে। সারিগুলি পূর্ণ হয়ে গেলে অ্যাপাচি একটি 503 ছুড়ে দেয় Ap এপাচি যখন ব্যাকএন্ড হয় তখন একই ঘটনা ঘটতে পারে এবং সারিগুলি পূরণ করার জন্য সীমানা এমন হারে সরবরাহ করে।

(অনুমানমূলক) সমাধানটি হ'ল ব্যাকএন্ডের ইনপুট সংযোগকারী এবং সীমান্তের আউটপুট সংযোগকারীগুলিকে আকার দেওয়া। এটি প্রত্যাশিত বন্যার স্তর এবং জড়িত কম্পিউটারগুলির উপলভ্য র‌্যামের মধ্যে ভারসাম্য রুপে পরিণত হয়।

সুতরাং এটি হওয়ার সাথে সাথে আপনার সর্বাধিক সংস্থাগুলির সেটিংস পরীক্ষা করে দেখুন এবং অ্যাপাচে আপনার কর্মব্যস্ত কর্মীদের নিরীক্ষণ করুন (mod_status।)। টমক্যাটস কানেক্টর ব্যাকলগ, ম্যাক্সথ্রেডস ইত্যাদির সাথে যা কিছু ইএলবি রয়েছে তার সাথে যদি সম্ভব হয় তবে সংক্ষেপে, অ্যাপাচি-র ইনপুট সারি এবং ইএলবির আউটপুট সারিগুলি সম্পর্কে সবকিছু দেখুন।

যদিও আমি সম্পূর্ণরূপে বুঝতে পারি এটি সরাসরি প্রযোজ্য নয়, এই লিঙ্কটিতে অ্যাপাচি সংযোজকের জন্য একটি সাইজিং গাইড রয়েছে। আপনাকে সংশ্লিষ্ট ELB সারি প্রযুক্তি সম্পর্কে গবেষণা করতে হবে, তারপরে গণিতটি করুন: http://www.cubrid.org/blog/dev-platform/maxclients-in-apache-and-its-effect-on-tomcat-during- পুরো GC /

নীচের ভাষ্যটিতে যেমন পর্যবেক্ষণ করা হয়েছে, অ্যাপাচি সংযোজককে ট্র্যাফিকের মধ্যে ছড়িয়ে দেওয়া একমাত্র সম্ভাবনা নয়। কিছু অনুরোধ যদি অন্যের তুলনায় ধীরে ধীরে পরিবেশন করা হয় তবে সেগুলির একটি উচ্চতর অনুপাতও সংযোগকারী সারিগুলি পূরণ করতে পারে। এটা আমার ক্ষেত্রে সত্য ছিল।

এছাড়াও, আমার সাথে যখন এই ঘটনাটি ঘটেছিল তখন আমি অবাক হয়ে গিয়েছিলাম যে আমাকে আবারও ৫০৩: গুলি না পাওয়ার জন্য অ্যাপাচি পরিষেবাটি পুনরায় চালু করতে হবে। কেবল সংযোগকারী বন্যার জন্য অপেক্ষা করা যথেষ্ট ছিল না। আমি কখনই বুঝতে পারি নি, তবে আপাচে কেউ এর ক্যাশে থেকে সম্ভবত অনুমান করতে পারে?

কর্মীদের সংখ্যা বৃদ্ধি করার সাথে সাথে সম্পর্কিত প্রি-কাঁটাচামচ ম্যাক্সিলিন্টস সেটিংস (এটি উইন্ডোজে মাল্টিথ্রেডেড অ্যাপাচি ছিল যা আমাকে সঠিকভাবে মনে রাখলে কাতারের জন্য আরও কয়েকটি নির্দেশনা রয়েছে), 503-সমস্যাটি অদৃশ্য হয়ে গেল। আমি আসলে গণিতটি করি নি, তবে সারি সংস্থানগুলির শীর্ষের ব্যবহারের জন্য আমি একটি বৃহত্তর মার্জিন পর্যবেক্ষণ করতে না পারা অবধি মানগুলিকে ট্যুইক করেছি। আমি এটা যে যেতে দেওয়া।

এই কিছু সাহায্য ছিল আশা করি।


আমি ঠিক বুঝতে পেরেছি যে আপনি অ্যাপাচি লিখছেন তা আপনার ব্যাকএন্ড। তবুও, আমার অনুমান অনুসারে কর্মীরা, চরমপন্থী ইত্যাদি খেলবে, তবে আমার উত্তরটি খুব বন্ধ এবং একটি সম্পূর্ণ পুনর্লিখনের প্রয়োজন। আমি কেবল এটি পরিবর্তে মুছে ফেলতে পারি। পাঠ শিখেছি: সঠিকভাবে প্রশ্নটি পড়ুন।
এরিক

ধন্যবাদ. এটি হওয়ার জন্য ট্রাফিকের বড় স্পাইক থাকতে হবে? এবং একবার বলেছিল ট্র্যাফিক আপ আপকে পুনরুদ্ধার করা উচিত নয়?
জেএসপি

তত্ত্বগতভাবে, হ্যাঁ যাইহোক, আমার সাথে এটি হওয়ার পরে আমাকে পরিষেবাটি পুনরায় চালু করতে হবে। এটি আমাকে প্রথমে এমন জায়গাগুলি সন্ধান করতে পরিচালিত করেছিল যার প্রকৃত ঘটনাগুলির সাথে কিছুই করার ছিল না, তবে সঠিক নির্ণয় এবং নিরাময়ের পরেও আমি এখনও পরিষেবা পুনরায় চালু করার প্রয়োজনীয়তা বুঝতে সক্ষম হইনি। আমি নিঃশব্দে সন্দেহ করেছিলাম এটি উইন্ডোজে অ্যাপাচি চালানোর কারণে হয়েছিল, কারণ আমি একটি সম্পর্কিত সম্পর্কযুক্ত বাগ রেফারেন্স পেয়েছি যা দৃশ্যত কেবল সেই কম্বো দিয়েই প্রকাশ পেয়েছিল। যে কোনও ক্ষেত্রে খুব অদ্ভুত।
এরিক

এবং হ্যাঁ, এখানে সংযোগকারীদের উপর ট্র্যাফিক ছিল অপ্রতিরোধ্য - এটি বরং নির্দিষ্ট অনুরোধ ছিল যা পরিবেশন করতে ধীর ছিল যা উপলক্ষে খুব বেশি আসার ঘটনা ঘটেছে। কিছুটা পর্যবেক্ষণ এবং সম্পর্কিত মানগুলিকে উত্সাহিত করার পরে 503 এর পরবর্তী প্রবর্তনগুলির প্রয়োজনীয়তার সাথে অদৃশ্য হয়ে গেল।
এরিক

4

আপনি এল্ব স্বাস্থ্য চেকার এর মানগুলি আপ করতে পারেন, তাই একক ধীর সাড়া হিসাবে এল্ব থেকে কোনও সার্ভার টানতে পারে না। সাইটটি সবার জন্য ডাউন থাকার চেয়ে কয়েকটি ব্যবহারকারীর পরিষেবা অনুপলব্ধ হওয়া আরও ভাল।

সম্পাদনা: আমরা স্বাস্থ্য পরীক্ষার সময়সীমা 25 সেকেন্ডে বাড়িয়ে প্রাক-ওয়ার্মিং ক্যাশে ছাড়াই পালাতে সক্ষম হয়েছি ...... 1-2 মিনিটের পরে ... সাইটটি নরকের মতো প্রতিক্রিয়াশীল

সম্পাদনা করুন: কেবলমাত্র চাহিদার উপরে একগুচ্ছ প্রবর্তন করুন এবং যখন আপনার পর্যবেক্ষণের সরঞ্জামগুলি পরিচালনা দেখায় যে আপনার কত দ্রুত, তখন কেবল প্রিপেই আরআই অ্যামাজন: পি

সম্পাদনা: এটি সম্ভব, একটি একক ব্যাকএন্ড এলিব নিবন্ধিত উদাহরণটি যথেষ্ট নয়। কেবল আরও কয়েকটি চালু করুন, এবং এলিব দিয়ে তাদের নিবন্ধ করুন এবং এটি আপনাকে আপনার সমস্যা সঙ্কুচিত করতে সহায়তা করবে


0

এটি কয়েক বছর দেরী হয়েছে, তবে আশা করি এটি কারওর পক্ষে সহায়তা করবে।

আমি এই ত্রুটিটি দেখছিলাম যখন ইএলবির পিছনে উদাহরণটির জন্য সঠিক পাবলিক আইপ বরাদ্দ করা হয়নি। আমার নিজে একটি ইলাস্টিক আইপি তৈরি করতে এবং এটিকে উদাহরণের সাথে সংযুক্ত করার দরকার ছিল যা পরে ইএলবি এটি তাত্ক্ষণিকভাবে তুলে নিয়েছিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.