একই হোস্ট থেকে একই ইউআরএলে পুনরাবৃত্তি হিটগুলি কীভাবে বন্ধ করা যায়?


3

আমার একটি অদ্ভুত সমস্যা রয়েছে - একটি উচ্চ ট্র্যাফিক ওয়েবসাইটে (মাসে কয়েক মিলিয়ন দর্শনার্থী), প্রতিদিন আমরা প্রায় 20 বা ততোধিক পরিস্থিতি পাই যেখানে কোনও হোস্ট একযোগে একই পৃষ্ঠাটির অনুরোধ শুরু করে, প্রতি সেকেন্ডে একাধিকবার, কয়েক মিনিট থেকে পুরো দিন পর্যন্ত কোনও দৈর্ঘ্য।

আক্রমণটি আপাতদৃষ্টিতে দূষিত নয়, কারণ আমি আইপি ঠিকানাটি পিছনে ফেলেছি এবং সেগুলি আমাদের কিছু নিবন্ধিত ব্যবহারকারীদের সাথে মিলেছি, যাদের সাথে আমি সাক্ষাত্কার নিয়েছি। তারা বলে যে এটি যখন ঘটে তখন আমাদের সাইটে একটি জাভাস্ক্রিপ্ট কাউন্টার 'রিফ্রেশ করে রাখে', তাদের কম্পিউটার ধীর হয়ে যায়, তবে এটি অন্যথায় ব্যবহারযোগ্য। এটি প্রতিটি পৃষ্ঠার লোডে ঘটে না, বরং বিক্ষিপ্তভাবে ঘটে।

লগ হিট নিম্নলিখিত বৈশিষ্ট্যযুক্ত:

  • তারা 'স্বাভাবিক' শুরু করে - প্রথম পৃষ্ঠার লোডটি আসলে পৃষ্ঠার সমস্ত সংস্থান এবং সেইসাথে। Php অ্যাক্সেস করে
  • তারপরে হোস্ট পিএইচপি পৃষ্ঠার JUST অনুরোধ করতে শুরু করে, অবিচ্ছিন্ন সংস্থান ছাড়া, সাধারণত প্রতি সেকেন্ডে একজন (তবে কখনও কখনও দ্রুত এবং কখনও কখনও কয়েক সেকেন্ড ধীর হয়)
  • দূরবর্তী ব্রাউজারটি সর্বদা ফায়ারফক্স 3.5.x হয়
  • পরবর্তী পৃষ্ঠার অনুরোধটি থাকা সত্ত্বেও পরবর্তী হিটগুলির কোনও রেফার নেই

এটি দিয়ে কী করা যায় তা নিয়ে আমরা বুদ্ধিমানের শেষ। একটি সাধারণ ডস ফিল্টার উপযুক্ত নয় - আমাদের কাছে এটি এবং ট্রিগার করার প্রান্তটি একক পৃষ্ঠার অনুরোধের তুলনায় অনেক বেশি (সম্পর্কিত চিত্র, সিএসএস, ইত্যাদি) এক সেকেন্ডের চেয়ে বেশি।

স্ট্যাকটি হ'ল এলএএমপি, রেডহ্যাট ইনস্টল, পিএইচপি 5.2, অ্যাপাচি ২.২.৩, একটি এনজিআইএনএক্স বক্স একটি সফ্টওয়্যার লোড ব্যালেন্সার হিসাবে কাজ করছে।

এটি আমাদের সাইটের ক্রাশ করছে - দয়া করে সহায়তা করুন! ভাল ধারণার অনুপস্থিতিতে, আমরা একটি ডামি ফিল্টার লিখতে যাব যা মেমচেডে আইপি + ইউআরআই-এর একটি কী সংরক্ষণ করে এবং প্রতিটি পৃষ্ঠার অনুরোধকে বৃদ্ধি করে। এটি নির্দিষ্ট সময়ের মধ্যে একটি নির্দিষ্ট প্রান্তকে অতিক্রম করার পরে, আমরা আরও 403 টি অনুরোধ করব। তবে আমি মনে করি না যে এই সমস্যাটি পরিচালনা করার জন্য এটি নেটওয়ার্কিং স্ট্যাকের উপযুক্ত জায়গা place

আপনি যে কোনও অবদান রাখতে পারেন তার জন্য আপনাকে ধন্যবাদ!


2
আপনার বাগটি মজিলায় রিপোর্ট করেছেন? যদি এটি অভ্যন্তরীণ না হত, তবে আমি আক্রমণটি ক্লিক জালিয়াতির মতো বলে দেব, কোনও প্রতিযোগী সেই পৃষ্ঠাতে পাওয়া বিজ্ঞাপনদাতার অনলাইন বিজ্ঞাপন বাজেটের ক্লান্তিকর বলুন (যা আপনার সংস্থা নাও হতে পারে)।
কুমারশ

উত্তর:


5

আপনার নিজের বিবরণ থেকে আমি আপনাকে পরামর্শ দিচ্ছি যে আপনি সেই কাউন্টারটি সরিয়ে দিয়ে শুরু করুন এবং দেখুন যে এটির কোনও পার্থক্য রয়েছে কিনা। এটি এত সহজে পরীক্ষা করা হয়েছে যে আমি অবাক হয়েছি যে আপনি ইতিমধ্যে এটি করেন নি।


আমি জানি. তবে, আমরা একমাসে 5 মিলিয়নেরও বেশি অসুবিধাগুলি পেয়েছি এবং দিনে কয়েকজন লোকই এই সমস্যাটিকে ট্রিগার করে, তাই দুর্ভাগ্যক্রমে আমার পক্ষে কাউন্টারটি টানানো এত সহজ নয় এবং আমি সিদ্ধান্ত নিতে পারছি না বলে এটি আবার ঘটে কিনা তা দেখার অপেক্ষায় it's একটি ভ্যাকুয়ামে

2
দুঃখিত, আমি বুঝতে পারি না। আপনি কেন এই কাউন্টারটি সরাতে পারবেন না? ট্র্যাফিকের পরিমাণ অপ্রাসঙ্গিক এবং আপনার যদি যথেষ্ট পরিমাণে উল্লেখযোগ্য সমস্যা হয়ে থাকে যে আপনি সাহায্যের জন্য জিজ্ঞাসা করছেন আমি বলব এটি শূন্যতার মধ্যে সিদ্ধান্ত নেওয়া অনেক দূরে। আপনি কেবল একটি জিনিসে পয়েন্ট প্রদান করেছেন তার প্রমাণ থাকা সত্ত্বেও আপনি যে সমস্যাটি হতে পারে তা নিয়ে বুননীয় অনুমানগুলি গ্রহণ করার জন্য আপনি প্রথম স্পষ্ট পদক্ষেপ গ্রহণ না করেই চান।
জন গার্ডেনিয়ার্স

ওহ আমাকে ভুল বুঝবেন না, এটি চেষ্টা করার পক্ষে যুক্তিযুক্ত জিনিস, তবে যদি আপনার 'ব্যর্থতার হার' বলতে হয় তবে তা যদি কম হয় (ট্রাফিকটি এখানে আসে) এবং কোনও পুনরুত্পাদনযোগ্যতা না থাকে তবে আমি কী অক্ষম করতে পারি না? আমার সংস্থার অন্যরা গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি বিবেচনা করবে। আমি এই প্রশ্নটি এখানে জিজ্ঞাসা করেছিলাম যে অন্য কারওর সাথেও এইরকম সমস্যা রয়েছে - আমি অনলাইনে প্রতিবেদন ছিটিয়ে দেখছি যে কেবলমাত্র ডস এর অ্যাক্সেসের এই প্যাটার্ন সম্পর্কে নেই, এবং সেই জায়গাগুলিতে তাদের কাউন্টার থাকা লোকদের মধ্যে কোনও মিল নেই। তবুও, আপনাকে ধন্যবাদ, এবং আমি আপনার বক্তব্য সাথে একমত।

1
প্রশ্নটি যদি জিজ্ঞাসা করার মতো হয় তবে এটি তদন্তের পক্ষে মূল্যবান। যদি কাউন্টারটি এত গুরুত্বপূর্ণ হয় তবে কেন একই জিনিসটি করতে আলাদা কোনও ব্যবহার করবেন না? এখানে মূল কীটি হ'ল আপনি বর্তমানে যেটি ব্যবহার করছেন তা মুছে ফেলা কিনা তা দেখার জন্য এটি কী পরিবর্তন করে।
জন গার্ডেনিয়ার্স

3

হিটগুলির সন্ধান এবং 403 প্রেরণ কেবল ইস্যুটিই মাস্কিং করছে। সমস্যাটি সমাধানের আরও ভাল পদ্ধতির মতো মনে হচ্ছে আপত্তিজনক পৃষ্ঠায় ত্রুটিযুক্ত জাভাস্ক্রিপ্ট ঠিক করা।


1
আপনার বিকাশ বা অন্য কোনও বিচ্ছিন্ন পরিবেশে পরিস্থিতি পুনরুত্পাদন করার চেষ্টা করুন, তারপরে জাভাস্ক্রিপ্ট বাগটি ঠিক করুন।
কার্স্টেন

0

মেমক্যাচযুক্ত সমাধানটির সমস্যাটি হ'ল আপনি এখনও হিটগুলি পেয়ে যাচ্ছেন তবে আপনি ম্যাকচেড যাচাই করে এটি পরিবেশন করতে কোনও নিবিড় কাজ এড়ানোর পরিকল্পনা করছেন এবং যদি এটি কোনও খারাপ অনুরোধ হয় তবে দৃ a়সংকল্পবদ্ধ। এটি নিজেই কাজ করছে, যদিও নিশ্চিত, এটি আপনার ওয়েবসারভার বা ডাটাবেস সার্ভারটি কিছু সিপিইউ সংরক্ষণ করতে পারে।

এটির জন্য ম্যাকচেড ব্যবহারের অন্যান্য পদ্ধতির নামটি হল সেই ইউআরআইয়ের প্রতিক্রিয়া গণনা করা, এবং যদি আইপিটি অনন্য হয় তবে আইপি + ইউআরআই দ্বারা চিহ্নিত প্রতিক্রিয়াটিকে মেমচেচেডে সংরক্ষণ করুন, যদি ইউআরআই দ্বারা অন্য কোনও অনন্য অনুরোধের সাথে এটি কী না করে থাকে প্রতিক্রিয়া পরিবর্তিত হবে যে পরামিতি। তারপরে এক্স সেকেন্ডের চেয়ে কম পুরানো কোনও ক্যাশেড প্রতিক্রিয়া সহ সমস্ত অনুরোধের উত্তর দিন। এখন আপনি প্রতি এক্স সেকেন্ডে এখনও পুনরায় গণনা করছেন তবে এটি দ্বিতীয় সেকেন্ডের চেয়ে অনেক কম সংখ্যার চেয়ে কম। আমি বিশ্বাস করি একটি মেমক্যাশে সচেতন প্রক্সি বা ওয়েবসার্ভার কিছু অতিরিক্ত লেখা ছাড়া এই কাজ করার জন্য কনফিগার করা করতে সক্ষম হবে বলে MemProxy , অথবা nginx যথাক্রমে।

খারাপ আচরণের মূল কারণটিতে পৌঁছনো পছন্দনীয়। এটি যদি জাভাস্ক্রিপ্ট সম্পর্কিত হয় তবে এটি আপনার পৃষ্ঠাগুলিতে কোনও নির্দিষ্ট বিজ্ঞাপনের সাথে সম্পর্কিত জাভাস্ক্রিপ্ট হতে পারে। প্রতিটি সম্ভাব্য বিজ্ঞাপন দিয়ে পৃষ্ঠাটি পুনরায় লোড করার জন্য আপনার বিকাশের একটি ব্যবস্থা থাকা দরকার। আপনার যদি না থাকে তবে আপনি যে বিজ্ঞাপনগুলি দম্পতি ব্যবহারকারীদের সমস্যা দিচ্ছেন তা শেষ করতে পারবেন না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.