অস্তিত্বহীন URL গুলির সাহায্যে 404 টির বেশি আক্রমণ। কীভাবে এটি প্রতিরোধ করবেন?


14

সমস্যাটি হ'ল গুগল ওয়েবমাস্টার সরঞ্জাম দ্বারা প্রকাশিত 404 ত্রুটিগুলির পুরো বোঝা, এমন পৃষ্ঠাগুলি এবং কোয়েরিগুলি নেই যা আগে কখনও হয়নি। এর মধ্যে একটি হ'ল viewtopic.php, এবং আমি সাইটটি কোনও ওয়ার্ডপ্রেস সাইট ( wp_admin) এবং সিপ্যানেল লগইনের জন্য কিনা তা পরীক্ষা করে দেখার এক বিরাট প্রচেষ্টার লক্ষ্য করেছি । আমি ইতিমধ্যে ট্র্যাক অবরোধ করি এবং সার্ভারটি স্ক্যানিং / হ্যাকিংয়ের বিরুদ্ধে কিছু প্রতিরক্ষা দিয়ে সজ্জিত। তবে এটি থামবে বলে মনে হয় না। গুগল ওয়েবমাস্টার অনুসারে রেফারার হ'ল totally.me

আমি এটি বন্ধ করার জন্য সমাধানের সন্ধান করেছি, কারণ এটি দরিদ্র প্রকৃত ব্যবহারকারীদের পক্ষে অবশ্যই ভাল নয়, এসইও উদ্বেগকে ছেড়ে দিন।

আমি পেরেশেবল প্রেস মিনি ব্ল্যাক লিস্ট ( এখানে পাওয়া যায় ), একটি স্ট্যান্ডার্ড রেফারার ব্লকার (পর্ন, ভেষজ, ক্যাসিনো সাইটগুলির জন্য), এবং এমনকি সাইটটি সুরক্ষার জন্য কিছু সফ্টওয়্যার (এক্সএসএস ব্লকিং, এসকিউএল ইনজেকশন ইত্যাদি) ব্যবহার করছি। সার্ভারটি অন্যান্য ব্যবস্থাও ব্যবহার করছে, সুতরাং কেউ ধরে নেবে যে সাইটটি নিরাপদ (আশাকরি) তবে এটি শেষ হচ্ছে না।

অন্য কারও কি একই সমস্যা আছে, বা আমি কেবল এটিই দেখছি? এটা কি আমি মনে করি, অর্থাত্, একরকম আক্রমণ? এটি নিষ্পত্তি করার কোনও উপায় আছে বা আরও ভাল, এই অকেজো রিসোর্স বর্জ্য প্রতিরোধ করতে?

সম্পাদনা করুন আমি উত্তরগুলির জন্য ধন্যবাদ দেওয়ার জন্য প্রশ্নটি কখনও ব্যবহার করি নি, এবং আশা করি এটি করা সম্ভব। আপনার অন্তর্দৃষ্টিপূর্ণ জবাবের জন্য আপনাকে সকলকে ধন্যবাদ, যা আমাকে এ থেকে আমার পথ খুঁজে পেতে সহায়তা করেছিল। আমি প্রত্যেকের পরামর্শ অনুসরণ করেছি এবং নিম্নলিখিতগুলি প্রয়োগ করেছি:

  • একটি হানিপোট
  • একটি স্ক্রিপ্ট যা 404 পৃষ্ঠায় সন্দেহজনক url শুনে এবং মানক 404 শিরোনাম ফেরত দেওয়ার সময় আমাকে ব্যবহারকারী এজেন্ট / আইপি সহ ইমেল পাঠায়
  • একটি স্ক্রিপ্ট যা বৈধ ব্যবহারকারীদের পুরষ্কার দেয়, একই 404 কাস্টম পৃষ্ঠায়, যদি তারা সেই url গুলির একটিতে ক্লিক শেষ করে। 24 ঘন্টােরও কম সময়ে আমি স্প্যামহাউসে তালিকাভুক্ত কয়েকটি সন্দেহজনক আইপি বিচ্ছিন্ন করতে সক্ষম হয়েছি। এখন পর্যন্ত লগ করা সমস্ত আইপি স্প্যাম ভিপিএস হোস্টিং সংস্থার অন্তর্ভুক্ত।

আপনাকে আবারও ধন্যবাদ, আমি যদি উত্তর দিতে পারি তবে আমি সমস্ত উত্তর গ্রহণ করতাম।


গুগল ওয়েবমাস্টার সরঞ্জামগুলি যখন বলে যে রেফারার সম্পূর্ণরূপে আপনি, আপনি কি বোঝাতে চাইছেন যে তারা আপনার সাইটের পৃষ্ঠাগুলি রেফারিং পৃষ্ঠাগুলি?
স্টিফেন অসটারমিলার

দুঃখিত আমার ভুল. আমার কাছে এই পৃষ্ঠাগুলি রয়েছে যা ওয়েবমাস্টার সরঞ্জামগুলিতে কখনও ছিল না এবং গুগল বলে যে সেগুলি পাওয়া যায় নি। এর মধ্যে একটি হ'ল mysite.com/viewtopic.php?forget_the_value=1 এবং সম্পূর্ণ.মে থেকে লিঙ্ক করা হয়েছে even এমনকি আমি ক্লিক করেছি ... কিছুই পাওয়া যায় নি Found
তত্ত্বমাসি

2
অস্তিত্বহীন পৃষ্ঠাগুলির জন্য আপনার অ্যাক্সেস লগগুলিতে 404 এর প্রচুর পরিমাণে পাওয়া সাধারণ, দুর্বলতার জন্য পরীক্ষা করা (যেমন ডাব্লুপি অ্যাডমিন) ইত্যাদি - আপনাকে কেবল আপনার সাইটটি সুরক্ষিত আছে তা নিশ্চিত করতে হবে। যাইহোক, এগুলি জিডব্লিউটি দ্বারা রিপোর্ট করার জন্য হয় তবে এই পৃষ্ঠাগুলির লিঙ্ক রয়েছে বা আপনার ডোমেনে হোস্ট করা পূর্ববর্তী কোনও সাইট (ওয়ার্ডপ্রেসের মতো) ছিল?
মিঃউইট

নাঃ। মজার বিষয় হ'ল আমি কখনও ওয়ার্ডপ্রেস ব্যবহার করি নি এবং আমি যে পৃষ্ঠাগুলিকে 404 ত্রুটি হিসাবে দেখেছি তা কখনও ব্যবহার করি নি। আমি কিছু ত্রুটি ঘটিয়েছি (এক পৃষ্ঠ থেকে অন্য পৃষ্ঠায় ইনবাউন্ড লিঙ্কগুলিতে ভুলভাবে url লিখেছি), তবে ভিউটোপিক.এফপি ফাইলটি কখনও হয়নি। সেই সাইটটি এখন বছরের পর বছর ধরে ...
তত্ত্ববমাসী

আমি যখন "এই পৃষ্ঠাগুলির লিঙ্কগুলি" বলি তখন অন্য সাইটগুলি থেকে আমার অর্থ হয় । আপনার প্রতিটি 404 ত্রুটির জন্য (জিডাব্লুটিটিতে) এটি কোথায় থেকে "লিঙ্কযুক্ত" রয়েছে তা আপনাকে দেখানোর জন্য আপনাকে ড্রিল করতে সক্ষম হওয়া উচিত।
মিঃ হোয়াইট

উত্তর:


17

আমি প্রায়শই অন্য সাইটটি দেখি যা আমার সাইটে টন পৃষ্ঠাগুলির সাথে লিঙ্ক করে যা অস্তিত্বহীন। এমনকি যদি আপনি সেই পৃষ্ঠাটিতে ক্লিক করছেন এবং লিঙ্কটি না দেখছেন:

  • সাইটে আগে সেই লিঙ্কগুলি থাকতে পারে
  • সাইটটি কেবল গুগলবোটের কাছে এবং লিঙ্কগুলিতে পরিবেশন করতে এবং দর্শকদের জন্য নয় serving

এটি সম্পদের অপচয়, তবে এটি গুগলকে বিভ্রান্ত করবে না এবং এটি আপনার র‌্যাঙ্কিংয়ে ক্ষতি করবে না। গুগলের জন মুইলারের (যিনি ওয়েবমাস্টার সরঞ্জাম এবং সাইটম্যাপে কাজ করেন) ওয়েবমাস্টার সরঞ্জামগুলিতে প্রদর্শিত প্রায় 404 ত্রুটি এখানে বলেছিলেন :

সাহায্য করুন! আমার সাইটটি 939 ক্রোল ত্রুটি রয়েছে! 1

এই ধরণের প্রশ্ন আমি সপ্তাহে কয়েকবার দেখি; আপনি একা নন - অনেক ওয়েবসাইটে ক্রল ত্রুটি রয়েছে।

  1. অবৈধ ইউআরএলগুলিতে 404 ত্রুটিগুলি কোনওভাবেই আপনার সাইটের তালিকা বা র‌্যাঙ্কিংয়ের ক্ষতি করে না । 100 বা 10 মিলিয়ন আছে কিনা তা বিবেচ্য নয়, তারা আপনার সাইটের র‌্যাঙ্কিংয়ের ক্ষতি করবে না। http://googlewebmastercentral.blogspot.ch/2011/05/do-404s-hurt-my-site.html
  2. কিছু ক্ষেত্রে, ক্রল ত্রুটিগুলি আপনার ওয়েবসাইট বা সিএমএসের মধ্যে কোনও বৈধ কাঠামোগত সমস্যা থেকে আসতে পারে। কীভাবে বলো? ক্রল ত্রুটির উত্সটি ডাবল-চেক করুন। আপনার পৃষ্ঠার স্থির এইচটিএমএলটিতে যদি আপনার সাইটে কোনও ভাঙা লিঙ্ক রয়েছে, তবে এটি সর্বদা ঠিক করা উপযুক্ত worth (ধন্যবাদ + মার্টিনো মোসনা )
  3. "স্পষ্টভাবে বিচ্ছিন্ন" এমন ফানি ইউআরএলগুলি সম্পর্কে কী? আমাদের অ্যালগরিদমগুলি যখন আপনার সাইটের পছন্দ করে তখন তারা এতে আরও দুর্দান্ত সামগ্রী খুঁজে পাওয়ার চেষ্টা করতে পারে, উদাহরণস্বরূপ জাভাস্ক্রিপ্টে নতুন ইউআরএল আবিষ্কার করার চেষ্টা করে। আমরা যদি এই "URL গুলি" চেষ্টা করে দেখি এবং একটি 404 খুঁজে পাই তবে তা দুর্দান্ত এবং প্রত্যাশিত। আমরা কেবল গুরুত্বপূর্ণ কিছু মিস করতে চাই না (অত্যধিক সংযুক্ত Googlebot মেম এখানে sertোকান)। http://support.google.com/webmasters/bin/answer.py?answer=1154698
  4. ওয়েবমাস্টার সরঞ্জামগুলিতে আপনার ক্রল ত্রুটিগুলি ঠিক করার দরকার নেই। "নির্দিষ্ট হিসাবে চিহ্নিত করুন" বৈশিষ্ট্যটি কেবল আপনাকে সহায়তা করার জন্য, যদি আপনি সেখানে নিজের অগ্রগতি ট্র্যাক রাখতে চান; এটি আমাদের ওয়েব-অনুসন্ধান পাইপলাইনে কোনও পরিবর্তন করে না, তাই আপনার যদি এটির প্রয়োজন না হয় তবে নির্দ্বিধায় তা বোধ করেন। http://support.google.com/webmasters/bin/answer.py?answer=2467403
  5. আমরা অগ্রাধিকার অনুসারে ওয়েবমাস্টার সরঞ্জামগুলিতে ক্রল ত্রুটিগুলি তালিকাবদ্ধ করি যা বিভিন্ন কারণের ভিত্তিতে তৈরি। ক্রল ত্রুটির প্রথম পৃষ্ঠাটি যদি পরিষ্কারভাবে অপ্রাসঙ্গিক হয় তবে সম্ভবত আপনি পরবর্তী পৃষ্ঠাগুলিতে গুরুত্বপূর্ণ ক্রল ত্রুটিগুলি খুঁজে পাবেন না। http://googlewebmastercentral.blogspot.ch/2012/03/crawl-errors-next-generation.html
  6. আপনার ওয়েবসাইটে ক্রল ত্রুটিগুলি "ফিক্স" করার দরকার নেই। 404 সন্ধান করা স্বাভাবিক এবং একটি স্বাস্থ্যকর, সু-কনফিগার করা ওয়েবসাইটের প্রত্যাশা। আপনার যদি সমতুল্য নতুন ইউআরএল থাকে, তবে এটিতে পুনর্নির্দেশ করা ভাল অনুশীলন। অন্যথায়, আপনি জাল সামগ্রী তৈরি করবেন না, আপনার নিজের হোমপেজে আপনাকে পুনঃনির্দেশ করা উচিত নয়, আপনার রোবটস.টেক্সটগুলি সেই ইউআরএলগুলি অস্বীকার করা উচিত নয় - এই সমস্ত জিনিস আমাদের পক্ষে আপনার সাইটের কাঠামো সনাক্ত করতে এবং এটিকে সঠিকভাবে প্রক্রিয়া করা আরও শক্ত করে তোলে। আমরা এগুলিকে "নরম 404" ত্রুটি বলি। http://support.google.com/webmasters/bin/answer.py?answer=181708
  7. অবশ্যই - যদি এই ক্রল ত্রুটিগুলি আপনার যত্ন নেওয়া URL গুলি, সম্ভবত আপনার সাইটম্যাপ ফাইলে থাকা URL গুলির জন্য প্রদর্শিত হয়, তবে এটি এমন কিছু যা আপনার সঙ্গে সঙ্গে পদক্ষেপ নেওয়া উচিত। যদি গুগলবোট আপনার গুরুত্বপূর্ণ ইউআরএলগুলি ক্রল করতে না পারে তবে সেগুলি আমাদের অনুসন্ধান ফলাফল থেকে বাদ পড়তে পারে এবং ব্যবহারকারীরা সেগুলি অ্যাক্সেস করতেও সক্ষম নাও হতে পারে।

ধন্যবাদ, যদিও আমি এমন একজনের দাবী সম্পর্কে পড়েছি যে 404 আক্রমণ তাদের পৃষ্ঠার স্থানটিকে নেতিবাচকভাবে প্রভাবিত করেছিল (গুগল ওয়েবমাস্টার ফোরামে আলোচনা, আমি এটি পুনরুদ্ধার করার সাথে সাথেই আমি এটি এখানে পোস্ট করব), এবং কেউ কেউ দাবি করেছেন যে 404 ত্রুটি গণনা করা হয়েছে (গুগল এই লোকেরা দাবি করে না), তাই এটি আমার উদ্বেগগুলির মধ্যে একটি এবং অন্য প্রশ্নটি হ'ল উদ্দেশ্যমূলকভাবে আমার সাইটে ভুল লিঙ্কগুলি কারা প্রচুর টুইট করছে এবং কেন, যদি এটি এসইওর জন্য কিছু না করার কথা বলে? উত্তরটি গৃহীত হয়েছে :)
তত্ত্ববমাসী

সম্পূর্ণ.me একটি বাস্তব সাইট। এমন অনেক হাজারো জঞ্জাল সাইট রয়েছে যা ব্যবহারকারীদের আকর্ষণ করার জন্য লিঙ্কগুলি স্ক্র্যাপ করে এবং পোস্ট করে। এটি স্প্যামডেক্সিংয়ের একটি রূপ। কখনও কখনও এই লিঙ্কগুলি কেবল অল্প সময়ের জন্য উপস্থিত থাকে। বেশিরভাগ ক্ষেত্রে, রাশিয়া এবং পোল্যান্ডে দেখা যায় এমন আরও অনেক আঞ্চলিক দর্শকের সাথে আরও কম আঞ্চলিক অনুসন্ধান ইঞ্জিনগুলিকে প্রভাবিত করার জন্য এটি করা হয় there এর মতো লিঙ্কগুলি প্রায়শই ডাটাবেসগুলি থেকে আসে যা পূর্ববর্তী স্ক্র্যাপিংয়ের প্রচেষ্টা থেকে পাস করা হয়েছিল যাতে পুরানো লিঙ্কগুলি পুনরায় ডুবে যায় এবং নতুন সাইটগুলি পর্যায়ক্রমে ক্রপ হয়। এটি সম্পর্কে আপনি কিছু করতে পারবেন না।
ক্লোজটোক

2
একটি "404 আক্রমণ" অবশ্যই আপনার সাইটের পেজরঙ্ককে প্রভাব ফেলবে না, নয় এর র‌্যাঙ্কিংও। (যদি আপনার প্রতিযোগীরা পৃষ্ঠাগুলির সাথে লিঙ্ক করে সময় ব্যয় করে যে 404, যে তারা দরকারী কিছু করার জন্য ব্যয় করছেন কম সময়, তাই খুশি হোন :)। সাইটগুলি 404 এর থাকার কথা, এটি একটি চিহ্ন যে আপনি সার্ভারটি সঠিকভাবে সেট আপ করেছেন that , তাই যদি কিছু হয় তবে এটি আমাদের জন্য একটি ভাল সংকেত হবে।
জন মুইলার

5

সেখানে প্রচুর স্ক্রিপ্ট রয়েছে যেগুলি বিভিন্ন ধরণের সফ্টওয়্যারগুলিতে পরিচিত দুর্বলতাগুলি খুঁজে পাওয়ার জন্য ইন্টারনেটে এলোমেলোভাবে আইপি অ্যাড্রেসগুলি স্ক্যান করে। 99.99% সময়ের মধ্যে তারা কিছুই খুঁজে পান না (যেমন আপনার সাইটে) এবং সময়টির 0.01%, স্ক্রিপ্টটি মেশিনটিকে pwn করে দেবে এবং স্ক্রিপ্ট নিয়ন্ত্রক যা খুশি তা করবে। সাধারণত, এই স্ক্রিপ্টগুলি মূল স্ক্রিপ্ট কিডির আসল মেশিন থেকে নয়, আগে pwnd করা মেশিনগুলি থেকে বেনামে বোটনেট দ্বারা চালিত হয়।

তোমার কি করা উচিত?

  1. আপনার সাইটটি যাতে অরক্ষিত না হয়েছে তা নিশ্চিত করুন। এর জন্য ধ্রুব নজরদারি প্রয়োজন।
  2. যদি এটি এত লোড উত্পন্ন করে যে স্বাভাবিক সাইটের পারফরম্যান্স প্রভাবিত হয় তবে নির্দিষ্ট সাইট থেকে সংযোগ গ্রহণ না করার জন্য একটি আইপি-ভিত্তিক ব্লকিং বিধি যুক্ত করুন।
  3. আপনার সার্ভার লগগুলি সন্ধান করার সময় সিএমডি.এক্সই বা সিপ্যানেল বা পিএইচপিএমইএডমিন বা অন্যান্য দুর্বলতার জন্য স্ক্যানগুলি ফিল্টার করতে শিখুন।

আপনি বিশ্বাস করেন বলে মনে হয় যে আপনার সার্ভার থেকে যে কোনও ব্যক্তির কাছে 404 ফিরে আসা আপনার সাইটের সম্পর্কে গুগল কী চিন্তাভাবনা করবে তা প্রভাবিত করবে। এটি সত্য নয়। গুগল ক্রোলারদের দ্বারা ফিরে আসা কেবল 404 জন এবং সম্ভবত ক্রোম ব্যবহারকারীরা আপনার সাইটে প্রভাব ফেলবে। যতক্ষণ না আপনার সাইটের সমস্ত লিঙ্কগুলি যথাযথ লিঙ্কগুলি থাকে এবং আপনি যে লিঙ্কগুলি ইতিপূর্বে বিশ্বের সামনে প্রকাশ করেছেন তা অকার্যকর করবেন না, আপনি কোনও প্রভাব দেখতে পাবেন না। স্ক্রিপ্ট বটগুলি কোনওভাবেই গুগলের সাথে কথা বলে না।

যদি আপনি সত্যিকার অর্থে আক্রমণ চালাচ্ছেন তবে আপনাকে কোনও ধরণের ডস প্রশমন সরবরাহকারীর পরিষেবার জন্য সাইন আপ করতে হবে। ভেরিজাইন, নিউস্ট্রার, ক্লাউডফ্লেয়ার এবং প্রলেক্সিক হ'ল এমন সমস্ত বিক্রেতাদের বিভিন্ন ধরণের আক্রমণ সম্পর্কিত বিভিন্ন ধরণের পরিকল্পনা রয়েছে - সাধারণ ওয়েব প্রক্সিং থেকে শুরু করে (যা কিছু সরবরাহকারী থেকে মুক্তও হতে পারে) থেকে ডিএনএস-ভিত্তিক চাহিদা ফিল্টারিং, সম্পূর্ণ বিজিপি পর্যন্ত ভিত্তিক পয়েন্ট অফ উপস্থিতি সুইংগুলি যা আক্রমণগুলি প্রশমিত করে এমন নিয়ম সহ "স্ক্রাবিং" ডেটা সেন্টারের মাধ্যমে আপনার সমস্ত ট্র্যাফিক প্রেরণ করে।

তবে, আপনি যা বলছেন তা থেকে এটি শোনা যাচ্ছে যে আপনি কেবলমাত্র সাধারণ দুর্বলতার স্ক্রিপ্টগুলি দেখছেন যা ইন্টারনেটের কোনও আইপি দেখতে পাবে যে এটি 80 বন্দরটিতে শোনা যাচ্ছে You আপনি আক্ষরিক অর্থে একটি নতুন মেশিন স্থাপন করতে পারেন, খালি অ্যাপাচি শুরু করতে পারেন, এবং কয়েক ঘন্টার মধ্যে, আপনি অ্যাক্সেস লগে সেই লাইনগুলি দেখতে শুরু করবেন।


অনেক অনেক ধন্যবাদ - আমি কিছু অতিরিক্ত ফিল্টার সন্ধান করব, যদিও সার্ভার এবং সাইট সুরক্ষা এত বেশি যে কখনও কখনও বৈধ ব্যবহারকারী ইতিমধ্যে নিষিদ্ধ পৃষ্ঠায় শেষ হয়। "গুগল ক্রোলাররা এবং সম্ভবত ক্রোম ব্যবহারকারীরা কেবল 404s ফিরিয়ে দিয়েছেন" এর জবাবে আমাকে অবশ্যই যুক্ত করতে হবে যে আমি গুগল ওয়েবমাস্টার সরঞ্জামগুলিতে এই লিঙ্কগুলি পেয়েছি, তাই আমি মনে করি যে তারা নিরাপদে অনুধাবন করছে বলে আমি নিরাপদে ধরে নিতে পারি ...
তত্ত্বমসি

গুগল কেন এই অ-অস্তিত্বশীল পৃষ্ঠাগুলিতে চলে যায় তা আপনাকে খুঁজে বের করতে হবে। উদাহরণস্বরূপ, আপনি যদি নিজের অ্যাক্সেস লগগুলিতে বাইরের পক্ষগুলিকে ছেড়ে দেন তবে গুগলের পক্ষে এটি পৌঁছানোর উপায়। আপনার বাইরের দলগুলিকে তাদের মধ্যে intoুকতে দেওয়া উচিত নয়। এছাড়াও, সুরক্ষা কার্যকরভাবে প্রয়োগযোগ্য নির্ভুলতা সম্পর্কে অনেক বেশি, এটি বাইরে আপনি যে যুক্তিবাদী "সুরক্ষা" যোগ করেন সে সম্পর্কে। আমি সন্দেহের সাথে তৃতীয় পক্ষের "সুরক্ষা প্লাগইনগুলি" দেখি। যখন সাইটটি আমি যা চাই ঠিক তা করে এবং কেবল এটিই নিরাপদ it
জন ওয়াট

3

এটি সম্ভবত কোনও আক্রমণ নয় তবে একটি স্ক্যান বা তদন্ত।

স্ক্যানার / প্রোবারের উপর নির্ভর করে এটি সৌম্য হতে পারে, এর অর্থ এটি কেবল কিছু গবেষণার ক্ষমতা সম্পর্কিত বিষয়গুলির সন্ধান করছে বা এটি যদি কোনও উদ্বোধন খুঁজে পায় তবে স্বয়ংক্রিয়ভাবে আক্রমণ করার জন্য এটির কোনও কার্যকারিতা থাকতে পারে।

ওয়েব ব্রাউজারগুলি বৈধ রেফারারের তথ্য রাখে তবে অন্যান্য প্রোগ্রামগুলি তাদের পছন্দসই রেফারার তৈরি করতে পারে।

রেফারার হ'ল তথ্যগুলির এক টুকরো যা আপনার ওয়েব সাইটে অ্যাক্সেস করার প্রোগ্রামগুলি দ্বারা বিকল্পভাবে সরবরাহ করা হয়। এটা তোলে কিছু তারা এমন তা হিসাবে সেট করার জন্য চয়ন হতে পারে totally.meবা random.yu। এমনকি এটি একটি আসল ওয়েবসাইট হতে পারে যা তারা সবেমাত্র নির্বাচন করেছে।

আপনি সত্যিই এটি ঠিক করতে বা এটি আটকাতে পারবেন না। আপনি যদি এই ধরণের প্রতিটি অনুরোধ অবরুদ্ধ করার চেষ্টা করে থাকেন তবে আপনাকে একটি খুব বড় তালিকা বজায় রাখতে হবে এবং এটি মূল্যবান নয়।

যতক্ষণ না আপনার হোস্ট প্যাচগুলি চালিয়ে যাচ্ছেন এবং দুর্বলতাগুলি প্রতিরোধ করবেন, এটি আপনাকে কোনও আসল সমস্যা সৃষ্টি করবে না।


1
যদি 404 এর গুগল ডাব্লুএমটিতে প্রদর্শিত হয় তবে এটি কোথাও আসল লিঙ্ক থেকে from সম্পূর্ণ.me একটি বাস্তব সাইট।
ক্লোজটোক

হ্যাঁ সম্পূর্ণই.এম একটি আসল সাইট এবং সেখান থেকে কিছু ভুল লিঙ্কগুলি আসার ফলে আমার দোষ ছিল (টুইটের বোতামে টাইপস)। এখন এই ভরটি একটি ভিউটোপিক.এইচপিপি / এর সাথে সংযুক্ত আছে? আমার সাইটের যে পৃষ্ঠা পৃষ্ঠাটি শপথ করা হয় সেগুলি কখনও ছিল না। এমনকী আমি সেই ব্যবহারকারীকে চিহ্নিত করতে পারি যে টুইট করেছে (সেই পৃষ্ঠাতে এখন আর কিছুই নেই, তবে আমি ধরে নিই যে অনেক কিছুই ছিল)। ট্রেন্ডিং ট্যাগগুলিতেও ইচ্ছাকৃতভাবে ভুল url ছিল। আমাকে যে উদ্বেগজনক তা হ'ল ব্যবহারকারীর অভিজ্ঞতা, সম্পদ ব্যবহার এবং গুগল সেই নকল 404 ক্রল করছে the অন্যদিকে, খুঁজে পাওয়া যায় না এমন পৃষ্ঠার জন্য আমি পুরো বিশ্বকে নিষিদ্ধ করতে পারি না। কী করবেন সে সম্পর্কে নিশ্চিত নন।
তত্ত্বমাসি

3

সত্যই এটি বট উন্মাদ মত শোনাচ্ছে। আমরা অনেক হোস্ট জুড়ে হাজার হাজার আইপি দ্বারা হামোয়ার হয়ে যাচ্ছি, সম্ভবত সাইটের ওপিতে অপরিচিত। আমি কিছু সহায়ক সমাধান দেওয়ার আগে, আমার কাছে একটি প্রশ্ন ফিরে আসবে তা হ'ল:

প্রশ্ন: গুগল ওয়েবমাস্টার সরঞ্জামগুলিতে আপনি কীভাবে আপনার সাইট থেকে 404 টি দেখতে পাচ্ছেন? জিডব্লিউটি হ'ল গুগলবোট অনুসন্ধানের ফলাফল, অন্য বটের আউটপুট নয়। এছাড়াও, অন্যান্য বটগুলি অ্যানালিটিকসের জন্য জেএস চালায় না ... আপনার কি জিডিডাব্লুটি-তে যাওয়ার মতো এমন কিছু এপিআই জিনিস রয়েছে যেখানে আপনি নিজের সার্ভারের পরিসংখ্যান দেখতে পারবেন? যদি তা না হয় তবে এটি অ্যালার্মের কারণ হতে পারে কারণ এটি গুগলবোট নিজেই ত্রুটিগুলি খুঁজে পেয়েছে finding

  • যদি এটি কেবল গুগলবোট ত্রুটি হয় তবে এটি নির্দেশ করতে পারে যে কেউ আপনার সাইটের লিঙ্কগুলি মঞ্চে দূষিত বাস্তব-মানব-পিসি বটের লক্ষ্যবস্তুতে ফোরামে এবং জিনিসগুলিতে লাগিয়েছিল। ভবিষ্যতে "স্প্যাম চুক্তি" এর মাধ্যমে পোর্টালের মাধ্যমে একাধিক লক্ষ্যমাত্রা নির্ধারণ করে কিছু শোষিত সার্ভারে হার্ভারস্টার + প্লান্টার চলমান চিন্তা করুন।

  • আপনি যদি সত্যিই জানেন যে এটির প্রতিবেদনটি আপনার সম্পূর্ণ সার্ভারের পরিসংখ্যান, তবে আপনার কয়েকটি সরঞ্জামের প্রয়োজন। কয়েকটি অ্যাপস এবং পরিষেবাদি আপনাকে এটিকে ছাঁটাইতে সহায়তা করতে পারে। ধরে নিচ্ছেন আপনি একটি লিনাক্স সার্ভার চালাচ্ছেন:

1) কোনও htaccess ব্ল্যাকলিস্টে আইপিসের আপত্তিজনক যোগ করা শুরু করুন। দেখে মনে হচ্ছে "192.168.1.1 থেকে অস্বীকার করুন" এবং 403 সেগুলি নিষিদ্ধ করবে। দূরে সরে যাবেন না কেবলমাত্র বিজনেসকে অবরুদ্ধ করুন। তারা বাস্তব পোল আইএসপি'র না রয়েছে তা নিশ্চিত করার জন্য 4 ধাপে সাইটের বিরুদ্ধে তাদের পরীক্ষা করুন। আপনি এই ফাইলটি অনুলিপি করতে পারেন এবং এটি ফায়ারওয়ালের বাইরেও যে কোনও অ্যাকাউন্ট / অ্যাপ্লিকেশনটিতে আটকে রাখতে পারেন।

2) এপিএফ ইনস্টল করুন। লিনাক্সে এসএসএইচ এর মাধ্যমে ফায়ারওয়াল পরিচালনা করা এর আসল সহজ। আপনি এইচটি তৈরি করার সময় এটিকে এপিএফ-তে যুক্ত করুন "apf -d 192.168.1.1" " এইচএফটিকে এপিএফের কারণে অপ্রয়োজনীয় মনে হয় তবে এইচটিটি বহনযোগ্য।

3) সিপানেল হাল্ক ইনস্টল করুন এবং আপনার আইপিটির সাদা তালিকাভুক্ত করার বিষয়টি নিশ্চিত করুন যাতে আপনি কোনও পাস ভুলে গেলে এটি কখনই আপনাকে লক আউট করে না। এটি এইচটি + এপিএফ যুক্ত করার জন্য আইপি-র একটি দুর্দান্ত উত্সও হবে। এটিতে এটিতে কিছু স্মার্ট রয়েছে যাতে এটি বুদ্ধিমানভাবে ব্রুট ফোর্স লগইন প্রচেষ্টাকে হ্রাস করতে পারে।

4) স্টপফর্মস্প্যাম.কম এবং প্রোজেচথনাইপট.অর্গ.এর সাথে জড়িত হন এবং তাদের মডিউলগুলি চালিত হন। উভয়ই পরিচিত অনুরোধগুলি অস্বীকার করতে এবং + নতুন ব্রুট / জাল / চিনাস্প্যাম প্রতিবেদন করতে সহায়তা করে। এমন ইমেল ফিল্টার রয়েছে যা আপনি খুব বেশি ব্যবহার করতে পারেন, তবে স্প্যাম ফিল্টারের ক্ষেত্রে জিমেইল এটির মালিক।

5) যেহেতু বটগুলি কখনই ছাড় দেয় না, তাই আপনার প্রশাসনিক পথগুলিকে সুরক্ষা দিন। আপনি যদি ওয়ার্ডপ্রেস চালান, প্রশাসকের পথ পরিবর্তন করুন, ক্যাপচা যুক্ত করুন ইত্যাদি আপনি যদি এসএসএইচ ব্যবহার করেন তবে লগইন পোর্টটি অ-ব্যবহৃত কিছুতে পরিবর্তন করুন, তবে এসএসএইচ রুট লগইনটি বন্ধ করুন। একটি "র‌্যাডমিন" তৈরি করুন যা আপনাকে প্রথমে লগ ইন করতে হবে, তারপরে রুটের জন্য su।

  • ক্যাপচা সম্পর্কে একটি নোট, যদি আপনি একটি উচ্চ ভলিউম সাইটে নিজের ক্যাপচা চালান এবং ফায়ারওয়াল / এইচটি স্তরে বট উন্মাদনাটিকে অস্বীকার না করেন তবে এই সমস্ত "অ্যান্টিস্প্যাম" উইজেটে চিত্র তৈরির কারণে তারা আপনার সিপিইউ চক্রকে হাতুড়ি দিতে পারে।

  • লোড সম্পর্কে একটি নোট, যদি আপনি নিজের সার্ভারে সেন্টোস চালনা করেন এবং ভিপিএস দক্ষতা থাকে তবে ক্লাউডলিনাক্স শক্ত এবং লোড নিয়ন্ত্রণের জন্য দুর্দান্ত। বলুন যে একটি বোট পেয়েছে, কেজএফএস রয়েছে এটি একটি অ্যাকাউন্টে সীমাবদ্ধ করার জন্য। বলুন যে তারা ডিডোএসের সিদ্ধান্ত নিয়েছে .... আপনার সার্ভার ক্রাশ না হওয়ার জন্য অ্যাকাউন্ট (সাইট) লোড ক্যাপড রাখার জন্য LVE আছে। "ভুল সত্তা ব্যবস্থাপনার" পুরো সিস্টেমটি উচ্চারণে এটি একটি ভাল যোগ :)

কিছু ধারণা, আমি আশা করি এটি আপনাকে সাহায্য করবে out


ধন্যবাদ। গুগল ওয়েবমাস্টারগুলিতে আমি এই ত্রুটিগুলি দেখি এই বিষয়টি আমাকে ভাবতে বাধ্য করে - আপনি যেমন সঠিকভাবে উল্লেখ করেছেন - এটি এমন কোনও "এনএসইও" কৌশল আছে (আমার সাইটে শত শত লিঙ্ক রোপণ করা হয়েছে যা আগে কখনও হয়নি)। সাইটটি নিরাপদ, কারণ এই ধরণের আক্রমণগুলি কিছুই করে না। আমি নিশ্চিত নই যে আমি এসইও / ব্যবহারকারীর অভিজ্ঞতার জন্য নিরাপদ (যদি গুগল সূচিত অস্তিত্বশীল পৃষ্ঠাগুলি সূচিত করে তবে আমি কষ্টকর। এই ত্রুটিগুলি ইতিমধ্যে সাইটটিকে র‌্যাঙ্কে ফেলেছে, বিটিডাব্লু)। আবার ধন্যবাদ.
তত্ত্বমাসি

1
গবট 404 পৃষ্ঠাগুলি সূচকটি পাবে না এটি সত্যই আপনার এসইওকে প্রভাবিত করবে না। এটি অন্য পৃষ্ঠাগুলি ট্র্যাফিক প্রেরণে ক্যাশে করতে পারে তবে তা আপনার নয়। এটি যদি সত্যিকারের মানুষের পক্ষে একটি সমস্যা হয়ে দাঁড়ায় তবে ডাব্লুপি-অ্যাডমিনের মতো নানান লিঙ্কগুলির জন্য একটি বিশাল রিডাইরেক্টর তৈরি করুন, তারা কেন এই পৃষ্ঠাটি দেখছেন তা সম্পর্কে তাদের সমস্ত ভূমি একটি সুন্দর লেখার জন্য তৈরি করুন। আপনি যদি ইকম হন তবে তাদের "404 এর জন্য আমি দুঃখিত" কুপন দিন। এগুলি সমস্তকে জিডব্লিউটিতে স্থির হিসাবে চিহ্নিত করার জন্য মনে রাখবেন যাতে এটি আপনার নতুন ল্যান্ডারকে ইনডেক্স করে। এটিতে ব্যাডবোটগুলির জন্য বিকল্পভাবে একটি ব্ল্যাকহোল রাখুন। নির্বিশেষে, যদি এই স্প্যামনেটের আপনার জন্য লিঙ্ক থাকে তবে সরাসরি হিটগুলির জন্য প্রস্তুত থাকুন।
ধাউপিন

ধন্যবাদ। আপাতত আমি চেষ্টা করে যাচ্ছি যে ত্রুটিগুলির ক্ষেত্রে নরম 404 আমি উত্পন্ন ত্রুটিটি কিছুটা কমিয়ে দিই। 404 পৃষ্ঠাটি ইতিমধ্যে একটি কাস্টম হয়েছে এবং আপনাকে দরকারী সম্পর্কিত লিঙ্কগুলি দেবে (এটি যদি এটি সন্ধান করতে পারে)। আমার দ্বারা ভুল বানানের ক্ষেত্রে, আমি একটি 301 সঠিক পৃষ্ঠায় পুনর্নির্দেশ নিক্ষেপ করছি (গুগল তাদের নরম 404 হিসাবে আমি মনে করি)। এই আবর্জনা ক্ষেত্রে /RK=0/RS=YkUQ9t4mR3PP_qt7IW8Y2L36PFo-/, /blog/wp-login.php/, /user/create_form/, /m/, /RK=0/RS=lznPhspsSDFHMiuIUDmmo01LA7w-/(ইত্যাদি ...) আমি ব্যবহারকারী লগ-ইন করার করছি এবং ফিরে 404. আশা করি আমি এটা সঠিক কাজ করছি
tattvamasi

1

সমস্যার ব্যাখ্যা

সবার আগে আপনি যে এই সমস্যাটি করছেন কেবল তিনিই নন - সকলেই। আপনি যা দেখেছেন তা হ'ল স্বয়ংক্রিয় বটগুলি প্রতিটি আইপি ক্রল করে এবং সাধারণ দুর্বলতার সন্ধান করে। সুতরাং তারা মূলত আপনি কী জিনিসগুলি ব্যবহার করছেন তা সন্ধান করার চেষ্টা করেন এবং যদি আপনি phpmyadmin ব্যবহার করেন তবে তারা পরে মানক ব্যবহারকারীর পাসওয়ার্ড সংমিশ্রণের একটি গুচ্ছ চেষ্টা করবে।

আমি অবাক হয়েছি যে এই ধরণের জিনিস আপনি এখনই খুঁজে পেয়েছেন (আপনি সম্ভবত আপনি নিজের সার্ভার শুরু করেছেন)। সমস্যাটি হ'ল আপনি তাদের আইপি ঠিকানা চিরতরে অবরুদ্ধ করতে পারবেন না (সম্ভবত এটি সংক্রামিত কম্পিউটার এবং তার প্রকৃত ব্যবহারকারী এটি কী করছে তা অবগত নয়, এছাড়াও এই জাতীয় আইপি প্রচুর রয়েছে)।

SEO প্রভাব

এর কোনও প্রভাব নেই। এর অর্থ হ'ল কেউ আপনার কম্পিউটারে কিছু অ্যাক্সেস করার চেষ্টা করেছিল এবং এটি সেখানে ছিল না

এটা কি সত্যিই গুরুত্বপূর্ণ?

অবশ্যই, এই লোকেরা কিছু সমস্যার জন্য আপনাকে তদন্ত করার চেষ্টা করে। তদুপরি তারা আপনার সংস্থানগুলি নষ্ট করছে (আপনার সার্ভারকে কোনও উপায়ে প্রতিক্রিয়া দেখাতে হবে) এবং আপনার লগ ফাইলকে কলুষিত করছে

আমি এটি ঠিক কিভাবে করা উচিত

আমার একই সমস্যাটি যা আমি সমাধান করার চেষ্টা করেছি এবং সেরা সরঞ্জাম (এটির সাথে আমি কী করতে পারি বনাম ব্যবহারের সরলতা) আমি খুঁজে পেতে সক্ষম হয়েছি ব্যর্থ2 ban

আপনি যথেষ্ট ভাগ্যবান যেহেতু আমি ইতিমধ্যে একই সমস্যাটি সমাধান করার একটি উপায় খুঁজে পেয়েছি এবং এটি এখানে ডকুমেন্টেডও করেছি (সুতরাং এটি কীভাবে ইনস্টল করতে হয় এবং কীভাবে এটি কাজ করে তা আপনাকে খুঁজে পাওয়ার দরকার নেই)। সার্ভারফল্টে আমার প্রশ্নটি পরীক্ষা করুন । তবে দয়া করে এটি কাজ করছে এটি জানতে ব্যর্থ 2ban সম্পর্কে কিছুটা পড়ুন।


1

যেমন ইতিমধ্যে অনেকে বলেছে, এটি আক্রমণ নয় তবে আপনার সাইটের অ্যাপ্লিকেশন এবং / অথবা আপনার সার্ভারের দক্ষতা অনুসন্ধান বা স্ক্যান করার চেষ্টা। এই সমস্ত অকেজো ট্র্যাফিক এবং সম্ভাব্য বিপজ্জনক স্ক্যানগুলি ফিল্টার করার সর্বোত্তম উপায় হ'ল ডাব্লুএএফএ (ওয়েব অ্যাপ্লিকেশন ফায়ারওয়াল) প্রয়োগ করা। এটি সমস্ত পৃথক প্রচেষ্টা ধরে ফেলবে এবং এগুলিকে ফ্ল্যাগ করবে এবং কেবলমাত্র আপনার সার্ভার এবং ওয়েব অ্যাপ্লিকেশনটিতে সত্যিকারের বৈধ পরিষ্কার ট্র্যাফিক প্রেরণ করবে।

আপনি ক্লাউড ভিত্তিক ডিএনএস ডাব্লুএএফ বা উত্সর্গীকৃত ডিভাইস ব্যবহার করতে পারেন। আমি ব্যক্তিগতভাবে বিভিন্ন ক্লায়েন্ট সাইটের জন্য ইনক্যাপসুলা এবং এফ 5 এএসএম ব্যবহার করি। ব্যয় এক মাসে 500 ডলার হিসাবে কম এবং প্রচুর পরিমাণে সহায়তা করে। এটি আপনার ক্লায়েন্টদের আরও ভাল সুরক্ষা দেয় এবং ওয়েব সার্ভারগুলিতে নিজেই সংস্থান সংস্থান করে যা আপনাকে অর্থ সাশ্রয় করতে এবং গতি বাড়িয়ে তুলবে, এবং এই ডিভাইসগুলি পিসিআই 6.6 এর সম্মতি এবং প্রতিবেদনগুলির সাথে পর্যালোচনা সরবরাহ করে।

আশাকরি এটা সাহায্য করবে.


যদি এটি কেবল "তদন্তের চেষ্টা" হত তবে আপনি এই বাস্তবতাটি কীভাবে ব্যাখ্যা করবেন যে এই 404 গুলি দৃশ্যত জিডব্লিউটি-তে প্রকাশিত হয়েছিল?
মিঃ হোয়েট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.