রোবটস.টেক্সটে আমার কোন বট এবং মাকড়সা ব্লক করা উচিত?


14

যাতে:

  1. আমার ওয়েবসাইটের সুরক্ষা বাড়ান
  2. ব্যান্ডউইথ প্রয়োজনীয়তা হ্রাস করুন
  3. ইমেল ঠিকানা কাটা রোধ করুন

উত্তর:


17

ইমেল সংগ্রহ করা বা দুর্বলতার জন্য আপনার সাইটের পরীক্ষা করা কোনও বট আপনার রোবটস টেক্সটকে সম্মান করবে না। প্রকৃতপক্ষে এই দূষিত বটগুলি আপনার সাইটের মানচিত্রের জন্য রোবটস টেক্সটকে দেখে at আপনার যদি কোনও পয়েন্ট থাকে Disallow:তবে এটি আপনার সাইটে আরও ভাল আক্রমণ করার জন্য ব্যবহৃত হবে। আপনার সাইটটিকে ম্যানুয়ালি দেখছে এমন একজন হ্যাকারকে আপনি অস্বীকার করার চেষ্টা করছেন এমন কোনও ফাইল / ডিরেক্টরি পরীক্ষা করার জন্য অতিরিক্ত সময় ব্যয় করা উচিত।


3
আকর্ষণীয় বিষয়। আমি অবাক হয়েছি যদি তা বাতিল হয়ে যাওয়ার তালিকায় কোনও ভুয়া পৃষ্ঠা যুক্ত করা বুদ্ধিমান হয় তবে যার একমাত্র উদ্দেশ্য আইনটিতে এই জাতীয় বটগুলি ধরা হয় যাতে সেগুলি স্বয়ংক্রিয়ভাবে অবরুদ্ধ হয়ে যায়।
স্টিভেন সুদিত

5
@ স্টিভেন সুদিত এটি খারাপ ধারণা নয়। একে মধু পাত্র বলা হবে।
রক

হ্যাঁ, এটি ঠিক, যদিও আমি ডিরেক্টরি সংকলকগুলির (স্ট্যান্ড বুক ইত্যাদির) স্ট্যান্ডার্ড ট্রিকটি সম্পর্কে অল্প সংখ্যক জাল এন্ট্রি যুক্ত করার চিন্তা করছিলাম যাতে পাইকারি চুরি সনাক্ত করা যায়।
স্টিভেন সুদিত

যদি আপনি সেই হানিপোটকে তারপাইট হিসাবেও ব্যবহার করেন এটি অবৈধ সূচকগুলিকেও বিরক্ত করবে। স্প্যামারদের কাছে এটি করা মোটামুটি সাধারণ - একটি হানিপট ইনডেক্সযোগ্য ইমেল ঠিকানা ছেড়ে যান যা তারপল ইমেল সার্ভারের দিকে নিয়ে যায়।
মার্ক হেন্ডারসন

@ ফার্সেকার যারা বিধি লঙ্ঘন করেছেন তাদের শাস্তি দেওয়ার ক্ষেত্রে আমি কোনও সমস্যা দেখছি না। যদিও খারাপ ডেটা সহ স্প্যামারদের ট্রিক করা একটি আকর্ষণীয় মোচড়।
দাড়কাক

4

robots.txt আপনার ওয়েবসাইটের সুরক্ষা বাড়িয়ে তুলবে না বা ই-মেইল ঠিকানা কাটা আটকাবে না। robots.txt অনুসন্ধান ওয়েবসাইটগুলির জন্য আপনার ওয়েবসাইটের অংশগুলি বাদ দিতে একটি গাইড। এগুলি সূচিযুক্ত করা হবে না এবং যে কোনও বিভাগে আপনি সর্বজনীন অনুসন্ধান ইঞ্জিনগুলিতে দেখাতে চান না তার জন্য ব্যবহার করা উচিত।

তবে এটি কোনওভাবেই সুরক্ষা বাড়াতে বা ই-মেইল কাটা রোধ করতে আপনার সম্পূর্ণ সাইট ডাউনলোড করা থেকে অন্য কোনও বটকে আটকাবে না। সুরক্ষা বাড়ানোর জন্য আপনাকে প্রমাণীকরণ যুক্ত করতে হবে এবং সুরক্ষিত বিভাগগুলির বাইরে কেবলমাত্র অনুমোদিত ব্যবহারকারীদেরই অনুমতি দেওয়া উচিত। ই-মেইল ঠিকানা কাটা রোধ করার জন্য কোনও ওয়েবসাইটটিতে ই-মেইলগুলি সরল পাঠ্যে (বা সহজেই অনির্বচনীয় পাঠ্য) রাখবেন না।


1

robots.txt আপনাকে সুরক্ষায় সহায়তা করবে না। ছায়াময় কিছু করতে চাইলে যে কোনও বট এটিকে যাইহোক উপেক্ষা করবে।


0

Robots.txt ফাইলটি কেবল একটি অনুরোধ হিসাবে কাজ করে যে বট এবং মাকড়সা নির্দিষ্ট সামগ্রীর কিছু টুকরা একা রেখে দেয়; এটি আসলে তাদের অ্যাক্সেসকে আটকাতে পারে না। "ভাল" বটগুলি এটি সম্মান করবে, তবে "খারাপ "গুলি (সম্ভবত আপনি যেগুলি ব্লক করতে চান) এটিকে উপেক্ষা করবে এবং যাইহোক প্রসারিত হবে।


-1

Robots.txt এর পরিবর্তে, আপনাকে ক্যাপচ্যা কোডগুলি ব্যবহার করতে হবে।


ক্যাপচা কোডগুলির ওয়েব ক্রলারের সাথে কোনও সম্পর্ক নেই (যা হ'ল রোবটস টেক্সট ঠিকানা)।
ব্যবহারকারী 48838

এটি একটি ভ্রান্ত ডাউনওয়েট ছিল। পুরো বিষয়টি হ'ল কোনও ক্রোলার রোবটস.টেক্সটকে উপেক্ষা করতে পারে, তবে ক্যাপচা কোডগুলি একেবারে অবরুদ্ধ না করে কমপক্ষে এটিকে কমিয়ে দেবে। ভুল হওয়ার জন্য আপনাকে ধন্যবাদ।
স্টিভেন সুদিত 12:53
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.