কোনও পৃষ্ঠার নির্দিষ্ট অংশ ক্রল করা থেকে রোবটদের আটকাচ্ছেন


28

একটি ফোরাম রয়েছে এমন একটি ক্ষুদ্র সাইটের দায়িত্বে থাকা একজন ওয়েবমাস্টার হিসাবে, আমি নিয়মিতভাবে ব্যবহারকারীদের কাছ থেকে অভিযোগ পেয়েছি যে অভ্যন্তরীণ অনুসন্ধান ইঞ্জিন এবং বাহ্যিক অনুসন্ধানগুলি (যেমন গুগল ব্যবহার করার সময়) উভয়ই আমার ব্যবহারকারীদের স্বাক্ষর দ্বারা সম্পূর্ণ দূষিত (তারা দীর্ঘ ব্যবহার করছে স্বাক্ষর এবং এটি ফোরামের অভিজ্ঞতার অংশ কারণ স্বাক্ষরগুলি আমার ফোরামে অনেক অর্থবোধ করে)।

সুতরাং মূলত আমি এখন পর্যন্ত দুটি বিকল্প দেখছি:

  1. ছবি হিসাবে স্বাক্ষরটি রেন্ডারিং এবং যখন কোনও ব্যবহারকারী "স্বাক্ষর চিত্র" এ ক্লিক করেন তখন এটি এমন একটি পৃষ্ঠায় নিয়ে যায় যা আসল স্বাক্ষর (স্বাক্ষরের লিঙ্কগুলি সহ) সম্বলিত পৃষ্ঠায় নিয়ে যায় এবং সেই পৃষ্ঠাটি অনুসন্ধানের মাধ্যমে অ-ক্রলযোগ্য হিসাবে সেট করা থাকে search ইঞ্জিন মাকড়সা)। এটি কিছু ব্যান্ডউইদথ গ্রাস করবে এবং কিছু কাজের প্রয়োজন হবে (কারণ আমার ছবি প্রযোজনার জন্য এইচটিএমএল রেন্ডারারের দরকার ছিল) তবে স্পষ্টতই এটি সমস্যার সমাধান করবে (স্বাক্ষরের ফন্ট / রঙের স্কিমটি সম্মান করবে না এমন ছোট্ট গ্যাচগুলি রয়েছে) ব্যবহারকারীরা কিন্তু আমার ব্যবহারকারীরা তাদের স্বাক্ষরগুলি নিয়ে যে কোনও উপায়ে কাস্টম ফন্ট / রঙ / আকার ইত্যাদি ব্যবহার করে খুব সৃজনশীল তাই এটি কোনও সমস্যা নয়)

  2. ওয়েবপৃষ্ঠার প্রতিটি অংশকে চিহ্নিত করা হচ্ছে যাতে অ-ক্রলযোগ্য হিসাবে স্বাক্ষর রয়েছে।

তবে আমি পরে সম্পর্কে নিশ্চিত নই: এটি কি এমন কিছু করা যায় যা করা যায়? আপনি কি কেবল কোনও ওয়েবপৃষ্ঠার নির্দিষ্ট অংশগুলিকে অ-ক্রলযোগ্য হিসাবে চিহ্নিত করতে পারেন?

উত্তর:


8

স্ট্যাক ওভারফ্লোতে গুগলের জন্য নয়েডেক্স ট্যাগকে আমি সরবরাহ করেছি একই উত্তরটি এখানে :

আপনি গুগলকে রোবট ডট টেক্সট দ্বারা অবরুদ্ধ হওয়া আইফ্রেমে সেই অংশগুলি রেখে পৃষ্ঠার অংশগুলি দেখতে বাধা দিতে পারেন।

robots.txt এর

Disallow: /iframes/

index.html

This text is crawlable, but now you'll see 
text that search engines can't see:
<iframe src="/iframes/hidden.html" width="100%" height=300 scrolling=no>

/iframes/hidden.html

Search engines cannot see this text.

আইফ্রেমেস ব্যবহার না করে আপনি এজেএক্স ব্যবহার করে লুকানো ফাইলের সামগ্রীগুলি লোড করতে পারেন। এখানে একটি উদাহরণ যা jquery এজাক্স ব্যবহার করে:

his text is crawlable, but now you'll see 
text that search engines can't see:
<div id="hidden"></div>
<script>
    $.get(
        "/iframes/hidden.html",
        function(data){$('#hidden').html(data)},
    );
</script>

এজেএক্স ব্যবহার করে সংযোজন / ইনজেকশন নিয়ন্ত্রণ কি এটিকে ক্রল করা থেকে বঞ্চিত করতে এবং প্রতিরোধ করতে সহায়তা করবে?
প্রণব বিলুরকার

যতক্ষণ না এজেএক্স থেকে অবস্থান নেওয়া হচ্ছে ততক্ষণ রোবটসটিটিএসটি দ্বারা অবরুদ্ধ।
স্টিফেন অস্টেরমিলার

আপনি এই চেক করে দেখবেন webmasters.stackexchange.com/questions/108169/... এবং যদি কোন সুপারিশ।
প্রণব বিলুরকার

যতক্ষণ না এজেএক্স থেকে অবস্থান নেওয়া হচ্ছে রোবটস টেক্সট দ্বারা অবরুদ্ধ করা হয়েছে - দয়া করে এটি বিশদভাবে বর্ণনা করুন।
প্রণব বিলুরকার

2
গুগল যারা অপব্যবহার রোধ করার জন্য তাদের জাভাস্ক্রিপ্টকে ক্রল হওয়া থেকে আটকায় তাদের শাস্তি দেয়। আইফ্রেমেসের ক্ষেত্রেও কি একই সত্য?
জোনাথন

7

আরেকটি সমাধান হ'ল সিগটিকে একটি স্প্যান বা ডিভের সাথে স্টাইল সেট করে গুটিয়ে রাখা display:noneএবং তারপরে জাভাস্ক্রিপ্ট ব্যবহার করা যাতে জাভাস্ক্রিপ্ট চালু থাকা ব্রাউজারগুলির জন্য টেক্সট প্রদর্শিত হয়। অনুসন্ধান ইঞ্জিনগুলি জানে যে এটি প্রদর্শিত হচ্ছে না তাই এটি সূচী করা উচিত নয়।

এইচটিএমএল, সিএসএস এবং জাভাস্ক্রিপ্টের এটি করা উচিত:

এইচটিএমএল:

<span class="sig">signature goes here</span>

সিএসএস:

.sig {
display:none;
}

জাভাস্ক্রিপ্ট:

<script type="text/javascript"> 
$(document).ready(function()
  {
      $(".sig").show();
  }
</script>

আপনার একটি জেকারি লাইব্রেরি অন্তর্ভুক্ত করতে হবে ।


4
+1 এবং আমি এটি সম্পর্কে ভেবেছিলাম কিন্তু এটিকে বিভিন্ন মাকড়সা দ্বারা "ক্লোনিং" রূপ হিসাবে বিবেচনা করা হবে না?
ওয়েববি দ্য ওয়েলবার

3
গুগলের দ্বারা নয়: thisonewsblog.com/3383/google-hided-text
পলমোরিস

1
আমি মনে করি এটি বেশ ঝরঝরে :-)
পলমোরিস

এটি, কঠোর সংজ্ঞাতে ক্লোনিং হিসাবে বিবেচিত হতে পারে। তবে তিনি ডকুমেন্ট.ওরাইট ("") ব্যবহার করে জাভাস্ক্রিপ্ট সহ সমস্ত স্বাক্ষর মুদ্রণ করতে পারেন; গুগল জাভাস্ক্রিপ্টের মধ্যে কিছু সূচী করে না। সমর্থন.
google.com/customsearch/bin/…

আমি বিশ্বাস করি যে গুগল সিএসএস ব্যবহার করে লুকিয়ে থাকলেও এই জাতীয় অনুচ্ছেদগুলি সূচক করতে পারে। সবচেয়ে নিরাপদ বিকল্পটি হ'ল এইচটিএমএলটিতে কোনও অংশই অন্তর্ভুক্ত না করা। (আমরা রানটাইমের সময় পাঠ্যটি ইনজেক্ট করতে জাভাস্ক্রিপ্ট ব্যবহার করতে পারি))
রাইগিয়েল

3

আমার অনুরূপ সমস্যা ছিল, আমি এটি সিএসএস দিয়ে সমাধান করেছি তবে এটি জাভাস্ক্রিপ্ট এবং jquery দিয়েও করা যেতে পারে।

1 - আমি একটি ক্লাস তৈরি করেছি যা আমি " disallowed-for-crawlers" কল করব এবং সেই ক্লাসটি এমন কিছুতে স্থাপন করব যা আমি গুগল বট দেখতে চাইনি বা এই শ্রেণীর সাথে একটি স্প্যানের মধ্যে রেখে দিয়েছি।

2 - পৃষ্ঠার মূল সিএসএসে আমার মতো কিছু থাকবে

.disallowed-for-crawlers {
    display:none;
}

3- ডিসিলনএলএসএসএস নামে একটি সিএসএস ফাইল তৈরি করুন এবং রোবটস.টেক্সটকে ক্রল করতে নিষেধ করার জন্য এটি যুক্ত করুন, সুতরাং ক্রোলাররা সেই ফাইলটি অ্যাক্সেস করতে পারবেন না, তবে এটি প্রধান সিএসএসের পরে আপনার পৃষ্ঠার রেফারেন্স হিসাবে যুক্ত করুন।

4- disallow.cssআমি কোডটি রেখেছি:

.disallowed-for-crawlers {
    display:block !important;
}

আপনি জাভাস্ক্রিপ্ট বা সিএসএস দিয়ে খেলতে পারেন। আমি কেবল বারণ এবং সিএসএস ক্লাসগুলির সুবিধা নিয়েছি। :) আশা করি এটি কাউকে সাহায্য করবে।


আমি নিশ্চিত নই যে ক্রলকারীরা .css ফাইল অ্যাক্সেস না করার কারণে এটি কাজ করে (এটি কি কোনও জিনিস? যেহেতু ক্রলাররা নির্দিষ্ট সিএসএস ফাইলগুলি অ্যাক্সেস করে এবং ক্রল করে?) এবং কেবল প্রদর্শনের কারণে নয়: কিছুই নয় এবং ক্রলারের বোঝার ফলে এটি প্রদর্শিত হবে না তারা এটি সূচক না। এমনকি যদি এটি হয় তবে আপনি প্রকৃতপক্ষে মানব ব্যবহারকারীদের কাছে সামগ্রীটি প্রদর্শন করতে কী করবেন?
Γούλας

পদক্ষেপ 4 যখন মানব ব্যবহারকারীর জন্য লোড করা হয় তখন যেহেতু তাদের সেই ফাইলটি দেখার অনুমতি দেওয়া হয় (ডিসিলন সিএসএস) প্রদর্শিত হয়। এবং রোবটগুলি সিএসএস লোড করার বিষয়ে যা আজকাল শ্রদ্ধেয় সার্চ ইঞ্জিনগুলি করে, এটি কোনও ওয়েবসাইটের মোবাইল বন্ধুত্বপূর্ণ কিনা তা তারা নির্ধারণ করে, যে ক্রোলাররা এটির সম্মান করে না সেগুলি চিন্তা করার মতো নয়, প্রধান অনুসন্ধান ইঞ্জিনগুলি সিএসএস এবং জাভাস্ক্রিপ্ট ক্রল করার জন্য পড়েন পৃষ্ঠাগুলি, তারা প্রায় 6 বছর ধরে এটি করছে? হয়তো আরো.
রোল্যান্ডো রেটানা

আপনি কি সেই দাবির ব্যাক আপ উত্স প্রদান করতে পারেন? দয়া করে ওয়েবমাস্টার্স.স্ট্যাকেক্সেঞ্জার্ভিউ / প্রশ্নগুলি / 15১464646/২ এবং yoast.com/dont- block-css- and- js-files দেখুন এবং সর্বাগ্রে এখানে ওয়েবমাস্টারস্বেলব্লগ.কম / ২০১৪ / ১০ / আপনি এখানে যা বর্ণনা করেছেন তা চিত্রিত করা হয়েছে খারাপ অভ্যাস হিসাবে।
13 Γούλας

গুগল যদি আমার ওয়েবসাইটটি সাধারণত আমার ওয়েবসাইট দেখতে চান এবং আমি সমস্ত সিএসএস ব্লক করে থাকি এবং এটি খারাপ অভ্যাস হয় কারণ তারা সিএসএস ব্যাখ্যা করে তবে এটি নির্দিষ্ট ক্ষেত্রে আমি একটি নির্দিষ্ট ফাইল ব্লক করি, সমস্ত সিএসএস নয়, ওপি জিজ্ঞাসা করে পৃষ্ঠার একটি বিভাগ পড়া থেকে গুগল প্রতিরোধ সম্পর্কে। তবে আমি চাই না যে গুগল এই বিভাগগুলি ক্রল করে যাতে আমি একটি একক সিএসএস ব্লক করি (সেগুলি সবই নয়, কেবল একটিই)। এবং আপনি কি দাবি করেছেন ব্যাক আপ? যেটি ক্রলারের জেএস এবং সিএসএস পড়ে? এটি আপনার গুগল ওয়েবমাস্টার সরঞ্জামগুলিতে যাওয়ার মতই সহজ এবং "রোবোট হিসাবে আনুন" তে একবার দেখুন আপনি সেখানে তারা কীভাবে সিএসএস এবং জেএস পড়বেন তা দেখতে পাবেন।
রোল্যান্ডো রেটানা

এছাড়াও যোগ করার জন্য, আমার নির্দিষ্ট ক্ষেত্রে আমি গুগল ক্রলারের সাথে কিছু ছায়াময় কিছু করতে চাই তা নয়, আমি কেবল গুগলকে তথ্যের একটি বিভাগ পড়তে চাই না যা সমস্ত পৃষ্ঠায় পুনরাবৃত্তি বলে মনে হতে পারে। ফোন নম্বর, ঠিকানা, সম্পর্কিত পণ্য বা তথ্য যা গুগল ক্রল করার জন্য প্রাসঙ্গিক নয় Like
রোল্যান্ডো রেটানা

2

এটি করার একটি উপায় হ'ল সরল পাঠ্যের চেয়ে পাঠ্যের একটি চিত্র ব্যবহার করা ।

এটা সম্ভব যে গুগল শেষ পর্যন্ত চিত্রটির বাইরে লেখাটি পড়তে যথেষ্ট স্মার্ট হয়ে উঠবে, তাই এটি পুরোপুরি ভবিষ্যত-প্রমাণ নাও হতে পারে তবে এখন থেকে কমপক্ষে কিছু সময়ের জন্য এটি ভালভাবে কাজ করা উচিত।

এই পদ্ধতির অসুবিধার একগুচ্ছ রয়েছে। যদি কোনও ব্যক্তি দৃষ্টি প্রতিবন্ধী হয় তবে এটি খারাপ। আপনি যদি নিজের সামগ্রীটি ডেস্কটপ কম্পিউটার বনাম মোবাইল ডিভাইসের সাথে মানিয়ে নিতে চান তবে এটি খারাপ। (এবং এইভাবে)

তবে এটি বর্তমানে (কিছুটা) কাজ করে এমন একটি পদ্ধতি।


আপনি যদি Alt এবং শিরোনাম টেজ যথাযথভাবে ব্যবহার করেন তবে এই কাজটি কতটা ভাল?
জেইন

চেষ্টা করা হয়নি, তবে মনে হয় গুগল সেগুলি ক্রল করবে। এটি এই পদ্ধতির একটি প্রধান সীমাবদ্ধতা।
জেমস ফস্টার

1

এটা সহজ.

আপনি নিজের পৃষ্ঠা পরিবেশন করার আগে আপনার এটি জানতে হবে যে এটি বট, কম্পিউটার বা ফোনে রয়েছে কিনা। তারপরে আপনাকে সেই অনুযায়ী সামগ্রী সেট করতে হবে। এটি এই দিন এবং বয়সের স্ট্যান্ডার্ড অনুশীলন এবং কিছু সিএমএসের মূল কার্যকারিতা।

আপনার এইচটিসেসে রাখা যেতে পারে এমন এজেন্ট এজেন্টের ভিত্তিতে পুনর্নির্দেশ করার জন্য এসই-তে প্রচুর সমাধান রয়েছে। যদি এটি আপনার ফোরামের সফ্টওয়্যারটির জন্য স্যুট করে তবে গুফ এবং ছাঁটাই ছাড়াই গুগলের যা প্রয়োজন তা বিতরণ করতে আপনি একই ডিবি থেকে আলাদা কোড চালাতে পারেন।

বিকল্পভাবে আপনি আপনার পিএইচপি কোডে একটি সামান্য লাইন রাখতে পারেন যা একটি করে 'যদি ব্যবহারকারী এজেন্ট == গুগলবট তবে স্বাক্ষরগুলি দেখায় না' does

আপনি যদি সত্যিই এটি না করতে পারেন তবে আপনি বটকে পরিবেশন করতে mod_proxy পেতে পারেন এবং আপনার পিএইচপি কোডটি উত্পন্ন করে এমন কিছু বের করে দিতে ব্যবহার করতে পারেন যা বটটি দেখার দরকার নেই।

প্রযুক্তিগতভাবে গুগল তাদের সার্চ ইঞ্জিনকে সাধারণ সাইট ভিজিটর যা দেখেছে তার থেকে আলাদা একটি পৃষ্ঠা দেখানো অনুমোদন করে না, তবে আজ অবধি, তারা বিবিসি এবং অন্যদের নেয়নি যা তাদের অনুসন্ধান ইঞ্জিনের ফলাফলগুলি থেকে ব্রাউজার / আইপি / দর্শক-নির্দিষ্ট সামগ্রী সরবরাহ করে taken । তাদের বটটি 'কনড' করা হয়েছে কিনা তা দেখারও তাদের সীমিত উপায় রয়েছে।

কোনও স্ক্রিপ্ট দ্বারা পুনরায় সক্ষম করার জন্য সিএসএসের সাথে সামগ্রী লুকিয়ে রাখার বিকল্প সমাধানটিও ধূসর অঞ্চল is 20/6/11 এর নিজস্ব ওয়েবমাস্টার সরঞ্জাম নির্দেশিকা অনুসারে এটি ভাল ধারণা নয়:

http://www.google.com/support/webmasters/bin/answer.py?answer=66353

এটি পাথরে castালানো ট্যাবলেট নাও হতে পারে তবে এটি আপডেট এবং গুগল।

কন্টেন্টটি লুকানোর বিষয়টি জাভাস্ক্রিপ্ট না থাকা সংখ্যালঘুদের সাথে কাজ করবে না, এটি একটি বিশাল উদ্বেগের বিষয় নাও হতে পারে, তবে দস্তাবেজটি লোড হওয়ার জন্য অপেক্ষা করা এবং তারপরে স্বাক্ষরগুলি দেখানো আপনার সন্তুষ্ট দেখার মতো অভিজ্ঞতা হবে না পৃষ্ঠাটি লোড হয়ে গেছে বলে মনে করুন, তারপরে লুকানো স্বাক্ষরগুলি পৃষ্ঠার নিচে সামগ্রীটি চাপ দেওয়ার পরে এটি প্রায় লাফিয়ে উঠবে। এই ধরণের পৃষ্ঠা লোড বিরক্তিকর হতে পারে যদি আপনার কাছে নিম্ন-প্রান্তের নেট-টপ থাকে তবে দ্রুত ইন্টারনেট সংযোগে আপনার কাছে একটি দ্রুত বিকাশকারী মেশিন থাকলে তা লক্ষণীয় হতে পারে না।


6
@ ʍǝɥʇɐɯ: পৃষ্ঠায় কে অ্যাক্সেস করছে তার উপর নির্ভর করে বিভিন্ন সামগ্রীর পরিবেশন করা ভ্রূক্ষেপযুক্ত এবং আমি যতদূর বুঝতে পারি ততক্ষণ অনুসন্ধান ইঞ্জিনে আপনাকে শাস্তি দিতে পারে। আমি অনেকটা পলমোরিসের জাভাস্ক্রিপ্ট সমাধান পছন্দ করি।
WebbyTheWebbor

@ ʍǝɥʇɐɯ: ইরফ, যদি ব্যক্তিগতকৃত সামগ্রীর পরিবেশন করা গেমের নাম হয় তবে জাভাস্ক্রিপ্ট। সর্বশেষে আমি জাভাস্ক্রিপ্ট ইনস্টল না করে সামগ্রিকভাবে ওয়েবটি পুরোপুরি কার্যকর হয়নি তা পরীক্ষা করে দেখেছে (GMail, ফেসবুক, গুগল ডক্স, স্ট্যাক ওভারফ্লো, Google+ - আপ আমি এটি ইতিমধ্যে পেয়েছি;) - ইত্যাদি)। জাভাস্ক্রিপ্ট উপলব্ধ নয় যে মিথ্যা ভিত্তির ভিত্তিতে পলমোরিসের সমাধানটি সমালোচনা করার দরকার নেই বলে মনে হচ্ছে।
WebbyTheWebbor

@ ʍǝɥʇɐɯ: আপনি যে খুব বিষয়ে ম্যাট Cutts (Google- এ এসই ভারপ্রাপ্ত) থেকে এই পছন্দ করতে পারেন: theseonewsblog.com/3383/google-hidden-text দ্বারা চমৎকার মন্তব্য ছিল paulmorris তার চমৎকার উত্তর মন্তব্যে পোস্ট করা হয়েছে। আমি দুঃখিত তবে জাভাস্ক্রিপ্টকে "ফোলা" নামক ফোরামে ট্রোলিংয়ের কাছাকাছি।
WebbyTheWebbor

... এবং তারপরে আমরা এই প্রশ্নটি পেয়ে যাব: ওয়েবমাস্টার্স.স্ট্যাকেক্সেঞ্জার / প্রশ্নস / ১63৩৯৮/২ - 'কীওয়ার্ড স্টাফিং' মূর্খ। এর জন্যে দুঃখিত.
17

আমি বিশ্বাস করি এটি "ক্লোনিং" এর আওতায় পড়ে এবং তাই এটি কোনও ভাল অনুশীলন নয়।
Γούλας

0

না, পৃষ্ঠাগুলির ক্রলিং রোবটগুলি রোধ করার কোনও উপায় নেই। এটি পুরো পৃষ্ঠা বা কিছুই নয়।

গুগলের অনুসন্ধানের ফলাফলগুলির স্নিপেটগুলি সাধারণত পৃষ্ঠায় মেটা বিবরণ থেকে নেওয়া হয় । সুতরাং আপনি মেটা বর্ননা ট্যাগে গুগলকে পৃষ্ঠার একটি নির্দিষ্ট অংশ প্রদর্শন করতে পারেন। ব্যবহারকারীর দ্বারা উত্পাদিত সামগ্রীর সাথে ভাল স্নিপেটগুলি পাওয়া শক্ত, তবে থ্রেডের প্রথম পোস্ট নেওয়া সম্ভবত কাজ করবে।

জাভাস্ক্রিপ্ট ব্যবহার করা কেবলমাত্র অন্য কোনও উপায় of পলমোরিসের মতো কিছু প্রস্তাবিত হতে পারে কাজ তবে আমি মনে করি যে অনুসন্ধান ইঞ্জিনগুলি HTML এ থাকা সত্ত্বেও সামগ্রীটি সূচী করে। আপনি এটি এইচটিএমএল থেকে অপসারণ করতে পারেন, এটি জাভাস্ক্রিপ্ট স্ট্রিংয়ে সংরক্ষণ করতে পারেন, তারপরে এটি পৃষ্ঠা লোডে আবার যুক্ত করতে পারেন। যদিও এটি কিছুটা জটিল হয়।

শেষ অবধি, একটি জিনিস মনে রাখতে হবে: গুগল যদি তাদের স্নিপেটগুলিতে ব্যবহারকারীর স্বাক্ষরগুলি দেখায়, তবে এটি সিদ্ধান্ত নিয়েছে যে এটি ব্যবহারকারীর প্রশ্নের সাথে সবচেয়ে প্রাসঙ্গিক।


1
গুগল তাদের স্নিপেটগুলিতে ব্যবহারকারীর সিগগুলি দেখায় তেমন সমস্যা নয় কারণ এই নির্দিষ্ট পৃষ্ঠাগুলি গুগলে প্রথম স্থানে রয়েছে। ইস্যু এখানে অবিকল আমি বলতে চাচ্ছি, যে ঠিক কি আমার প্রশ্নের সব সম্পর্কে: গুগল যখন তারা আসলে না হন sigs প্রাসঙ্গিক মনে করতে পারে।
WebbyTheWebbor

@ ওয়েবি, আমি বুঝতে পারি না, আপনি কেন আপনার পৃষ্ঠাগুলি উচ্চতর র‌্যাঙ্কিং চান না? আপনার কি কিছু উদাহরণ পৃষ্ঠা এবং ক্যোয়ারী রয়েছে যাতে আপনি কী বলছেন তা আমরা দেখতে পারি? যদি Google অনুসন্ধান ফলাফলে একটি স্বাক্ষর দেখানো হয়, তাহলে এটি হল যে অনুসন্ধান ক্যোয়ারী জন্য প্রাসঙ্গিক, যদিও তা পৃষ্ঠায় সরাসরি প্রাসঙ্গিক নয়।
অসন্তুষ্ট গোট

1
আমি উদাহরণ দিতে পারবে না কিন্তু আমি কি অত্যন্ত পদে আমার সাইট / ফোরাম চান এবং এটা এত খুব সুন্দরভাবে করে। সমস্যাটি হ'ল অনুসন্ধানের ফলাফলগুলির মধ্যে (যা বেশিরভাগ ক্ষেত্রেই আমার সাইট / ফোরামের জন্যই হয় কারণ এটি মূলত এটি সাইটের উপরের সাইট), আসল প্রবেশের পৃষ্ঠাগুলি কী হওয়া উচিত তা স্বাক্ষরগুলির মধ্যে প্লাবিত হয়। আমি বলতে চাচ্ছি, আমি কি সত্যিই কি আমি প্রশ্ন জিজ্ঞাসা করতে চাই। এবং এটি ছবি বা জাভাস্ক্রিপ্ট হতে চলেছে।
WebbyTheWebbor

@ ওয়েবি, আপনার প্রতিক্রিয়াগুলি কিছুটা বিভ্রান্তিকর হয়েছে তবে আপনি বোঝাচ্ছেন যে আপনার ব্যবহারকারীর স্বাক্ষরগুলি পৃথক পৃথক পৃষ্ঠা (ইউআরএল) এবং সুতরাং এসইআরপিগুলিতে পৃথক ফলাফল হিসাবে প্রদর্শিত হচ্ছে। এই ক্ষেত্রে আপনি রোবটস.টি.এস.টি.এস.টির মাধ্যমে এই পৃষ্ঠাগুলি ব্লক করতে পারেন can অন্যথায়, আমি উপরে পোস্ট করা মেটা বিবরণ সমাধান চেষ্টা করে দেখুন, কারণ এটি অবশ্যই সমস্যাটি কমিয়ে দেবে।
অসন্তুষ্ট গোট

0

আপনি যদি কোনও "অন্য" সাথে একটি ক্যাপচায় নেতৃত্ব দেন যা যদি অংশটির জন্য কী দেয় তবে আপনি পৃষ্ঠাটি পিএইচপিতে রাখতে পারেন।

আমি সত্যিই মাথা ঘামাই না কারণ যদি ব্যবহারকারীর শংসাপত্রগুলি আমার পৃষ্ঠায় মেলে না তবে তারা একটি ফাঁকা পৃষ্ঠা পায় বা লগইন পৃষ্ঠায় প্রেরণ করা হয়।

<?php
session_start();

if(empty($_SESSION['captcha']) or $_SESSION['captcha'] != $key){
    header("Location: captcha.php");
}

if(!empty($_SESSION['captcha']) and $_SESSION['captcha'] == $key){

"the page"

}
?>

$key বর্তমান দিনের একটি হ্যাশ বা এমন কিছু হওয়া উচিত যা পরিবর্তিত হয় যাতে এটি সেশনে মান যুক্ত করার পক্ষে পর্যাপ্ত নয়।

আপনি যদি আমাকে একটি উদাহরণ ক্যাপচা যুক্ত করতে চান তবে মন্তব্যে লিখুন কারণ আমার এখন আমার উপর একটি নেই।


এই উত্তরটি ওয়েবসাইটগুলি ব্যবহার করে বা বিকাশকারী পিএইচপি জানে যা সত্য নাও হতে পারে umes এছাড়াও এটি ব্যবহারকারীর পক্ষে সামগ্রীটি পাওয়া কঠিন করে তোলে যা কোনও ভাল জিনিস নয়।
জন কনডে

আমি এটি কিনতে পারি যে প্রত্যেকে পিএইচপি জানে না তবে একটি ক্যাপচা "ঘাসের রঙ কী" হতে পারে, এমনকি অন্ধ পোকাও তা জানে।
অ্যালফনস মার্কলন

-3

স্পষ্টতই, <! - গুগলফ: সমস্ত -> এবং <! - গুগলন: সমস্ত -> আপনি যা চান তা করুন।

আরও পড়ুন https://www.google.com/support/enterprise/static/gsa/docs/admin/70/gsa_doc_set/admin_crawl/prepering.html#1076243

https://perishablepress.com/tell-google-to-not-index-certain-parts-of-your-page/


4
না, গুগল অফ এবং গুগলন কেবলমাত্র গুগল অনুসন্ধান অ্যাপ্লায়েন্স দ্বারা সমর্থিত। গুগলবোট ওয়েব অনুসন্ধানের জন্য তাদের উপেক্ষা করে। তথ্যসূত্র: গুগলবোটকে কোনও পৃষ্ঠার অংশকে সূচিকরণ থেকে বিরত রাখতে আপনি গুগলন এবং গুগলফ মন্তব্যগুলি ব্যবহার করতে পারেন? আপনি গুগল অনুসন্ধান অ্যাপ্লায়েন্স ডকুমেন্টেশনের সাথে লিঙ্ক করেছেন এবং আপনার লিঙ্কযুক্ত নিবন্ধে একটি মন্তব্যও বলেছেন যে এটি গুগলবোটের পক্ষে কাজ করে না।
স্টিফেন অসটারমিলার

পছন্দ করুন ডার্ন
লুক মাধাঙ্গা
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.