গুগলে আপনি কী খুঁজে পাচ্ছেন না? [বন্ধ]


18

গুগল ন্যায্য বলে দাবি করেছে এবং এটি তার মাকড়সাতে অ্যাক্সেস করতে পারে এমন কোনও কিছুর জন্য এবং সমস্ত কিছুর জন্য ইন্টারনেটকে ঘায়েল করা কোম্পানির স্বার্থে (বেশিরভাগ সময়) আমি জানতে চাই:

  • গুগল কোন ধরণের (সর্বজনীনভাবে অ্যাক্সেসযোগ্য) সামগ্রী সরবরাহ করতে ব্যর্থ হয়?
  • গুগল পুনরুদ্ধার করতে পারে না এমন একটি নির্দিষ্ট ধরণের সামগ্রী রয়েছে?

বিশেষত গুগলের নিজস্ব ডকুমেন্টেশনের উল্লেখগুলি বিশেষত দুর্দান্ত esome


এখন যেই ইইউ "ভুলে যাওয়ার অধিকার" রুপে কার্যকর করেছে, সেখানে আমরা এখন আর খুঁজে পাব না। এখানে কিছু জিনিস যা "ভুলে যাওয়া" হয়েছে।
সামথিব্র্যান্ড

উত্তর:


21

জিনিসের ধরণ সম্পর্কে কয়েকটি ধারণা:

  1. কোনও ডোমেনের robots.txtফাইল দ্বারা স্পষ্টত অস্বীকৃত সামগ্রী গুগল সূচক থেকে বাদ দেওয়া হয়েছে।
  2. গুগল ইতিমধ্যে জানে এমন ওয়েবসাইটগুলি যা অন্য ওয়েবসাইট থেকে লিঙ্কযুক্ত নয়। এটি হ'ল সম্ভবত প্রচুর ওয়েবসাইট রয়েছে যা দৃশ্যমান পৃষ্ঠাগুলি থেকে লিঙ্কিত হয় না, ওয়েবমাস্টার সরঞ্জামগুলির মাধ্যমে ম্যানুয়ালি গুগলে জমা দেওয়া না হলে websites ওয়েবসাইটগুলি কখনই গুগল স্পাইডার দ্বারা খুঁজে পাওয়া যাবে না ।
  3. ওয়েব ফর্মগুলির পিছনে থাকা ওয়েবসাইটগুলি যা আপনাকে পূরণ করতে হবে।
  4. আদমশুমারির ছবি। যেহেতু বিষয়বস্তুগুলি এমন চিত্রগুলি যা প্রায়শই ম্যানুয়ালি সূচক থাকে তাই এগুলি সাধারণত বংশোদ্ভূত ডটকমের মতো পেইড-সাইটগুলিতে পাওয়া যায়।

ডিপ ওয়েব সম্পর্কে আরও জানুন


2
পয়েন্ট 2 এটি সত্য নয়। আপনি ওয়েবমাস্টার সরঞ্জামগুলির মাধ্যমে গুগলে কোনও সাইট জমা দিতে পারেন এবং এটি অন্য ওয়েবসাইটগুলি থেকে লিঙ্ক না থাকলেও এটি সূচিবদ্ধ হয়ে যাবে।
অ্যালেক্স

ঐটা সত্য. ভাল ব্যাখ্যা।
amh

3
আসলে আমি দ্বিতীয় বিষয়টির সাথে একমত হব না। আমার পিসিতে আমার একটি টেস্ট ওয়েব সার্ভার ছিল এবং এটি সূচিযুক্ত হয়েছিল। আমি অ্যাক্সেস লগ চেক করে এটি খুঁজে পেয়েছি।
বকুদন

2
আমি নতুন ডোমেনগুলি নিবন্ধভুক্ত করেছি, সেগুলি বিকাশ করা শুরু করেছি এবং গুগলবটকে দেখতে পেয়েছি যে কয়েকদিন পরেই সেগুলি ক্রল করছে। আমি ভেবেছিলাম এটি অবধি এক ধরণের ভয়ঙ্কর ছিল - যতক্ষণ না আমি বুঝতে পেরেছি - আমি এই ডোমেনের মালিকানাধীন প্রথম ব্যক্তি হতে পারি না :) তারা নির্দিষ্টকরণ প্রকাশ করে না, তবে আমি নিশ্চিত যে তারা রেজিস্ট্রেশন করার জন্য পর্যাপ্ত গুরুত্বপূর্ণ এবং লোকেদের যে ডোমেনগুলি মনে হয়েছিল তারা তাদের নজর রাখে at কমপক্ষে কয়েক সময় পরিদর্শন করা হয়েছে, কিছু সময় অন্তত।
টিম পোস্ট

6

টুইটার বাদে গুগল টাম্বলারকে এত ভালভাবে সূচি দেয় না । টাম্বলার উপর ব্লগ পোস্টগুলি টাম্বলার অনুসন্ধান ব্যবহার করে খুঁজে পাওয়া সহজ। এছাড়াও গুগল সাইটগুলিতে সমস্ত কিছুই সূচিকৃত নয় (বা খুব কম)। আপনি যদি কোনও গুগল সাইট শুরু করেন তবে নিজের ডোমেনটি পান।

ছোট ব্লগগুলি যা নিয়মিত আপডেট হয় না সেগুলি প্রায়শই অনুসন্ধান ফলাফল থেকে ফেলে দেওয়া হয়। তারা মনে করে যে কোনও কিছু স্প্লগ


5

ওয়েল, বেশিরভাগ টুইটার সামগ্রীগুলি প্রকাশ্য হলেও গুগল সূচী করে না। এটি গুগলে উপলব্ধ ছিল, তবে তাদের চুক্তির মেয়াদ শেষ হওয়ার পরে এটি আর নেই।

উত্স


যদিও সত্য, প্রশ্নটি জিজ্ঞাসা করে গুগলে কোন "উচ্চ-মানের সামগ্রী" উপলব্ধ নয়। টুইটারের বেশিরভাগই সেই মানদণ্ডটি পূরণ করতে পারে না :) আমি যদিও গুগল অনুসন্ধানে অদ্ভুত টুইট দেখছি।
হ্যাপিটাইমগোফার

4

এটি নির্ভর করে আপনি কোন দেশে আছেন। ইন জার্মানি এটা সাইটগুলিতে হাজার হাজার প্রদর্শন করা হয় না যে সরকার মনে করে আপনার জন্য ভাল হয় না, এবং প্রতি বছর হাজার হাজার তালিকা বাড়ে।

গুগল ইন্টারনেট সেন্সরশিপের মোটর। আপনি যদি নিখরচায় ইন্টারনেট চান তবে ডাকডকগো বা অন্যদের মতো কিছু অ-অশুভ সংস্থাগুলি ব্যবহার করুন ।


4

আপনি গুগল অনুসন্ধানে বিশেষ অক্ষর সহ কোনও কীওয়ার্ড অনুসন্ধান করতে পারবেন না :

সাধারণত, বিরামচিহ্নগুলি উপেক্ষা করা হয়, @ # $% ^ & * () = + [] \ এবং অন্যান্য বিশেষ অক্ষর সহ

গুগল যখন কিছু কোড করে এটি বিশেষত বিরক্তিকর।


3

গুগল ডিএমসিএ টেক-ডাউন এবং অনুরূপ অনুরোধগুলির পরে বৌদ্ধিক সম্পত্তির অধিকার লঙ্ঘন হিসাবে বিবেচিত অনুসন্ধান ফলাফলগুলি সরিয়ে দেয়। দেখুন গুগলের সার্চ ফলাফলের সরানোর অনুরোধ ফর্ম (এটা একটি অতিরিক্ত URL টি BTW থাকতে পারে)।


1

এতগুলি বিষয়বস্তুযুক্ত সাইটগুলি যা গুগলের কাছে এগুলি সমস্ত সূচী করার জন্য কেবল সময় (বা প্রবণতা) নেই।

যে সাইটগুলিতে ক্রলযোগ্য সাইটের মানচিত্র নেই এবং সাইটগুলিতে উপলব্ধ ফলাফলগুলি অ্যাক্সেস করার জন্য অনুসন্ধানের শর্তাদি সরবরাহ করার জন্য গুগলের প্রয়োজন রয়েছে সেগুলি সম্পূর্ণরূপে সূচকযুক্ত নাও হতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.