গুগলবোট কীভাবে ইউআরএলগুলি সন্ধান করছে যা কেবলমাত্র প্রমাণীকৃত ব্যবহারকারীদের জন্য দৃশ্যমান?


12

এখানে আমার এক গ্রাহক তার অ্যাকাউন্টে লগ ইন করার পরে কিছু ক্রিয়া সম্পাদন করছেন। অনন্য টোকেনটি কেবল একটি এনক্রিপ্ট করা ব্যবহারকারী আইডি + টাইমস্ট্যাম্প।

94.254.xxx.xxx - - [02 / জুলাই / 2011: 22: 25: 46 +0200] "GET / কিছু-অ্যাকশন / অনন্য-টোকেন -123abc HTTP / 1.1" 200 410 "-" "মজিলা / 5.0 (সামঞ্জস্যপূর্ণ; এমএসআইই 9.0; উইন্ডোজ এনটি 6.1; ট্রিটেন্ট / 5.0) "

এখন, গুগলবট কোনওভাবে এই অনন্য লিঙ্কটি সম্পর্কে জানতে পেরেছিল এবং এক সপ্তাহ পরে ঠিক একই URL টি অ্যাক্সেস করার চেষ্টা করেছিল।

66.249.71.179 - - [10 / জুলাই / 2011: 09: 56: 01 +0200] "GET / কিছু-অ্যাকশন / অনন্য-টোকেন -123abc HTTP / 1.1" 302 - "-" "মজিলা / 5.0 (সামঞ্জস্যপূর্ণ; গুগলবট / 2.1; + http: //www.google.com/bot.html) "

(স্থিতি কোড 302 কারণ টোকেনটির মেয়াদ শেষ হয়ে গেছে)


আমাকে জোর দিয়ে বলি যে এটি অনন্য ইউআরএল যা একবার মাত্র 2 সেকেন্ডের জন্য দেখা গিয়েছিল, ব্যবহারকারীরা ক্লিক করার আগে এবং পৃষ্ঠাটি দেখার জন্য এগিয়ে যাওয়ার আগে। এটি কোনও ইমেলের মাধ্যমে প্রেরণ করা হয়নি বা যে কোনও জায়গায় প্রকাশ্যে প্রকাশ করা হয়নি।

এখানে কী চলছে, কীভাবে সম্ভব যে গুগল এই অনন্য ইউআরএল খুঁজে পেয়েছে?

উত্তর:


6

এটি নিশ্চিত করে বলা শক্ত তবে এখানে সম্ভাব্য পরিস্থিতি রয়েছে:

  • ব্যবহারকারীর একটি ব্রাউজার সরঞ্জামদণ্ড বা এক্সটেনশন ইনস্টল রয়েছে যা তারা গুগলে যে URL গুলিতে পরিদর্শন করে সেগুলি রিপোর্ট করে।

  • সেই ইউআরএল এবং গুগলের সাথে লিঙ্ক করা কেউ এই লিঙ্কটির সাথে পৃষ্ঠাটি ক্রল করে এটি খুঁজে পেয়েছিল।


আপনি যদি গুগল টুলবার সম্পর্কে কথা বলছেন তবে আপনি যদি "পেজর্যাঙ্ক" বৈশিষ্ট্যটি সক্ষম করেন তবে কেবলমাত্র ইউআরএলগুলিকে গুগলে প্রেরণ করে তবে আমরা নতুন ইউআরএলগুলি আবিষ্কার করতে কখনই সেই ডেটা ব্যবহার করি নি। আমাদের দ্বারা প্রকাশিত অন্য কোনও সরঞ্জামদণ্ড সম্পর্কে যদি, আমাকে দয়া করে জানান।
মিথোড

5

আমি কেবল বুঝতে পেরেছি যে ব্যবহারকারী অবশ্যই এই অনুমোদিতীকৃত পৃষ্ঠায় একটি আউটবাউন্ড লিঙ্ক খুঁজে পেয়েছেন এবং তারপরে Refererঅন্য কোনও ওয়েবসাইটে ক্লিক করার সময় ব্যক্তিগত URL টি ফাঁস করেছেন । এটিই সম্ভাব্য একমাত্র ব্যাখ্যা, এবং শুরু থেকেই সত্যই এটি হওয়া উচিত ছিল।

একবার ফাঁস হয়ে যাওয়ার পরে, ব্যক্তিগত ইউআরএল বিভিন্ন উপায়ে গুগলে প্রকাশ করা হতে পারে, যেমন লক্ষ্য সাইটটি তাদের অ্যাক্সেস লগগুলি সর্বজনীনভাবে প্রকাশ করেছে। দ্রষ্টব্য: আউটবাউন্ড লিঙ্কগুলির কোনওটিই গুগল অ্যানালিটিক্স ব্যবহার করে নি তাই এটি এটি নির্দেশ করে না যে গুগলবট অ্যানালিটিক্স থেকে রেফারার URL গুলি ব্যবহার করছে।

পাঠ পুনরায় প্রত্যাহার করা: আপনি https ব্যবহার না করে কখনও ইউআরএলগুলিতে সংবেদনশীল ডেটা কখনও রাখবেন না, সেক্ষেত্রে ব্রাউজারটি Refererফাঁকা রেখে দিত।


1
আপনি ঠিক বলেছেন: ইউআরএলগুলিতে সংবেদনশীল ডেটা রাখা বিপজ্জনক হতে পারে। আপনি যখনই পারেন, আপনার পোষ্ট অনুরোধগুলি (যা জিইটি অনুরোধগুলির মতো URL এর অংশ হিসাবে ভেরিয়েবল প্রেরণ করে না) বা কুকি / সেশন ভেরিয়েবলগুলি ব্যবহার করে পৃষ্ঠাগুলির মধ্যে অনন্য ব্যবহারকারী আইডি পাস করা উচিত।
নিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.