আগস্টের মাঝামাঝি থেকে, বেশ কয়েকটি গুগল সার্ভার আমার ওয়েবসাইটটিতে (খুব) বড় বাইনারি ফাইলগুলি সপ্তাহে একবারে ডাউনলোড করছে। আইপিগুলি সমস্ত গুগলের মালিকানাধীন হিসাবে প্রদর্শিত হয় এবং এটি দেখতে: google-proxy-66-249-88-199.google.com। এগুলি জিইটি অনুরোধ, এবং তারা আমার সার্ভার ট্র্যাফিককে ব্যাপকভাবে প্রভাবিত করছে।
এর আগে, আমি এই গুগল প্রক্সি আইপিগুলি থেকে কোনও ট্র্যাফিক দেখিনি, সুতরাং এটি তুলনামূলকভাবে নতুন বলে মনে হচ্ছে। আমি অন্যান্য গুগল আইপি থেকে সমস্ত ধরণের ট্র্যাফিক দেখতে পাচ্ছি, সেগুলির মধ্যে কেবল গুগলবোট এবং হেড অনুরোধ রয়েছে।
আমি এই সম্পর্কে উদ্বিগ্ন হব না এই ব্যতীত এই ফাইলগুলি সমস্ত গুগল দ্বারা প্রতি সপ্তাহে বা আরও প্রায় ডাউনলোড করা হচ্ছে। ব্যবহৃত ব্যান্ডউইথ অতিরিক্ত পাওয়া শুরু করছে।
আমি অনুমান করেছি যেহেতু এই ফাইলগুলির অনেকগুলি উইন্ডোজ এক্সিকিউটেবল, সম্ভবত গুগল ম্যালওয়্যার স্ক্যানগুলি সম্পাদন করতে সেগুলি ডাউনলোড করছে। এমনকি যদি এটি সত্য হয়, তবে কি প্রতি সপ্তাহে সত্যই এটি হওয়া দরকার?
গুগল প্রক্সি আইপি থেকে নভেম্বর পর্যন্ত ট্র্যাফিকের উদাহরণ দিন:
google-proxy-64-233-172-95.google.com: 8.09 GB
google-proxy-66-102-6-104.google.com: 7.50 GB
google-proxy-66-249-83-245.google.com: 3.35 GB
google-proxy-66-249-84-131.google.com: 1.54 GB
google-proxy-66-249-83-131.google.com: 4.98 GB
google-proxy-66-249-83-239.google.com: 2.48 GB
google-proxy-66-249-88-203.google.com: 2.94 GB
google-proxy-66-249-88-201.google.com: 2.58 GB
google-proxy-66-249-88-199.google.com: 4.89 GB
আপডেট # 1: আমি উল্লেখ করতে ভুলে গেছি যে প্রশ্নে থাকা ফাইলগুলি ইতিমধ্যে সাইটের রোবট.টিএসটিএসটি ফাইলে রয়েছে। রোবটস.টিএসটি কনফিগারেশনটি সঠিকভাবে কাজ করছে বলে মামলা করার জন্য, আমি গুগল ওয়েবমাস্টার সরঞ্জামগুলিতে রোবটস.টি.এস.টি.এস.টি পরীক্ষকও ব্যবহার করেছি, যা দেখায় যে ফাইলগুলি অবশ্যই একটি ব্যতিক্রম সহ সমস্ত গুগল বটের জন্য অবরুদ্ধ করা আছে: অ্যাডসবট-গুগল। আমি নিশ্চিত যে এটি সম্পর্কে কি হয়। এবং আমি গুগল কিছু ফাইলের জন্য অনুসন্ধান করেছি এবং সেগুলি অনুসন্ধানের ফলাফলগুলিতে উপস্থিত হয় না।
আপডেট # 2: উদাহরণ: 17 নভেম্বর পিএসটি সকাল 5:12 থেকে 5:18 এর মধ্যে, প্রায় আধা ডজন আইপি (সমস্ত গুগল-প্রক্সি) মোট বাইনারি সংক্রান্ত সমস্ত ফাইলের জিইটি করেছে, 27 টি? ৪ নভেম্বর দুপুর ২:০৯ পিএম পিএসটি-র মধ্যে, সেই একই আইপিগুলি মূলত একই কাজ করেছিল।
আপডেট # 3: এই মুহুর্তে এটি পরিষ্কার হয়ে গেছে যে এগুলি বৈধ গুগল আইপি হলেও এটি গুগলের প্রক্সি পরিষেবার অংশ এবং গুগলের ওয়েব ক্রলিং সিস্টেমের অংশ নয়। এগুলি প্রক্সি ঠিকানা হিসাবে, জিইটি অনুরোধগুলি প্রকৃতপক্ষে কোথা থেকে উদ্ভূত হয়েছে বা সেগুলি এক জায়গা থেকে এসেছে বা অনেকগুলি এসেছে কিনা তা নির্ধারণের কোনও উপায় নেই। জিইটিগুলির ছড়িয়ে ছিটিয়ে থাকা প্রকৃতির উপর ভিত্তি করে, মনে হচ্ছে না যে এখানে নিকৃষ্ট কিছু চলছে; গুগলের প্রক্সি পরিষেবা ব্যবহার করার সময় এটি সম্ভবত কেউই সমস্ত বাইনারি ডাউনলোড করার সিদ্ধান্ত নিয়েছে। দুর্ভাগ্যক্রমে, পরিষেবাটি সম্পূর্ণরূপে অনিবন্ধিত বলে মনে হচ্ছে, যা সাহায্য করে না। কোনও সাইটের প্রশাসকের দৃষ্টিকোণ থেকে প্রক্সিগুলি বরং বিরক্তিকর। আমি তাদের ব্লক করতে চাই না, কারণ তাদের বৈধ ব্যবহার রয়েছে। তবে সেগুলির অপব্যবহারও করা যেতে পারে।