আমি ক্রোমড্রাইভারের সাথে সেলেনিয়াম পরীক্ষা করে দেখছি এবং আমি লক্ষ্য করেছি যে কিছু পৃষ্ঠাগুলি সনাক্ত করতে পারে যে আপনি সেলেনিয়ামটি ব্যবহার করছেন যদিও কোনও অটোমেশন নেই। এমনকি আমি যখন সেলেনিয়াম এবং জিফায়ারের মাধ্যমে কেবল ক্রোম ব্যবহার করে ম্যানুয়ালি ব্রাউজ করছি তখনও প্রায়শই আমি একটি পৃষ্ঠা পেয়ে যাচ্ছি যে সন্দেহজনক কার্যকলাপটি সনাক্ত হয়েছে। আমি আমার ব্যবহারকারী এজেন্ট এবং আমার ব্রাউজারের ফিঙ্গারপ্রিন্ট পরীক্ষা করেছি এবং এগুলি সবই সাধারণ ক্রোম ব্রাউজারের সাথে হুবহু মিল।
আমি যখন এই ক্রোমগুলিতে সাধারণ ক্রোমগুলিতে ব্রাউজ করি তখন সবকিছু ঠিকঠাক কাজ করে তবে আমি যখন সেলেনিয়াম ব্যবহার করি তখনই আমি সনাক্ত করি।
তত্ত্বের মধ্যে ক্রোমড্রাইভার এবং ক্রোমকে আক্ষরিক অর্থে যে কোনও ওয়েবসারভারের মতো দেখতে পাওয়া উচিত তবে কোনওভাবে তারা এটি সনাক্ত করতে পারে।
আপনি যদি কিছু টেস্টকোড চান তবে এটি ব্যবহার করে দেখুন:
from pyvirtualdisplay import Display
from selenium import webdriver
display = Display(visible=1, size=(1600, 902))
display.start()
chrome_options = webdriver.ChromeOptions()
chrome_options.add_argument('--disable-extensions')
chrome_options.add_argument('--profile-directory=Default')
chrome_options.add_argument("--incognito")
chrome_options.add_argument("--disable-plugins-discovery");
chrome_options.add_argument("--start-maximized")
driver = webdriver.Chrome(chrome_options=chrome_options)
driver.delete_all_cookies()
driver.set_window_size(800,800)
driver.set_window_position(0,0)
print 'arguments done'
driver.get('http://stubhub.com')
আপনি যদি স্টুব্বের চারপাশে ব্রাউজ করেন তবে আপনাকে এক বা দুটি অনুরোধের মধ্যে আপনাকে পুনঃনির্দেশিত এবং 'অবরুদ্ধ' করা হবে। আমি এটি তদন্ত করছি এবং আমি কীভাবে তারা বলতে পারি যে কোনও ব্যবহারকারী সেলেনিয়াম ব্যবহার করছেন।
তারা কীভাবে এটা করে?
আপডেট সম্পাদনা করুন:
আমি ফায়ারফক্সে সেলেনিয়াম আইডিই প্লাগইন ইনস্টল করেছি এবং আমি কেবলমাত্র অতিরিক্ত প্লাগইন সহ সাধারণ ফায়ারফক্স ব্রাউজারে stubhub.com এ গিয়ে নিষিদ্ধ হয়ে পড়েছিলাম।
সম্পাদনা করুন:
আমি যখন ফিডলারের সাহায্যে এইচটিটিপি অনুরোধগুলি বার বার প্রেরণ করা হচ্ছে দেখতে দেখতে পেয়েছি তখন আমি লক্ষ্য করেছি যে 'নকল ব্রাউজারের' অনুরোধগুলিতে প্রায়শই প্রতিক্রিয়া শিরোনামে 'নো-ক্যাশে' থাকে।
সম্পাদনা করুন:
এর মতো ফলাফলগুলি সনাক্ত করার কোনও উপায় আছে যে আমি জাভাস্ক্রিপ্টের সেলেনিয়াম ওয়েবড্রাইভার পৃষ্ঠায় রয়েছি যাতে আপনি ওয়েবড্রাইভার ব্যবহার করছেন তখন সনাক্ত করার কোনও উপায় থাকার কথা নয়। কিন্তু এই প্রমাণ অন্যথায় প্রস্তাব দেয়।
সম্পাদনা করুন:
সাইটটি তাদের সার্ভারগুলিতে একটি ফিঙ্গারপ্রিন্ট আপলোড করে, তবে আমি পরীক্ষা করে দেখেছি এবং ক্রোম ব্যবহার করার সময় সেলেনিয়ামের ফিঙ্গারপ্রিন্টটি একই রকম।
সম্পাদনা করুন:
এটি ফিঙ্গারপ্রিন্ট পেডলোডগুলির মধ্যে একটি যা তারা তাদের সার্ভারে প্রেরণ করে
{"appName":"Netscape","platform":"Linuxx86_64","cookies":1,"syslang":"en-US","userlang":"en-US","cpu":"","productSub":"20030107","setTimeout":1,"setInterval":1,"plugins":{"0":"ChromePDFViewer","1":"ShockwaveFlash","2":"WidevineContentDecryptionModule","3":"NativeClient","4":"ChromePDFViewer"},"mimeTypes":{"0":"application/pdf","1":"ShockwaveFlashapplication/x-shockwave-flash","2":"FutureSplashPlayerapplication/futuresplash","3":"WidevineContentDecryptionModuleapplication/x-ppapi-widevine-cdm","4":"NativeClientExecutableapplication/x-nacl","5":"PortableNativeClientExecutableapplication/x-pnacl","6":"PortableDocumentFormatapplication/x-google-chrome-pdf"},"screen":{"width":1600,"height":900,"colorDepth":24},"fonts":{"0":"monospace","1":"DejaVuSerif","2":"Georgia","3":"DejaVuSans","4":"TrebuchetMS","5":"Verdana","6":"AndaleMono","7":"DejaVuSansMono","8":"LiberationMono","9":"NimbusMonoL","10":"CourierNew","11":"Courier"}}
সেলেনিয়াম এবং ক্রোমে এর অভিন্ন
সম্পাদনা করুন:
ভিপিএনগুলি একক ব্যবহারের জন্য কাজ করে তবে আমি প্রথম পৃষ্ঠাটি লোড করার পরে সনাক্ত করে। স্পষ্টতই কিছু জাভাস্ক্রিপ্ট সেলেনিয়াম সনাক্ত করতে চালিত হচ্ছে।
distill
বট সনাক্তকরণ প্রযুক্তি এবং ব্যবহার করে আপনি সামগ্রী বিতরণ akamaitechnologies.com
diffrent আইপিএস যেমন থেকে যা CDN 95.100.59.245
, 104.70.243.66
,23.202.161.241