খালি ব্যবহারকারী-এজেন্টের ব্যাখ্যা


12

আমি কীভাবে একটি খালি ব্যবহারকারী-এজেন্টকে ব্যাখ্যা করব? আমার কিছু কাস্টম অ্যানালিটিক্স কোড রয়েছে এবং সেই কোডটিতে কেবল মানব ট্রাফিক বিশ্লেষণ করতে হবে। আমি মানব ট্র্যাফিক এবং বট ট্র্যাফিককে চিহ্নিত করে ব্যবহারকারীর এজেন্টগুলির একটি কার্যকরী তালিকা পেয়েছি তবে খালি ব্যবহারকারী-এজেন্ট সমস্যাযুক্ত হিসাবে প্রমাণিত হচ্ছে। এবং আমি প্রায় 10% খালি ইউজার-এজেন্টের সাথে প্রচুর ট্র্যাফিক পাচ্ছি।

অতিরিক্ত হিসাবে, আমি আমার বর্তমান লগগুলি বিশ্লেষণ করে মানব ট্র্যাফিক বনাম বট ট্র্যাফিক ব্যবহারকারী এজেন্ট তালিকা তৈরি করেছি। এর ফলে আমি সেখানে প্রচুর এন্ট্রি মিস করছি। বট ট্র্যাফিককে চিহ্নিত করে এমন ব্যবহারকারীর এজেন্টগুলির একটি সু-রক্ষণাবেক্ষণের তালিকা রয়েছে বা বিপরীতমুখী, মানব ট্র্যাফিককে চিহ্নিত করে এমন ব্যবহারকারী এজেন্টগুলির একটি তালিকা রয়েছে?


1
সম্ভাব্য ব্যবহারকারী-এজেন্টগুলির তালিকা অবিশ্বাস্যভাবে দীর্ঘ। উদাহরণস্বরূপ, কেবলমাত্র মোবাইল-কেবল ব্যবহারকারী-এজেন্টদের তালিকাটি দেখুন
ম্যাক্স ভার্নন

খালি ব্যবহারকারী-এজেন্টটি খুব বিরল - আপনি কোন সার্ভার সফটওয়্যারটি ব্যবহার করছেন? আপনি কীভাবে ব্যবহারকারী-এজেন্ট পাচ্ছেন? আপনি কি নিশ্চিত যে এটি সত্যিই ফাঁকা, বা আপনার সংগ্রহের সিস্টেমে এমন কোনও বাগ রয়েছে যা খালি ব্যবহারকারী-এজেন্ট তৈরি করছে?
ম্যাক্স ভার্নন

@ ম্যাক্স - খালি ইউজার এজেন্টের জন্য আমি নিজেই অবাক হয়েছি। আমি ল্যাম্প স্ট্যাক ব্যবহার করছি। আমি পিএইচপি-র মাধ্যমে ব্যবহারকারী এজেন্টকে $ _SERVER ['HTTP_USER_AGENT'] হিসাবে সংগ্রহ করি। কোডটি সহজ; যদিও আমি ব্যবহারকারীর এজেন্ট থাকার সম্ভাবনাটি পুরোপুরি ছাড় করতে পারি না তবে আমার কোড এটি সংগ্রহ করতে ব্যর্থ হয়েছে, বা ডাটাবেস এটি সঞ্চয় করতে অস্বীকার করেছে, আমি সন্দেহ করি এটি ক্ষেত্রে is

1
আপনার যদি অ্যাপাচের অ্যাক্সেস লগগুলিতে অ্যাক্সেস থাকে: লগড ব্যবহারকারী-এজেন্টরাও কি খালি?

আপনার নিজের সাইটে অ্যাক্সেস করার কোনও স্ক্র্যাপার রয়েছে? এটি এমন এক উপায়ে হতে পারে যাতে দর্শকদের কাছে কোনও USER_AGENT নেই
ম্যাক্স ভার্নন

উত্তর:


5

আপনি যদি কেবলমাত্র "মানব ট্র্যাফিক" বিশ্লেষণ করতে চান তবে আমি খালি বা অনুপস্থিত ব্যবহারকারী এজেন্ট স্ট্রিংয়ের সাথে গণনা করব না। আমার অভিজ্ঞতায় প্রায় কোনও ব্রাউজার সর্বদা একটি প্রেরণ করবে। এমনকি বেশিরভাগ গোপনীয়তা প্লাগইন বা এক্সটেনশানগুলি বরং জাল (অন্যান্য ওএস বা ক্লায়েন্টের নাম অন্তর্ভুক্ত) বা "নরমালাইজ" (যেমন প্রকাশের সংখ্যা নেই) বা এলোমেলোভাবে (যেমন কখনও কখনও এফএফ, কখনও কখনও আই স্ট্রিং) ইউএ স্ট্রিং করে, তবে সেগুলি পুরোপুরি সরিয়ে দেয় না (সম্ভবত এটি সম্ভবত এমন কিছু সাইটগুলির সাথে সমস্যা সৃষ্টি করে যা এটির উপর নির্ভর করে, যদিও এটি কোনও ভাল ধারণা নয়))

সংযুক্ত আরব আমিরাতের সাথে একটি সাধারণ অনুরোধটি এইভাবে করা যায় না:

wget --user-agent="" www.example.com

আপনি যেমন দেখেন তেমন কিছু যোগ করতে পারেন। "বুনোতে" সংযুক্ত আরব আমিরাতের সন্ধান পাওয়া এবং প্রকাশিত সাইটগুলি প্রচুর পরিমাণে বাজে পাওয়া যায় বলে সেগুলি খুব বেশি কার্যকর হয় না।

হতে পারে যে কেউ কেবল আপনার সামগ্রীতে পুনরাবৃত্তভাবে এনেছে। অথবা আপনার সাইট বিশ্লেষণের জন্য কিছু এসইও সরঞ্জাম ব্যবহার করেছেন (কেউ কেউ ব্যবহারকারীকে ম্যানুয়ালি শিরোনাম পরিবর্তন করতে দেয়, অন্যরা একটি রোবটস.টেক্সট লাইন উপেক্ষা করার উদ্দেশ্যে)। জিনিস যেমন। এই পরিস্থিতিতে ইউএ শিরোলেখ প্রায়ই ক্লায়েন্ট এবং উদ্দেশ্য গোপন করতে নকল হয়।

যদি এই অনুরোধগুলি নিয়মিত রাখে তবে শিরোনামগুলি (প্রক্সি?) বা আইপিগুলি (একটি নির্দিষ্ট ব্লক? গোপনীয়তা সম্পর্কিত সংস্থা / প্রক্সি?) আরও বিশ্লেষণ করতে সহায়ক হতে পারে If


2

আমি সুরক্ষা সংস্থার জন্য কাজ করি এবং অন্যান্য জিনিসগুলির মধ্যে আমরা খারাপ বট ট্র্যাফিক পর্যবেক্ষণ করি।

আমার অভিজ্ঞতার উপর ভিত্তি করে, খালি ব্যবহারকারী-এজেন্ট ডেটার সাথে মানুষ ভিজিটগুলি "হেডলেস ব্রাউজার" বট দ্বারা তৈরি স্ক্র্যাপিং / স্প্যামিং প্রচেষ্টা (সাধারণত স্ক্র্যাপিং) নির্দেশ করে।

এই দর্শনার্থীরা মাঝে মাঝে জেএস কার্যকর করতে পারে এবং তাই তারা জিএ-তে উপস্থিত হবে - তবুও, এই ডোজটি তাদের মানবিক করে না :)

"প্লাগ" এর জন্য ক্ষমা প্রার্থনা করুন তবে দয়া করে জেনে রাখুন যে প্রয়োজন হলে আমরা ফ্রি ব্যাড বট সুরক্ষা পরিষেবাগুলি সরবরাহ করি - সিডিএন ত্বরণ এবং অন্যান্য গুডিসহ।

এই নির্দিষ্ট ক্ষেত্রে আমাদের সিস্টেম এই সফরটিকে "সন্দেহজনক" হিসাবে স্বীকৃতি দেবে, এটি পরিচিত আক্রমণকারী ভেক্টরগুলির বিরুদ্ধে এটি যাচাই করেছে এবং - এখনও যদি অনিশ্চিত থাকে - আরও পরীক্ষা এবং চ্যালেঞ্জ সম্পাদন করে। এই চ্যালেঞ্জগুলি অধিবেশনটিতে কোনও বিলম্ব না করেই নির্বিঘ্নে সঞ্চালিত হয়।


0

ইন্টারনেট অ্যাক্সেস করে এমন প্রতিটি বিট সফ্টওয়্যারকে যাদুকরি কোনও ব্যবহারকারী এজেন্ট দেওয়া হয় না। সফ্টওয়্যার বিকাশকারীদের তাদের সফ্টওয়্যার মধ্যে সেই কার্যকারিতা প্রোগ্রাম করতে হবে। আপনার ফাঁকা ব্যবহারকারী এজেন্টের অর্থ হ'ল কোনও সফ্টওয়্যার বিকাশকারী তাদের সফ্টওয়্যারটিতে কোনও ব্যবহারকারী এজেন্ট যুক্ত করতে ভুলে গিয়েছিলেন।


অথবা যে কোনও ব্রাউজার ব্যবহারকারী ইউএ স্ট্রিং সরিয়ে / অবরুদ্ধ করেছে।
21

5
এটা ভুল. এটি "ঠিক অর্থ" বলতে ইঙ্গিত দেয় যে এটি সাধারণত বা অন্তত প্রায়শই কারণ হয়। খুব কম লোকই এইচটিএফ সফ্টওয়্যার ব্যবহার করে যারা বিকাশকারীরা সংযুক্ত আরব আমিরাতকে অলসতার বাইরে এড়িয়ে যেত। যদি ট্র্যাফিক উত্সটি প্রায়শই এটি নির্দেশ করে তবে তা চিহ্নিত করতে চায় না, এবং এটি দূষিত বা শোষণমূলক ট্র্যাফিকের সাথে গভীরভাবে জড়িত। দুর্ভাগ্যক্রমে কিছু বড় সংস্থা (ফেসবুক) অতীতে খালি ব্যবহারকারী এজেন্ট স্ট্রিং ব্যবহার করেছে, সুতরাং এগুলি সম্পূর্ণরূপে অবরুদ্ধ করা বুদ্ধিমানের কাজ নয়।
জার্কার্ক

1
@jeremyclarke +1 এই জাতীয় আচরণটি কখনই উপেক্ষা করা উচিত নয়! আর ফেসবুকে লজ্জা! যদি কোনও বৈধ বট বা ব্রাউজারের কোনও সাইট দেখার প্রয়োজন হয় তবে তাদের সর্বদা একটি সনাক্তকারী থাকা উচিত। সর্বোপরি, তারা অন্য কারও সম্পত্তি প্রবেশ করছে। কোনও ব্যবহারকারী-এজেন্ট না থাকা তাদের পরিচয়টি অস্পষ্ট করার জন্য একটি চুরির মুখোশ দিয়ে লুকিয়ে থাকার মতো।
হোয়াইটবার্ড

2
এ যেন এমন কেউ যার মুখ withাকা থাকে আপনার বাড়ির সামনের সিডওয়াক পেরিয়ে হাঁটতে হাঁটতে। অযথা অবৈধ নয়, তবে আপনি যদি দরজার জবাব না দেন তবে তাদের ধরে নেওয়া উচিত নয় যে আপনি একটি ভৌতিক বাদাম।
জার্কার্ক

0

ব্যবহারকারী-এজেন্টকে আপনার পরিচয় গোপন করা বা মানুষ হওয়ার সাথে তুলনা করে এই প্রশ্নের উত্তরে আমি কয়েকটি মন্তব্য দেখছি। এটি একটি অযৌক্তিক তুলনা। ব্যবহারকারী-এজেন্টের পরিচয় বা মানব হওয়ার কোনও সম্পর্ক নেই।

এটিকে ফুটওয়্যারের মতো ভাবুন। আপনি আপনার দর্শকদের জিজ্ঞাসা করছেন যে আপনি কী ধরণের জুতো পরেছেন you অ্যালার্জি কার্পেট দর্শনার্থীদের জন্য বুট এবং কোনও কার্পেট নেই।

যখন দর্শনার্থীরা তাদের কী জুতা আছে তা বলতে চাইবেন না (যেমন, খালি ব্যবহারকারী-এজেন্ট) আপনি তাদের এড়িয়ে চলেছেন।

হ্যাঁ, প্রচুর ভাল অভ্যাস রয়েছে যা ব্যবহারকারী-এজেন্ট এবং অন্যান্য অনুরোধ শিরোনাম তথ্যের ভিত্তিতে ওয়েব অনুরোধ সম্পর্কে জিনিসগুলি ধরে নেওয়ার চেষ্টা করে। তারা সম্ভবত সময়ের বেশিরভাগ 99% কাজ করতে পারে তবে অন্যান্য অনেক অনুরূপ অভ্যাসের মতো তারা ভ্রান্ত-ইতিবাচক এবং এর ফলে সাধারণ অজ্ঞ ব্যবহারকারীদের ক্ষতি করে।

দুর্ঘটনাক্রমে খালি ইউজার-এজেন্ট নিজেই ব্যবহার করার বিষয়টি নিয়ে আমি স্পষ্টভাবে বলতে পারি যে কোনও ওয়েব পরিষেবা যখন আপনার পাদুকা সম্পর্কে এটি বলার কথা ভেবেছিল না কেবল তখনই কোনও মজা লাগে না web

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.