কোনও ওয়েবসাইটের অনন্য দর্শনার্থীরা কী কোনও পাওয়ার আইন অনুসরণ করে?


14

ধরুন আমার কাছে একটি অর্ডারযুক্ত ভেক্টর রয়েছে যেখানে প্রথম উপাদানটি নির্দিষ্ট সময়টিতে কোনও ওয়েবসাইটের দেখার সংখ্যা সর্বাধিক সংখ্যার সাথে অনন্য আইপি দ্বারা প্রাপ্ত হয়, দ্বিতীয় উপাদানটি দ্বিতীয়টির সাথে অনন্য আইপি দ্বারা পরিদর্শন সংখ্যা সর্বাধিক সংখ্যক ভিজিট এবং ইত্যাদি। আমি বুঝতে পারি যে সাইটের প্রতি পার্থক্য থাকতে পারে, তবে সাধারণভাবে কি এই ভেক্টরের আকৃতির কোনও অনুমিত প্যাটার্ন রয়েছে? এটি, উদাহরণস্বরূপ, একটি পাওয়ার-আইন বিতরণ অনুসরণ করে?


6
গতিশীল সম্বোধন এবং অন্যান্য বিভিন্ন সমস্যা (যেমন একাধিক কম্পিউটার ব্যবহার করা লোক) এর কারণে আইপি'র লোকজনের সাথে বিশেষভাবে মেলে না। যদি আমি এই অনুমানটি পরীক্ষা করতে চাই, আমি সম্ভবত আইপি ঠিকানার চেয়ে ভিজিটর আইডি ব্যবহার করব।
richiemorrisroe

উত্তর:


23

না, কোনও ওয়েবসাইটে অনন্য দর্শক কোনও পাওয়ার আইন অনুসরণ করে না।

গত কয়েক বছরে, পাওয়ার আইন দাবির (যেমন, ক্লাউসেট, শালিজি এবং নিউম্যান ২০০৯) পরীক্ষা করার ক্ষেত্রে কঠোরতা বাড়ছে। স্পষ্টতই, অতীতের দাবীগুলি প্রায়শই ভালভাবে পরীক্ষিত হয় নি এবং লগ-লগ স্কেলে ডেটা প্লট করা এবং একটি সরল রেখা প্রদর্শনের জন্য "আইবলবল টেস্ট" এর উপর নির্ভর করা সাধারণ ছিল। এখন যেহেতু আনুষ্ঠানিক পরীক্ষাগুলি বেশি সাধারণ, অনেকগুলি বিতরণ পাওয়ার আইনগুলি অনুসরণ না করে।

আমি জানি যে সেরা দুটি রেফারেন্স ওয়েবে ব্যবহারকারীদের পরিদর্শনগুলি হলেন আলী এবং স্কের (2007) এবং ক্লাউসেট, শালিজি এবং নিউম্যান (২০০৯)।

আলী এবং স্কার (2007) একটি ইয়াহু ওয়েবসাইটে ব্যবহারকারী ক্লিকের একটি এলোমেলো নমুনার দিকে তাকিয়ে সিদ্ধান্তে পৌঁছেছিল:

প্রচলিত জ্ঞান হ'ল ওয়েব ক্লিক এবং পৃষ্ঠাগুলির বিতরণ একটি স্কেল-মুক্ত শক্তি আইন বিতরণকে অনুসরণ করে। তবে, আমরা দেখেছি যে পরিসংখ্যানগতভাবে উল্লেখযোগ্যভাবে ডেটাটির আরও ভাল বিবরণ হ'ল স্কেল-সংবেদনশীল জিপফ- ম্যান্ডেলব্রোট বিতরণ এবং এর মিশ্রণগুলি আরও ফিটকে বাড়িয়ে তোলে। পূর্ববর্তী বিশ্লেষণগুলির তিনটি অসুবিধা রয়েছে: তারা পরীক্ষার্থীদের বিতরণের একটি ছোট সেট ব্যবহার করেছে, মেয়াদোত্তীর্ণ ব্যবহারকারী ওয়েব আচরণ বিশ্লেষণ করেছে (1998 সালের প্রায়) এবং প্রশ্নবিদ্ধ স্ট্যাটিস্টিকাল পদ্ধতি ব্যবহার করেছে। যদিও আমরা এটি নির্ধারণ করতে পারি না যে একদিনের জন্য আরও উপযুক্ত ফিটনেস বিতরণ না পাওয়া যেতে পারে, আমরা নিশ্চিতভাবে বলতে পারি যে স্কেল-সংবেদনশীল জিপফ-ম্যান্ডেলব্রোট বিতরণ স্কেল-ফ্রি পাওয়ার-ল বা জিপফের চেয়ে ডেটাগুলিতে একটি পরিসংখ্যানগতভাবে উল্লেখযোগ্যভাবে শক্তিশালী ফিট সরবরাহ করে ইয়াহু ডোমেন থেকে উল্লম্ব বিভিন্ন।

এক মাস ধরে পৃথক ব্যবহারকারী ক্লিকের একটি হিস্টোগ্রাম এবং লগ-লগ প্লটে তাদের একই ডেটা রয়েছে, তাদের তুলনায় বিভিন্ন মডেলের সাথে। স্কেল-মুক্ত পাওয়ার বিতরণ থেকে প্রত্যাশিত কোনও সরল লগ-লগের ডেটা স্পষ্টভাবে নেই।

আলী এবং স্কারার থেকে চিত্র 2 এবং 4

ক্লোসেট, শালিজি এবং নিউম্যান (২০০৯) সম্ভাবনা অনুপাতের পরীক্ষার ব্যবহার করে বিকল্প অনুমানের সাথে পাওয়ার আইনের ব্যাখ্যাগুলির তুলনা করেছেন এবং ওয়েব হিট এবং লিঙ্ক উভয়ই "বিদ্যুৎ আইন অনুসরণ করার পক্ষে বুদ্ধিমানের সাথে বিবেচনা করা যায় না।" পূর্বেরগুলির জন্য তাদের ডেটাগুলি আমেরিকা অনলাইন ইন্টারনেট সেবার গ্রাহকরা একদিনেই ওয়েব হিট করেছিলেন এবং পরবর্তীকালের জন্য 1997 সালের প্রায় 200 মিলিয়ন ওয়েব পৃষ্ঠাগুলির ওয়েব ক্রল পাওয়া ওয়েব সাইটগুলির লিঙ্ক ছিল। নীচের চিত্রগুলি সম্মিলিত বিতরণ ফাংশনগুলি পি (এক্স) দেয় এবং তাদের সর্বাধিক সম্ভাবনা শক্তি-আইন fi ts দেয়।

এখানে চিত্র বর্ণনা লিখুন

এই উভয় ডেটা সেটগুলির জন্য, ক্লাউসেট, শালিজি এবং নিউম্যান আবিষ্কার করেছেন যে বিতরণের চূড়ান্ত লেজকে সংশোধন করতে ক্ষতিকারক কুতোজের সাথে বিদ্যুৎ বিতরণ খাঁটি শক্তি আইন বিতরণের চেয়ে স্পষ্টতই ভাল ছিল এবং লগ-স্বাভাবিক বিতরণগুলিও বেশ উপযুক্ত। (তারা তাত্পর্যপূর্ণ এবং প্রসারিত তাত্পর্যমূলক অনুমানের দিকেও নজর দিয়েছিল))

যদি আপনার হাতে একটি ডেটাসেট থাকে এবং কেবল নির্বোধ কৌতূহলী না হন তবে আপনার এটি বিভিন্ন মডেলের সাথে ফিট করে তাদের তুলনা করা উচিত (আর: পিচিস্কিউড (2 * (লগলিক (মডেল 1) - লগলিক (মডেল 2)), ডিএফ = 1, কম lower লেজ = মিথ্যা))। আমি স্বীকার করি যে জিরো-অ্যাডজাস্টেড জেডএম মডেলটি কীভাবে মডেল করবেন তা সম্পর্কে আমার কোনও ধারণা নেই। রন পিয়ারসন জেডএম বিতরণ সম্পর্কে ব্লগ করেছেন এবং সম্ভবত একটি আর প্যাকেজ জিপফআর রয়েছে। আমি, আমি সম্ভবত একটি নেতিবাচক দ্বিপদী মডেল দিয়ে শুরু করব তবে আমি প্রকৃত পরিসংখ্যানবিদ নই (এবং আমি তাদের মতামত পছন্দ করব)।

(আমি উপরের দ্বিতীয় মন্তব্যকারী @ রিচিওমরিরিসওকেও দেখতে চাই যারা ডেটা দেখায় সম্ভবত বিভিন্ন মানুষের আচরণের সাথে সম্পর্কিত নয় এমন অনেকগুলি কম্পিউটারের প্রতিনিধিত্ব করে যে ওয়েব এবং আইপি অ্যাড্রেস ক্রল করে এমন প্রোগ্রামগুলির দ্বারা প্রভাবিত হয়)

কাগজপত্র উল্লিখিত:


@ ম্যাটব্যাগ, আকর্ষণীয় দেখাচ্ছে, এই ক্ষেত্রে এটি চেষ্টা করবে stats.stackexchange.com/q/41286/13201
ফ্রেডরিকড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.