প্রতিদিনের দর্শন ব্যবহার করে কোনও ওয়েবসাইট সক্রিয় কিনা তা নির্ধারণ করা হচ্ছে


15

প্রসঙ্গ:

আমার একটি ওয়েবসাইট রয়েছে যেখানে আমি প্রতিদিনের ভিত্তিতে ভিজিটের সংখ্যা রেকর্ড করি:

W0 = { 30, 34, 28, 30, 16, 13, 8, 4, 0, 5, 2, 2, 1, 2, .. } 
W1 = { 1, 3, 21, 12, 10, 20, 15, 43, 22, 25, .. }
W2 = { 0, 0, 4, 2, 2, 5, 3, 30, 50, 30, 30, 25, 40, .. } 
...
Wn 

সাধারণ প্রশ্ন:

  • কোন সাইটগুলি সর্বাধিক সক্রিয় তা আমি কীভাবে নির্ধারণ করব?

এর দ্বারা আমার বোঝা যাচ্ছে আরও কয়েকদিন পরিদর্শন করা বা গত কয়েকদিনের মধ্যে হঠাৎ করে পরিদর্শন করা বৃদ্ধি। উদাহরণস্বরূপ, ডাব্লু0 এর উপরে ছোট উদাহরণে প্রথমদিকে জনপ্রিয় হবে তবে ত্যাগ প্রদর্শন শুরু করছে, ডাব্লু 1 স্থির জনপ্রিয়তা দেখাচ্ছে (কিছু বিচ্ছিন্ন শিখর সাথে), এবং ডাব্লু 3 একটি শান্ত শুরুর পরে একটি গুরুত্বপূর্ণ উত্থাপন)।

প্রাথমিক চিন্তা:

আমি এই থ্রেডটি এসওতে পেয়েছি যেখানে একটি সাধারণ সূত্র বর্ণিত হয়েছে:

// pageviews for most recent day
y2 = pageviews[-1]
// pageviews for previous day
y1 = pageviews[-2]
// Simple baseline trend algorithm
slope = y2 - y1
trend = slope * log(1.0 +int(total_pageviews))
error = 1.0/sqrt(int(total_pageviews))
return trend, error

এটি দেখতে বেশ ভাল এবং সহজ লাগছে, তবে এটিতে আমার সমস্যা হচ্ছে।

গণনা opালু উপর ভিত্তি করে। এটি সূক্ষ্ম এবং আমি আগ্রহী এমন বৈশিষ্ট্যগুলির মধ্যে একটি, তবে আইএমএইচও এটি নন-মোনোটোনিক সিরিজের জন্য সমস্যা রয়েছে। কল্পনা করুন যে কিছু দিনের মধ্যে আমাদের ধ্রুবক পরিদর্শন হয় (তাই theাল = 0), তবে উপরের প্রবণতাটি শূন্য হবে।

প্রশ্নাবলী:

  • আমি উভয় ক্ষেত্রে (একঘেয়েমিক বৃদ্ধি / হ্রাস) এবং প্রচুর পরিমাণে হিটগুলি কীভাবে পরিচালনা করব?
  • আমার কি আলাদা সূত্র ব্যবহার করা উচিত?

1
আমি অবাক হয়েছি আপনি এখনও কোনও উত্তর পান নি (যদিও এটি স্পষ্টতই জনপ্রিয় প্রশ্ন)। যেহেতু আপনার চারটি বুলেট প্রতিটিই নিজের এবং নিজের জন্য একটি প্রশ্ন মূল্যবান, তবে এই প্রশ্নটির মধ্যে একটিতে কীভাবে সীমাবদ্ধ রাখবেন এবং অন্যকে পৃথক প্রশ্নে পোস্ট করবেন about এগুলি সমস্তই সত্যিই দুর্দান্ত প্রশ্ন যা আলাদা স্বীকৃতি দেয় এবং চারটিই নিজেরাই সার্থক।
অ্যান্ডি ডব্লিউ

হাই অ্যান্ডি, আপনার উত্তরের জন্য অনেক ধন্যবাদ। আমি এটি পুনরায় প্রচার করার চেষ্টা করব এবং একবারে একটি ইস্যুতে ফোকাস করব। আমার প্রাথমিক চিন্তাধারা এটিকে যথাসম্ভব বিস্তৃত করে তুলছিল (এবং পরে একই প্রশ্নের পুনরাবৃত্তি এড়াতে) তবে উত্তরের অভাবের কারণে, মনে হয় কারও উত্তর দেওয়া খুব সাধারণ is
ড্যান

আমি বেশিরভাগ আগ্রহী দুটি মূল বিষয় প্রকাশ করার জন্য প্রশ্নটি সম্পাদনা করেছি their তাদের ঘনিষ্ঠ সম্পর্কের প্রেক্ষিতে আমি তাদের একই প্রশ্নে রাখার সিদ্ধান্ত নিয়েছি।
ড্যান

1
ছোট ত্রুটিযুক্ত একটি অনুমান কেন একটি পদ্ধতিকে 'অকেজো' করে তোলে তা আমি এখনও বুঝতে ব্যর্থ হয়েছি।
onestop

মন্তব্যের জন্য ধন্যবাদ. আমি বলছি না এপ্রোচ (ট্রেন্ড গণনা) অযোগ্য ছিল, তবে এর ত্রুটি গণনায় একটি সম্ভাব্য সমস্যা হতে পারে। এখনও অবধি আমার কোনও উত্তর পাইনি, আমি উত্তর দিতে আরও সহজ হয়ে যায় আশা করে প্রশ্নটি থেকে সেই আইটেমটি সরিয়ে ফেলব।
ড্যান

উত্তর:


4

দেখে মনে হচ্ছে আপনি "অনলাইন চেঞ্জপয়েন্ট সনাক্তকরণ পদ্ধতি" সন্ধান করছেন। (এটি গুগলিংয়ের জন্য একটি দরকারী বাক্যাংশ)) সাম্প্রতিক কিছু দরকারী (এবং অ্যাক্সেসযোগ্য) কাগজপত্র হলেন অ্যাডামস এবং ম্যাককে (একটি বায়সিয়ান পদ্ধতির) এবং কেওগ এট আল। আপনি সার্ভিসে আর এর জন্য নজরদারি প্যাকেজ টিপতে সক্ষম হতে পারেন । পরিসংখ্যান প্রক্রিয়া নিয়ন্ত্রণ পদ্ধতি ব্যবহার করে বিচ্ছিন্ন বিপুল সংখ্যক হিটগুলি পাওয়া যায় ।


2

এই ধরণের সমস্যা সমাধানের জন্য আরও কম জটিল উপায় অবশ্যই রয়েছে। জিনিসগুলির শব্দ থেকে আপনি মোটামুটি সহজ সমাধান (সূত্রটি আপনি এসও তে খুঁজে পেয়েছিলেন) দিয়ে শুরু করেছিলেন। সেই ধরণের সরলতার কথা মাথায় রেখে আমি ভেবেছিলাম যে আপনি আপনার পোস্টে (বর্তমান সংস্করণ) তৈরি কয়েকটি মূল পয়েন্টগুলিতে আবার ঘুরে দেখব।

এখনও অবধি, আপনি বলেছিলেন যে আপনি "সাইট কার্যকলাপ" এর পরিমাপ ক্যাপচার করতে চান:

  • "গত কয়েক দিন" ধরে ভিজিট / দিনে Slালের পরিবর্তন
  • "গত কয়েক দিন" ধরে পরিদর্শন / দিনে পরিধি পরিবর্তন

@ জন-গ্যালকোভস্কি যেমন উল্লেখ করেছেন, আপনিও এই দিকগুলির সাথে একে অপরের সাথে সম্পর্কিত সাইটগুলির র‌্যাঙ্কে আগ্রহী (কমপক্ষে স্বচ্ছন্দভাবে) বলে মনে করছেন।

যদি সেই বিবরণটি সঠিক হয়, আমি সেই সহজতম সমাধানটি অন্বেষণের প্রস্তাব করব যা এই তিনটি পদক্ষেপ (পরিবর্তন, প্রসার, র‌্যাঙ্ক) পৃথক উপাদান হিসাবে অন্তর্ভুক্ত করে। উদাহরণস্বরূপ, আপনি দখল করতে পারেন:

  • ঝাল বৈচিত্র ক্যাপচার আপনার SO সমাধানের ফলাফল (যদিও আমি 3 বা 4 দিনের ডেটা অন্তর্ভুক্ত করব)
  • প্রতিটি সাইটের সর্বাধিক সাম্প্রতিক পরিদর্শন / দিনের মান (y2)সেই সাইটের জন্য গড় ভিজিট / দিন দ্বারা ভাগ করা ( Y):

y2 / mean(Y)

ডাব্লু0, ডাব্লু 1 এবং ডাব্লু 2 এর জন্য যথাক্রমে 0.16, 1.45 এবং 2.35 উপার্জন হয়। (ব্যাখ্যার স্বার্থে, বিবেচনা করুন যে কোনও ওয়েবসাইট যার সাম্প্রতিকতম পরিদর্শন-প্রতিদিনের মূল্য এর সমান ছিল তার দৈনিক পরিদর্শন-এর ফলাফলের ফলাফল 1)। নোট করুন যে আপনি সাম্প্রতিক ২ (বা আরও) দিন ক্যাপচার করতে এই পরিমাপটি সামঞ্জস্য করতে পারেন:

y2 + y1 / 2 * mean(Y)

ফলন হয়েছে: আপনার তিনটি নমুনা সাইটের জন্য 0.12, 1.33, 1.91।

আপনি যদি প্রকৃতপক্ষে এই ধরণের পরিমাপের জন্য প্রতিটি সাইটের পরিদর্শন / দিনের বিতরণের মাধ্যমটি ব্যবহার করেন তবে আমি এর তুলনামূলক অস্থিরতার উপলব্ধি পেতে বিতরণের মানক বিচ্যুতিটিও দেখব। প্রতিটি সাইটের দর্শন / দিনের বিতরণের জন্য আদর্শ বিচ্যুতি: 12.69, 12.12 এবং 17.62। y2/mean(Y)স্ট্যান্ডার্ড বিচ্যুতির সাথে সম্পর্কিত পরিমাপের বিষয়ে চিন্তাভাবনা সহায়ক কারণ এটি আপনাকে ডাব্লু 2 সাইটে ক্রিয়াকলাপের সাম্প্রতিক পরিমাণটিকে দৃষ্টিকোণে রাখতে সহায়তা করে (বড় স্ট্যান্ডার্ড বিচ্যুতি = কম স্থিতিশীল / সামগ্রিকভাবে সামঞ্জস্যপূর্ণ)।

অবশেষে, আপনি যদি পদে আগ্রহী হন তবে আপনি এই দিকগুলিও সেই দিকে প্রসারিত করতে পারেন। উদাহরণস্বরূপ, আমি ভেবে দেখব যে প্রতিদিনের মানগুলিতে সর্বাধিক সাম্প্রতিক পরিদর্শনগুলির পাশাপাশি প্রতিটি সাইটের গড় পরিদর্শনগুলির দৈনিক ( mean (Y)প্রতিটি Wক্ষেত্রে র‌্যাঙ্ক Wn) র‌্যাঙ্কের ক্ষেত্রে কোনও সাইটের র‌্যাঙ্ক জেনে রাখা কার্যকর হতে পারে। আবার, আপনি আপনার প্রয়োজন অনুসারে উপযুক্ত করতে পারেন।

আপনি এই সমস্ত গণনার ফলাফলকে একটি টেবিল হিসাবে উপস্থাপন করতে পারেন বা প্রতিদিনের ভিত্তিতে এগুলি ট্র্যাক করতে নিয়মিত-আপডেট ভিজ্যুয়ালাইজেশন তৈরি করতে পারেন।


1

সাবধানতা অবলম্বন করুন যে ওয়েবসাইটগুলিতে ব্যবহারকারীদের আগমন হারগুলি অদ্ভুত সিরিজ, অত্যধিক সংবেদনশীল হতে থাকে (কোনও পয়সন দৃষ্টিকোণ থেকে), সুতরাং আগমনকারীদের দিকে নজর দেওয়ার জন্য নেতিবাচক দ্বিপদী বিতরণ এবং তাদের উপযুক্ততা বিবেচনা করুন। এছাড়াও, আপনি প্রতিদিন তাদের সাইটের সংখ্যাগুলির চেয়ে অর্ডার পরিসংখ্যানগুলি পরীক্ষা করতে চাইতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.