গড় মূল্য প্যারাডক্স - এটি কী বলা হয়?


22

আমার একটি ডেটাসেট আছে পর্যবেক্ষণ এবং ভেরিয়েবল বলুন :3103

obs  A   B   C
1    0   0   1
2    0   1   0
3    1   0   1
4    1   1   0
5    1   0   1
6    1   0   0
7    1   1   0
8    0   0   1
9    0   1   1
10   0   1   1

বলুন যে গ্রাহক যারা প্রতিটি বিভাগে ( ) কিনেছেন ( না) কিনেছেন । সেখানে রয়েছে তাই এই গ্রাহকরা গড়ে পণ্য বিভাগগুলিতে কেনেন ।16 10 1.61010A, B, C16101.6

নোট গ্রাহকরা এ, বি এবং সি এর একটিরও বেশিতে কিনতে পারবেন Note

যদি আমি কেবল যারা কিনে তাদের দিকে তাকাই Aতবে গ্রাহক যারা পণ্য বিভাগে কিনেছেন , সুতরাং এটি গড়ে ।9 1.8591.8

Bহয় আবার, অথবা ।1.89/51.8

Cহয়10/6=1.67।

তাদের সমস্ত উপরে1.6।

যা অদ্ভুত বলে মনে হচ্ছে। আমি এটি বুঝতে পেরেছি তবে পরের সপ্তাহে বিপণনের জন্য এটি ব্যাখ্যা করা দরকার এবং তাই সাহায্যের প্রয়োজন!

এটাকে কী বলা হয়?

আমি জানি এটি সিম্পসনের প্যারাডক্স নয়। আমার কাছে এটি মন্টি হল সমস্যা এবং শর্তসাপেক্ষ সম্ভাবনার সাথে যুক্তিতে একই রকম অনুভূত হয়।


2
ব্যক্তিগতভাবে, আপনি কী বলছেন তা আমার কোনও ধারণা নেই। ক্রস-ক্রয় নিদর্শনগুলি পরীক্ষা করার জন্য কেন, বিএস এবং সিএস-এর একটি আকস্মিক সারণী তৈরি করবেন না?
মাইক হান্টার

3
আমাদের কাছে প্রতিবেদন রয়েছে যে "গ্রাহকরা সি ক্রয় করেন তারা গড়ের চেয়ে বেশি মূল্যবান হয় - 1.67 বনাম 1.6" যা সত্য, তবে এ এবং বি গড়ের চেয়েও বেশি মূল্যবান। যার দিকে অনিবার্য প্রশ্ন উঠবে "সমস্ত গ্রাহক গড়ের চেয়ে কীভাবে মূল্যবান হতে পারেন"?
জেমস অ্যাডামস

3
আমি মনে করি তার ধাঁধাটি অতিমাত্রায় এটি হ্রদ ওয়াবেগনের মতো দেখাচ্ছে যেখানে প্রত্যেকেই গড়ের চেয়ে উপরে: পি যাক কোনও গ্রাহক কেনা বিভাগ / আইটেমের সংখ্যা হোক। যাক একজন , বি , আর সি বিভাগ এ, বি, ও সি যথাক্রমে ক্রয় জন্য সূচক হও। E [ এক্স ] = 1.8 , [ এক্স বি ] = 1.8 , এবং [ এক্স সি ] = 1.67 যখন [ এক্স ] =এক্সএকজনবিসি[এক্স|একজন]=1.8[এক্স|বি]=1.8[এক্স|সি]=1.67[এক্স]=1.6
ম্যাথু গন

12
আপনি পরিপূরক সেট এবং ভেন চিত্রের নিরিখে ভাবতে চাইতে পারেন । সেটগুলি "গ্রাহক যারা এ কিনে" এবং "গ্রাহক যারা এগুলি কিনে না " তা নন-ওভারল্যাপিং। তবে আপনার প্রশ্নের তালিকায় আপনি যে সেটগুলি তালিকাবদ্ধ করেছেন সেগুলি ওভারল্যাপ হয়ে যায়। উপগ্রহগুলির পার্টিশনটি তৈরি করা হয় কেবলমাত্র সাবসেটের গড় হিসাবে সামগ্রিক গড়কে (ওজনযুক্ত) হিসাবে গণনা করতে পারেন ।
জিওম্যাট 22

4
এটি কি বেশিরভাগ-মায়া প্যারাডক্সের সাথে আলতোভাবে মিলে যায়? একইভাবে যে কোনও ব্যক্তি কোনও সুপার নেটওয়ার্ককারের সাথে সংযুক্ত হওয়ার সম্ভাবনা রয়েছে, কোনও ক্রয় বিভাগে কি সুপার ক্রেতা থাকতে পারে? (আমি একজন সুপার নেটওয়ার্কারকে ফোন করছি যিনি অনেক লোকের সাথে সংযোগ স্থাপন করেন এবং এমন সুপার ক্রেতার সাথে যিনি বিভিন্ন আইটেম কিনে থাকেন)
ম্যাথিউ গন

উত্তর:


28

গড় প্রত্যেক উপবিষয়শ্রেণীটি সামগ্রিক গড় উপরে হতে পারে উপবিষয়শ্রেণীসমূহ বৃহত্তর গ্রাহকদের উপর ওভারল্যাপ করছে।

স্বজ্ঞাততা অর্জনের সহজ উদাহরণ:

  • কোনও ব্যক্তির A বিভাগে কোনও আইটেম কিনেছে কিনা তা সূচক হতে দিন A
  • কোনও বিভাগ বিতে কোনও আইটেম কিনেছে কিনা তা সূচক হতে দিন BB
  • যাক ক্রয় আইটেম সংখ্যা হতে হবে।X=A+B

PersonABi10ii01iii11

ব্যক্তি সেট যেখানে সত্য ওভারল্যাপ ব্যক্তি সেট কোথায় বি সত্য। তারা সেট বিরতি নাAB

তারপরে যখন [ এক্স ] = 1.5 এবং [ এক্স বি ] = 1.5E[X]1.33E[XA]=1.5E[XB]=1.5

যে বিবৃতিটি সত্য হবে তা হ'ল:

পি(একজন)[এক্স|একজন]+ +পি(বি)[এক্স|বি]-পি(একজনবি)[এক্স|একজনবি]=[এক্স]

231.5+ +231.5-132=1,3333

আপনি কেবল গণনা করতে পারবেন না কারণ এবং বি ওভারল্যাপ সেট করে , এক্সপ্রেশনটি সেই ব্যক্তিকে গণনা করে যে আই এবং বি উভয় জিনিস কিনে !পি(একজন)[এক্স|একজন]+ +পি(বি)[এক্স|বি]একজনবিএকজনবি

মায়া / প্যারাডক্সের নাম?

আমি যুক্তি দিয়েছি এটি সোশ্যাল নেটওয়ার্কগুলিতে সর্বাধিক বিভ্রম প্যারাডক্সের সাথে সম্পর্কিত ।

আপনার একক ছেলে থাকতে পারে যারা সবাই নেটওয়ার্ক / বন্ধু করে। সেই ব্যক্তি সামগ্রিকভাবে এক মিলিয়নের মধ্যে একজন হতে পারে তবে তিনি প্রতিটি ব্যক্তির বন্ধু হয়ে উঠবেন

একইভাবে, আপনি এ এবং বি উভয় বিভাগ ক্রয় করে এখানে 3 টির মধ্যে 1 জন আছেন তবে এ বা বি বিভাগের মধ্যে 2 টি ক্রেতার মধ্যে 1 জনই সুপার ক্রেতা।

চরম মামলা:

আসুন লোটোর টিকিটের সেট তৈরি করি । জোড়া প্রত্যেকে সেট S আমি একটি হারানো টিকেট: দুই টিকেট অন্তর্ভুক্ত আমি এবং জ্যাকপট বিজয়ী টিকেট।এনএসআমিআমি

প্রতি সেট এ গড় জয়ের পরে জেএসআমি যেখানেজেজ্যাকপট। প্রতিটি বিভাগের এর গড়উপায়প্রতি টিকিট সামগ্রিক গড় জেতা উপরেজেজে2জেজেএন+ +1

এটি বিক্রয় ক্ষেত্রে হিসাবে একই ধারণামূলক গতিশীল। প্রতিটি সেট জ্যাকপটের টিকিট একইভাবে অন্তর্ভুক্ত করে যেভাবে প্রতিটি বিভাগ A, B, বা C ভারী ক্রেতাকে অন্তর্ভুক্ত করে।এসআমি

আমার নীচের লাইন পয়েন্টটি বিচ্ছিন্ন সেটগুলির উপর ভিত্তি করে অন্তর্নিহিততা হবে , নমুনা জায়গার একটি সম্পূর্ণ পার্টিশন ওভারল্যাপিং সেটগুলির একটি সিরিজ বহন করে না । যদি আপনি ওভারল্যাপিং বিভাগগুলিতে শর্ত রাখেন তবে প্রতিটি বিভাগ গড়ের উপরে হতে পারে।

যদি আপনি নমুনা স্থান এবং শৃঙ্খলা সেটগুলিতে শর্ত বিভাজন করেন, তবে বিভাগগুলি সামগ্রিক গড় থেকে গড় বেরিয়ে যেতে হবে, তবে ওভারল্যাপিং সেটগুলির ক্ষেত্রে এটি সত্য নয়।


3
ধন্যবাদ! আমি মনে করি দ্বিগুণ গণনা ব্যাখ্যা করার মূল চাবিকাঠি। আমি মনে করি না যে এটি অগত্যা কয়েকটি চূড়ান্ত মানগুলির ফলাফল। আমার উপরের উদাহরণস্বরূপ ডেটাসেটটি মোটামুটি জাগ্রত এবং "গড়ের উপরে সমস্ত গোষ্ঠী" প্রভাব এখনও ঘটে। আমার ধারণা এটি বেশিরভাগ ক্ষেত্রেই ঘটবে। এটির কোনও নাম বা পূর্ববর্তী উদাহরণ রয়েছে কিনা তা অবাক করেই ভাবলাম।
জেমস অ্যাডামস

@ জেমসএডামস বিশ্লেষণ করছে এমন ডেটা ত্রুটিযুক্ত থাকলে এই ব্যাখ্যা হ'ল না। আমি যে দাবী করছি। আপনার কাছে এ, বি এবং সি বিভাগের পারস্পরিক একচেটিয়া এবং সম্পূর্ণ সেট থাকতে পারে না যেখানে ডেটা বিশ্লেষণের কিছু মৌলিক অনুমানের লঙ্ঘন না করে গ্রুপ গড় গড়ে একসাথে নেওয়া 3 এর গড়ের তুলনায় সবথেকে বেশি। আপনার ক্ষেত্রে এটি সম্ভবত সম্ভবত এ, বি এবং সি এর মাধ্যমগুলির অনুমানের জন্য ব্যবহৃত সামগ্রীর সামগ্রিক গড়ের ডোনমিনেটর (যেমন, আরও উত্তরদাতারা রয়েছে) থেকে পৃথক হয়েছে
মাইক হান্টার

2
@ ডি জনসন অবশ্যই আপনি ঠিক বলেছেন যদি এ, বি এবং সি ভাগ করে দেয় নমুনা স্থান। আমার প্রশ্নের পড়া এবং সরবরাহিত "ডেটা" (এটি যাই হোক না কেন) হ'ল এ, বি এবং সি ওভারল্যাপিং সেট। যদি এ, বি এবং সি ওভারল্যাপ হয়, তবে গ্রুপের গড়গুলি সামগ্রিক গড়ের চেয়ে বেশি হতে পারে (এটি আমার উত্তরের পয়েন্ট; বৃহত্তম গ্রাহকদের উপর সেটগুলি ওভারল্যাপ হয়!)। ওপি যা কিছু বলেছে তা অভ্যন্তরীণভাবে বেমানান। আপনার "আমরা বিএস ডেটা পাস করছি" ডিটেক্টরটি আমার চেয়ে ভাল হতে পারে এবং আমি সম্মত হই যে ডেটা / সংখ্যার বৈধতা সম্পর্কে সমালোচনামূলক প্রশ্ন জিজ্ঞাসা করা সর্বদা গুরুত্বপূর্ণ।
ম্যাথু গন

হ্যাঁ সেগুলি ওভারল্যাপিং সেটগুলি। আমার ডেটাসেটটি কয়েক মিলিয়ন গ্রাহক এবং 12 বিভাগ। যখন আমি দেখলাম আমার গড়গুলি সামগ্রিক গড়ের চেয়ে বেশি ছিল তখন আমি ভেবেছিলাম এটিকে বিজোড় তবে ব্যাখ্যাযোগ্য। আমি এটি দেখতে 10 obs এবং 3 বিভাগের উদাহরণ সেট একসাথে রেখেছি। আমি এখানে 1s এবং 0 সেকেন্ড ছড়িয়ে ছিটিয়েছি এবং এটি একইরূপে এসেছিল। আমার সন্দেহ হয় এটি বেশিরভাগ ডেটাসেটের সাথে ঘটে যেখানে এই ধরণের গড় গণনা করা হয়। @ জোহসন আমার উপরে যে উদাহরণটি দিয়েছেন যে আমি সামগ্রিক গড়ের জন্য ডিনোমিনেটর হিসাবে 10, আসরের জন্য 5, বিএসের জন্য 5, সিসির 6 ব্যবহার করছি। এই উদাহরণে আমি কী লঙ্ঘন করছি তা আমাকে বলতে পারেন?
জেমস অ্যাডামস

'10' কোনটি উপস্থাপন করে? 3 টি বিভাগে উত্তরদাতাদের নেট? আপনি যদি সবার জন্য একই ডিনমিনেটর ব্যবহার করেন তবে গড় কী হবে? এটি গড় গড় ফিরে আসা উচিত যা গ্র্যান্ড গড়ের চারপাশে ওঠানামা করে।
মাইক হান্টার

10

আমি এটিকে পারিবারিক আকারের প্যারাডক্স বা অনুরূপ কিছু বলব

ধরুন, একটি সাধারণ উদাহরণ হিসাবে, প্রত্যেকের প্যারামিটার সহ একটি অংশীদার এবং একটি পয়েসন-বিতরণযোগ্য শিশু রয়েছে :2

  • প্রতি ব্যক্তি বাচ্চাদের গড় সংখ্যা 2
  • শিশুদের সাথে প্রতি ব্যক্তি শিশুদের গড় সংখ্যা 21--22,313
  • প্রতিটি ব্যক্তির জন্য গড় ভাইবোনের গোষ্ঠীর আকার (তাদের ভাই এবং বোন এবং তাদের নিজের গণনা) 3

রিয়েল ডেমোগ্রাফিক এবং জরিপ নম্বরগুলি বিভিন্ন সংখ্যা কিন্তু একই ধরণের উত্পাদন করে

আপাত বিপরীতে হ'ল ব্যক্তিদের সহোদর গ্রুপগুলির গড় আকারটি প্রতি পরিবারে গড়ে বাচ্চাদের সংখ্যার চেয়ে বড়; স্থিতিশীল জনসংখ্যার গতিশীলতার সাথে, লোকেরা তাদের বাবা-মায়ের চেয়ে গড়ে কম বাচ্চাদের জন্মায় have

ব্যাখ্যাটি হ'ল গড়পড়তা পিতামাতাদের এবং পরিবারের বা ভাইবোনদের উপরে নেওয়া হচ্ছে: বড় পরিবারগুলিতে বিভিন্ন ওজন প্রয়োগ করা হচ্ছে। আপনার উদাহরণে ব্যক্তি বা কেনাকাটা দ্বারা ওজন মধ্যে পার্থক্য আছে; আপনার শর্তসাপেক্ষ গড়গুলি আপনাকে নির্দিষ্ট কেনাকাটার শর্ত সাপেক্ষে বাড়িয়ে তুলেছে।


8

অন্যান্য উত্তরগুলি কী হচ্ছে তা ওভারথাইচিং করছে। মনে করুন একটি পণ্য এবং দুটি গ্রাহক আছে। একজন পণ্য কিনেছিল (একবার) এবং একজনও কিনেনি। কেনা পণ্যের গড় সংখ্যা 0.5. তবে আপনি যদি কেবল সেই পণ্যটি কিনেছেন এমন গ্রাহকের দিকে নজর দিলে গড় বেড়ে যায় 1 এ।

এটিকে আমার কাছে প্যারাডক্স বা বিপরীত বলে মনে হয় না; পণ্য কেনার ক্ষেত্রে কন্ডিশনার সাধারণত ক্রয় করা পণ্যের গড় সংখ্যা বাড়িয়ে তুলবে।


যথাযথভাবে। ধরে নেওয়া 3 টি বিভাগের প্রতিটি ক্রয়ের সাথে খুব বেশি সংযুক্তি হয় না, আপনি যা করেন তা বিভাগের একটিতে ক্রয় হারকে 100% বাড়ানোর পরে গড় গণনা করা হয়। উদাহরণস্বরূপ তুলনা করা এটি আরও তথ্যমূলক হতে পারে। বি এবং সি বিভাগগুলিতে গড় ক্রয়ের হার: ক) ক্রেতা (১১/২০) খ) যারা কিনেছিলেন তাদের মধ্যে (১১/২০) খ)। আপনি কী দেখানোর / আমার অনুমানের সন্ধান করার চেষ্টা করছেন তার উপর নির্ভরশীল।
কনরাড

2

এটি কি কেবল ছদ্মবেশে "গড় গড়" বিভ্রান্তি নয় (যেমন পূর্ববর্তী স্ট্যাকেক্সচেঞ্জ প্রশ্ন )? আপনার প্রলোভনটি মনে হয় যে সাবমাইল গড় গড়ে জনসংখ্যার গড় গড়ে শেষ হওয়া উচিত, তবে এটি খুব কমই ঘটবে।

ধ্রুপদী "গড় গড়" এর মধ্যে, কেউ এন পারস্পরিক এক্সক্লুসিভ সাবসেটের গড় খুঁজে পায় এবং তারপরে উদ্বেগ প্রকাশিত হয় যে এই মানগুলি জনসংখ্যার গড় হিসাবে গড় হয় না। এই গড় গড় গড় একমাত্র উপায় যদি আপনার অ ওভারল্যাপিং উপগ্রহগুলির একই আকার থাকে। অন্যথায়, আপনাকে একটি ওজনযুক্ত গড় নেওয়া দরকার।

আপনার সমস্যাটি ওভারল্যাপিং উপগ্রহগুলি পেয়ে গড় বিভ্রান্তির গড় গড়ের তুলনায় আরও জটিল হয়ে উঠেছে, তবে মোচড় দিয়ে এই ক্লাসিক ভুল বলে মনে হয়। ওভারল্যাপিং উপগ্রহগুলির সাথে, জনসংখ্যার গড় গড়ে গড় নমুনা গড়ের সাথে শেষ করা আরও শক্ত।

আপনার উদাহরণে, যেহেতু একাধিক সাবসামে উপস্থিত হওয়া ব্যবহারকারীরা (এবং তাই অনেকগুলি জিনিস কিনেছেন) এই গড়গুলি বৃদ্ধি করবে। মূলত আপনি প্রতিটি বড় ব্যয়কারীকে একাধিকবার গণনা করছেন, যখন কেবলমাত্র একটি আইটেম কিনে এমন ফ্রিগাল লোকেরা কেবল একবার মুখোমুখি হয়, তাই আপনি বৃহত্তর মূল্যবোধের পক্ষপাতদুষ্ট হন। এ কারণেই আপনার নির্দিষ্ট সাবসেটগুলির গড় মানের চেয়ে বেশি রয়েছে তবে আমি মনে করি এটি এখনও "গড় গড় গড়" সমস্যা।

আপনি আপনার ডেটা থেকে সমস্ত ধরণের অন্যান্য উপসেট তৈরি করতে পারেন যেখানে সাবমেল গড়গুলি বিভিন্ন মানকে গ্রহণ করে। উদাহরণস্বরূপ, আসুন সাবলেটগুলি আপনার সাবসেটগুলির সাথে কিছুটা অনুরূপ গ্রহণ করা যাক। আপনি যদি কিনে না এমন লোকদের সাবসেটটি গ্রহণ করেন , আপনি গড়ে 7/5 = 1.4 টি আইটেম পাবেন। উপসেট যে সঙ্গে করা হয়নি বি কিনতে, আপনার কাছে গড়ে 1.4 আইটেম পেতে। যারা সি কিনে নি , তারা গড়ে গড়ে ২.৫ আইটেম কিনেছিল। এগুলি সমস্ত ১. 1. আইটেম / গ্রাহকের গড় জনসংখ্যার নীচে। সঠিক ডেটাসেট এবং উপগ্রহের সঠিক সংগ্রহ দেওয়া, আপনি ওভারল্যাপিং সাবসেটগুলি শেষ করতে পারেন যার গড় গড় জনসংখ্যার গড়; তবে এটি সাধারণ অ্যাপ্লিকেশনগুলিতে অস্বাভাবিক হবে।

এটি কি কেবলমাত্র আমি, নাকি গড়ের শব্দটি এখন অনেকগুলি পুনরাবৃত্তির পরেও অদ্ভুত বলে মনে হচ্ছে ... আশা করি আমার উত্তরটি সহায়ক হয়েছিল, এবং দুঃখিত যদি আমি আপনার জন্য শব্দটির গড় শব্দটি নষ্ট করে দিই!


ধন্যবাদ! ওভারল্যাপিং একই আকারের পার্টিশনগুলি সম্পর্কে মন্তব্যটি এটি আমার মনে স্পষ্ট করেছে। আমি আশা করছিলাম যে আমি যখন এই পরিসংখ্যানগুলি উপস্থাপন করতে এসেছি তখন আমি এমন কিছু বলতে পারি যে "সমস্ত বিভাগের গড়গুলি সামগ্রিক গড়ের চেয়ে বেশি, তবে এটি ব্লেব্লাহ প্যারাডক্স"। আপনি যখন বলেন "সিম্পসনের প্যারাডক্স! আইভি লিগ সেক্সিজম!" এবং তারপর ঘর থেকে দৌড়ে। (আপনি সবাই কখনও কখনও তা করেন না?) তাদের বলতে পছন্দ করবেন "এটি কারণ এটি বিভিন্ন আকারের ওভারল্যাপিং উপগ্রহগুলি" তবে মনে হয় না যে এটি অবতরণ করবে!
জেমস অ্যাডামস

1
হাহা, যথেষ্ট ফর্সা। আমি এর আগে পুরোপুরি প্রসঙ্গটি পাইনি - আমি একজন অ্যাস্ট্রো ফিজিক্স গ্রেডের শিক্ষার্থী, সুতরাং আমি প্রসঙ্গে খুব বেশি পরিচিত নই। আপনি সংক্ষিপ্ত কিছু বলতে পারেন, "সামগ্রিক গড়ের তুলনায় সমস্ত উপসেটের গড় বেশি কারণ তারা আমাদের সাবসেটগুলি বৃহত্তর মানগুলির প্রতি পক্ষপাতদুষ্ট করে দিয়েছিল।" আমি গড় গড় নাম উল্লেখ করবো না যেহেতু এটি এতটা সুপরিচিত নয় এবং আপনার ক্ষেত্রে এটি সাধারণীকরণের মতো। আমি শব্দের বিভাগগুলি প্রতিস্থাপনের জন্য একটি প্রতিশব্দ খুঁজতে চেষ্টা করতাম - সাধারণত আমি শব্দটি পারস্পরিক একচেটিয়া উপগ্রহ হিসাবে দেখি।
টেবিল

শব্দার্থানু উত্তেজনা একটি মনস্তাত্ত্বিক ঘটনা যেখানে পুনরাবৃত্তি শব্দের জন্য একটি শব্দ বা বাক্যাংশ অস্থায়ীভাবে অর্থ হারাতে বাধ্য করে, যিনি তারপরে বারবার অর্থহীন শব্দ হিসাবে বক্তব্যটি অনুধাবন করেন।
প্যাট্রিক

1

যেহেতু বিষয়টি " আমি এটি বুঝতে পেরেছি তবে এটি বিপণনের ক্ষেত্রে ব্যাখ্যা করা দরকার ", সুতরাং কোনও সাধারণ মানুষ কীভাবে এই বিষয়গুলি ব্যাখ্যা করবে - (সত্য সত্য নয়, কীভাবে তারা তা প্রদর্শিত হবে তা নয়) ওপিকে উদ্বিগ্ন বলে মনে হয়। প্রশ্নটি 10 ​​পণ্য বিভাগ, (এজে) উল্লেখ করে, সুতরাং এই উদাহরণটি সম্পর্কে কীভাবে:

[বিপণন গোষ্ঠীর সাথে বৈঠকে]
ওপি : সুতরাং, আপনি এখানে দেখতে পাচ্ছেন যে , গ্রাহক যারা এ, বি এবং সি কিনেছেন, তারা গড়ের চেয়ে সব থেকে বেশি মূল্যবান।
লেমন : দাঁড়াও ?! সবাই কীভাবে গড়ের চেয়ে বেশি হতে পারে?
ওপি : ভাল প্রশ্ন। এই স্লাইডটি এ, বি এবং সি এর গ্রাহকদের উপর দৃষ্টি নিবদ্ধ করে, তবে অন্যান্য, স্বল্প পারফর্মিং রয়েছে, গ্রুপগুলি দেখানো হয়নি। উদাহরণস্বরূপ, ডি এবং জি বিভাগের গ্রাহকরা প্রায় গড়ের অর্ধেক মূল্যবান।

এটি 'সমস্ত কিছুর গড়ের উপরে' সম্পর্কে প্রত্যেকের অভ্যন্তরীণ বিএস-অ্যালার্মকে কমাতে হবে।


এটি কোনও প্রশ্নের উত্তর দেওয়ার উপায় নয়।
মাইকেল আর চেরনিক

তার প্রশ্নের উত্তর দেওয়া হয়েছিল, কিন্তু কেউই তার সমস্যার সমাধান করেননি।
প্যাট্রিক

আমার মন্তব্যটি কেবল প্যাট্রিকের উত্তর নিয়েই ছিল।
মাইকেল আর চেরনিক

উত্তর দেওয়ার বিভিন্ন শৈলীর বিপরীতে আমি কোনও নিয়ম দেখতে পাচ্ছি না। রিপোর্ট করা (আসল বা কল্পিত) আলোচনা এবং কথোপকথনটি সক্রেটিস থেকে আগত ইস্যুগুলির মাধ্যমে (এবং তার আগে আমি জানি সবার জন্য) চিন্তাভাবনার একটি সময়-সম্মানজনক উপায় way
নিক কক্স

তবে সেই ব্যাখ্যাটি সত্যই ভুল। এমনকি আরও বিভাগগুলির (ডিজে) অনুপস্থিতিতেও পর্যবেক্ষণটি সত্যই রয়েছে: উপসেটগুলি পুরো সেটটি কভার করলেও ওভারল্যাপিং উপগ্রহগুলির গড়গুলি পুরো সেটটির গড়ের চেয়ে বেশি হতে পারে।
ইসরান্দি

0

অন্যান্য উত্তর এখানে উপেক্ষা করুন। এটি আসলে মোটেই প্যারাডক্স নয়। হাত এখানে সবাই উপেক্ষা করা বলে মনে হয় যা প্রকৃত সমস্যাটি হল এই যে আপনি ভুল হয় যা সম্ভাব্যতা আপনি আসলে এ খুঁজছেন। এখানে খেলতে আসলে দুটি সম্পূর্ণ ভিন্ন গড় এবং পরিসংখ্যান রয়েছে যা উভয়েরই আপনার প্রস্তাবিত উদাহরণে (বিপণন) নিজস্ব ব্যবহার এবং ব্যাখ্যা রয়েছে!

প্রথমে গ্রাহক প্রতি ক্রয় করা পণ্যগুলির গড় সংখ্যা রয়েছে। সুতরাং গড়ে একজন গ্রাহক 1.6 টি আইটেম কিনে। অবশ্যই, কোনও গ্রাহক পণ্যটির ০..6 ব্যতীত (এটি ধরে নিচ্ছেন যে এটি চাল বা শস্যের মতো কিছু নয় যা এর সাথে ক্রমাগত পরিমাপের সাথে জড়িত)।

দ্বিতীয়ত, গড়পড়তা গ্রাহকরা একটি নির্দিষ্ট পণ্য কেনেন। অদ্ভুত লাগছে তাইনা? সুতরাং গড়ে একটি পণ্যের 5.33333333 ... গ্রাহকরা এটি কিনছেন। এটি অবশ্য আলাদা। আমরা এখানে যা বর্ণনা করছি তা কেনা পণ্যগুলির সংখ্যা নয় (তাদের মধ্যে কেবল তিনটিই রয়েছে!) বরং প্রকৃতপক্ষে পণ্যটি কিনে নেওয়া লোকের সংখ্যা।

দুটি মানকে এইভাবে ভাবুন: কেবলমাত্র একজন গ্রাহক বা কেবল একটি পণ্য থাকলে এই দুটি মানটি কী উপস্থাপন করবে? সর্বোপরি, একটি একক ডাটা পয়েন্টের গড় কেবল সেই ডেটা পয়েন্ট।

বা আরও ভাল, চার্টটি মনে করুন যেন এটি আপনাকে পণ্যটি কেনার জন্য ব্যয় করা ডলার পরিমাণ দেয়। স্পষ্টতই, কোনও পৃথক গ্রাহকের দ্বারা ব্যয় করা গড় পরিমাণ একটি বড় কর্পোরেশন (বা এমনকি একটি ছোট্ট ব্যবসায়) দ্বারা সরবরাহিত পণ্য দ্বারা গড়ে অর্থের পরিমাণের তুলনায় অনেক কম হবে। আমি নিশ্চিত যে আপনি যখন কোম্পানির মঙ্গল নিয়ে আলোচনা করবেন তখন উভয় মান ব্যবহারের ভাল উপায় সম্পর্কে ভাবতে পারেন।

আপনি যখন বিপণন কর্মীদের কাছে এটি ব্যাখ্যা করতে যান, ঠিক তেমনই বলেছি যা তাদের বলেছি। এটি কোনও প্যারাডক্স নয়। এটি একটি সম্পূর্ণ ভিন্ন পরিসংখ্যান। এখানে কেবল ইস্যুটিই লক্ষ করা গিয়েছিল যে চার্টটি পড়ার জন্য দুটি পৃথক পদ্ধতি (অর্থাত্ প্রতি পণ্য ক্রয় করা লোকের সংখ্যা বনাম প্রতি ব্যক্তি কেনা পণ্য সংখ্যা) read

tl; ডাঃ আপনি বর্ণিত প্রথম জিনিসটি কোনও পৃথক গ্রাহক আপনার পণ্য ক্রয় করতে ব্যয় করতে আগ্রহী গড় পরিমাণ। দ্বিতীয়টি হল জনগণের দেওয়া প্রদত্ত পণ্যের গড় চাহিদা for আমি নিশ্চিত যে এখনই আপনি দেখতে পাচ্ছেন কেন দু'জনেই অবশ্যই একই জিনিস নয়। এগুলি এর সাথে তুলনা করা আপনাকে কেবল আবর্জনার তথ্য দেবে।


সম্পাদনা

এটি উপস্থিত হবে প্রশ্নটি আসলে গ্রাহকদের দ্বারা ব্যয় করা গড় অর্থ সম্পর্কে জিজ্ঞাসা করছে যারা কিছু পণ্য ক, খ, বা সি কিনে। ঠিক আছে। এটি গণনার ক্ষেত্রে আসলে একটি ত্রুটি। আমি এটিকে প্যারাডক্স বলব না। এটি আসলেই একটি সূক্ষ্ম ফ্লাব।

আপনার কলাম দেখুন। এমন কিছু ব্যক্তি আছেন যা কলামগুলির মধ্যে ভাগ করা আছে। ধরে নেওয়া যাক আপনি সঠিক ওজন গড়ে করেছেন। আপনি এখনও দু'বার লোক যুক্ত করছেন। এর অর্থ হল যে গড়ের অতিরিক্ত লোকেরা 2 এর চেয়ে বেশি বা সমান মানযুক্ত থাকবে Now এখন আপনার গড়টি কী ছিল? এটা ছিল 1.6! সংক্ষেপে আপনার গড় এইরকম দেখাচ্ছে:

Σআমি=0এনবনামএকটিতোমার দর্শন লগ করাহেপিRগুলিএনআমি*বনামএকটিতোমার দর্শন লগ করাহেপিRগুলিএনআমিএন

এটি অবশ্যই সঠিক সূত্র নয়। পারস্পরিক একচেটিয়াত্ব ধরে নিলেও এটি একটি ওজনযুক্ত গড় that যা আপনার পরিস্থিতিতে সত্যিকারের গড় পেতে আপনি কীভাবে সামঞ্জস্য করবেন।

Σআমি=0এনএনতোমার দর্শন লগ করামিRহেপিপিবিতোমার দর্শন লগ করাYআমিএনআমি*একটিবনামRএকটিএসপিএনটিবিYপিRগুলিএনবিতোমার দর্শন লগ করাYআমিএনআমিএন

যে কোনও উপায়ে আপনি গড়পড়তা গড় পাবেন। একটি ভুল ওজনযুক্ত গড়ের প্রয়োজনকে অগ্রাহ্য করছিল কারণ একটি বিভাগের গড় বিবেচনায় একটি বৃহত্তর "ওজন" থাকে। এটি ঘনত্বের মতো। একটি মান হ'ল লোকেরা প্রতিনিধিত্ব করে den অন্য ইস্যুটি হ'ল নকল যুক্ত যা গড় বিকৃত করবে। যদিও আমি এই "প্যারাডক্স" এর কোনওটিকেই বলি না। একবার আমি দেখলাম আপনি কী করছেন এটি আমার কাছে স্পষ্ট মনে হয়েছিল কেন এটি কাজ করবে না। ওজনযুক্ত গড় তার প্রয়োজনের জন্য কিছুটা স্ব-ব্যাখ্যাযোগ্য এবং আমি মনে করি এখন আপনি দেখতে পেয়েছেন যে আপনি একাধিকবার মান যোগ করেছেন ... যা কাজ করতে পারে না। আপনি মূলত তাদের মানগুলির স্কোয়ারের গড় নিয়েছেন।


আমি মনে করি না যে এটি কেস। আমি এখানে কত লোক নির্দিষ্ট পণ্য কিনে আগ্রহী তা নয়। গ্রাহকরা এগুলি কিনেছেন এমন কতগুলি পণ্য ক্রয় করেছে তাতে আমি আগ্রহী
জেমস অ্যাডামস

@ জেমসএডামস ঠিক আছে যথেষ্ট। সেক্ষেত্রে বিষয়টি আরও তুচ্ছ। আপনি কেবলমাত্র আপনার নমুনার একটি উপসেট গড়ে নিচ্ছেন। তাত্ত্বিকভাবে আপনি যদি বি এবং সি এর সাথে একই করেন তবে চূড়ান্ত গড় আসল গড় হবে না। তবে এটি মাত্র নমুনাগুলি অসম হওয়ার কারণে। এখানেই শেষ. আসলে, আমি কোনও কারণ দেখছি না যে এটি কোনও ব্যক্তির কাছে সুস্পষ্ট হবে। আপনাকে যথাযথ গড় পেতে গড়পড়তা স্থির করার একটি সমাধান রয়েছে। একে ওজনযুক্ত গড় বলা হয় এবং মূলত আপনি সেই গোষ্ঠীর লোকদের সংখ্যার সাথে প্রতিটি উপশমকে "ওজন" করতে পারেন। ধারণা তৈরী কর?
গ্রেট হাঁস

@ জামেসএডামস এবং আমি জানি আপনি এটিতে আগ্রহী নন। আপনি গণিত, যা আপনি দাবি করেছেন এমন একটি প্যারাডক্স গঠন করেছিলেন যা গড়ে গড়ে প্রতিটি ব্যক্তি হিসাবে গড়ে পণ্যগুলির গড় সংখ্যা চেষ্টা করতে ও গণনা করতে ব্যবহৃত হয়। এই কারণেই এই উত্তরে আমি জোর দিয়ে বলছি যে পৃথক পরিসংখ্যানের জন্য দ্বিতীয় গড় রয়েছে এবং আপনার "ভুল" এটি একেবারে আলাদা গড় হিসাবে গড়ে তোলার চেষ্টা করেছিল।
গ্রেট ডাক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.