১০০০ এর মধ্যে than০০ এর চেয়ে আরও বেশি বিশ্বাসযোগ্য কেন?


41

স্টেলা কোট্রেল, পৃষ্ঠা 155-র "অধ্যয়ন দক্ষতা হ্যান্ডবুক", পালগ্রাভ, 2012 এর এই সংক্ষিপ্তসারটি দেখুন:

শতাংশ দেওয়ার সময় শতাংশ বিজ্ঞপ্তি Notice
মনে করুন পরিবর্তে, উপরের বিবৃতিটি পড়ুন:

Of০% মানুষ কমলা পছন্দ করে; ৪০% বলেছেন তারা আপেল পছন্দ করেন।

এটি বিশ্বাসযোগ্য দেখায়: সংখ্যার পরিমাণ দেওয়া হয়। তবে 60% এবং 40% এর মধ্যে পার্থক্য কি তাৎপর্যপূর্ণ ? এখানে আমাদের জানতে হবে কতজনকে জিজ্ঞাসা করা হয়েছিল। যদি 1000 জন লোককে জিজ্ঞাসা করা হয় যার মধ্যে 600 টি পছন্দসই কমলালে, সংখ্যাটি প্ররোচিত হবে। তবে, যদি কেবল 10 জনকে জিজ্ঞাসা করা হয়, 60% এর অর্থ 6 জন লোক কমলা পছন্দ করে। "10% এর মধ্যে 6" এটির মতো "60%" বিশ্বাসযোগ্য শোনায়। একটি সমালোচক পাঠক হিসাবে, অপর্যাপ্ত ডেটা চিত্তাকর্ষক দেখাতে শতকরা শতাংশ ব্যবহার করা দরকার।

পরিসংখ্যানগুলিতে এই বৈশিষ্ট্যটি কী বলা হয়? আমি এটি সম্পর্কে আরও পড়তে চাই।


38
নমুনা আকারের বিষয়গুলি
আকসকল

36
আমি এলোমেলোভাবে দু'জনকে বাছাই করি, তারা উভয়ই পুরুষ এবং অতএব আমি সিদ্ধান্ত নিয়েছি যে আমেরিকানদের 100% পুরুষ are বিশ্বাসযোগ্য?
কেসি

2
এটি "কমলাগুলির সাথে আপেলের তুলনা করবেন না" নীতিটি
উলফুল 19

2
কোনও ভিন্ন কোণ থেকে এই প্রশ্নের কাছে যাওয়ার জন্য আপনি ফ্রেমিং এফেক্টের সাহিত্য খনন করতে পারেন। তবে এটি জ্ঞানীয় পক্ষপাতিত্বের উদাহরণ এবং এটি একটি মানসিক বিষয়, পরিসংখ্যানগত নয়।
লারেক্স

2
আপনি আনুমানিক পরিমাণকে কতটা প্রভাব ফেলবে তা 1 এর একটি পার্থক্য কল্পনা করতে পারেন। /10/১০ relatively০/১০০০০ থেকে /10০/১০০ এর তুলনায় /10/১০ তুলনামূলকভাবে অনেক বেশি।
ম্যাথ্রেডলার

উত্তর:


54

আমি আরেকটি স্বজ্ঞাত উদাহরণের তালিকা দিতে চাই।

ধরুন আমি আপনাকে বলি যে কোনও মুদ্রা ফ্লিপের ফলাফল সম্পর্কে আমি পূর্বাভাস দিতে পারি। আপনি বিশ্বাস করেন না এবং আমার ক্ষমতা পরীক্ষা করতে চান।

আপনি 5 বার পরীক্ষা করেছেন, এবং আমি তাদের সব ঠিক করেছি। আপনি কি বিশ্বাস করেন আমার বিশেষ ক্ষমতা আছে? হয়তো না. কারণ আমি তাদের সকলকে যথাযথভাবে পেতে পারি। (বিশেষত, ধরা যাক মুদ্রাটি একটি ন্যায্য মুদ্রা, এবং প্রতিটি পরীক্ষা স্বাধীন), তবে আমি কোনও সুপার পাওয়ার ছাড়াই সহ সমস্ত অধিকার পেতে পারি it এটি সম্পর্কে একটি রসিকতার জন্য শাফলপ্যান্টের লিঙ্কটি দেখুন )।0.550.03

অন্যদিকে, আপনি যদি আমাকে প্রচুর পরিমাণে পরীক্ষা করে দেখেন তবে আমি এটি সুযোগের সাথেই পাওয়া সম্ভব না। উদাহরণস্বরূপ, আপনি যদি বার পরীক্ষা করেন তবে আমার সবগুলি ঠিকঠাক পাওয়ার সম্ভাবনা ।0.5 10001000.51000


উইকিপিডিয়া থেকে পরিসংখ্যানগত ধারণাটিকে পরিসংখ্যানিক শক্তি বলা হয়

বাইনারি হাইপোথিসিস পরীক্ষার শক্তি হ'ল বিকল্প অনুমান (এইচ 1) সত্য হলে পরীক্ষাটি নাল হাইপোথিসিস (H0 )টিকে সঠিকভাবে প্রত্যাখ্যান করে।

মুদ্রা ফ্লিপ উদাহরণে সুপার পাওয়ারে ফিরে যান, মূলত আপনি একটি অনুমান পরীক্ষা চালাতে চান।

  • নাল হাইপোথিসিস (এইচ 0): আমার কাছে সুপার পাওয়ার নেই
  • বিকল্প অনুমান (এইচ 1): আমার কাছে সুপার পাওয়ার রয়েছে power

এখন আপনি যেমন সংখ্যাসূচক উদাহরণে দেখতে পাচ্ছেন (আমাকে পরীক্ষা করে বনাম আমাকে 100 বার পরীক্ষা করুন), পরিসংখ্যানগত শক্তি নমুনার আকার দ্বারা প্রভাবিত হয়েছে।

আরও পড়তে করার এখানে । (আরও প্রযুক্তিগত এবং টি-পরীক্ষার ভিত্তিতে)।

পরিসংখ্যান শক্তি বোঝার জন্য একটি ইন্টারেক্টিভ সরঞ্জাম এখানে পাওয়া যাবে । নোট, নমুনা আকারের সাথে পরিসংখ্যানের শক্তি পরিবর্তন!

এখানে চিত্র বর্ণনা লিখুন


24
বাধ্যতামূলক xkcd
Shufflepants

5
এটি আসলে প্রশ্নের উত্তর দেয় না। প্রশ্নের দুটি অংশ রয়েছে: "কেন [এটি] আরও বিশ্বাসযোগ্য ..." এবং "পরিসংখ্যানগুলিতে এই বৈশিষ্ট্যটি কী বলা হয়?" আপনি এমন একটি উদাহরণ সরবরাহ করেছেন যা পাঠককে জিজ্ঞাসা করে যে তারা উদাহরণের দ্বারা আরও দৃ are়প্রত্যয়ী হয়েছে, তবে আপনি ঘটনাটি ব্যাখ্যা করেননি বা কেন এটি আরও দৃinc়প্রত্যয়ী তা বোঝানোর চেষ্টা করেন নি (কেবলমাত্র একক উদাহরণে পাঠকের স্বজ্ঞাত যুক্তির উপর নির্ভরশীল)। তদতিরিক্ত, আপনি দ্বিতীয় প্রশ্নটি স্পর্শ করেন নি: আপনি যদি বিশ্বাস করেন যে এই ঘটনার কোনও নাম নেই, তবে স্পষ্টভাবে তা উল্লেখ করুন।
মাক্যেন

1
@ মেকেন এটি স্পষ্টতই একটি চেষ্টা করা উত্তর। এটি সর্বাধিক উত্তর নয় এবং এটি সম্পূর্ণ উত্তর নয় তবে আংশিক বা সকরাটিক উত্তর এটি কোনও উত্তর নয় বলে দাবি করার ভিত্তি নয়। প্রশ্নগুলির একটি প্রশ্ন জিজ্ঞাসা করা উচিত এবং যদি তারা ধারাবাহিক প্রশ্ন জিজ্ঞাসা করে তবে আমি মনে করি এটির মধ্যে কেবল কয়েকটি সমাধান করার জন্য এটি পুরোপুরি যুক্তিসঙ্গত (আদর্শের চেয়ে কম)। যদি আপনি এটি একটি দুর্বল উত্তর বলে মনে করেন তবে আপনি অবশ্যই যে সমস্যাগুলি দেখছেন সেগুলি সমাধান করার জন্য আপনি অবশ্যই নির্দ্বিধায় । [এই বিষয়ে আমি মনে করি না যে আমি দ্বিতীয় প্রশ্নের উত্তরও দিয়েছি; আমি কেবল প্রভাবটি নিয়ে আলোচনা করেছি; প্রতিটি ঘটনার একটি স্পষ্ট নাম থাকবে না]
Glen_b

1
আমি সাহায্য করতে পারি না তবে অনুভব করতে পারি যে 100% একটি বিশেষ কেস এবং এই উত্তরটি সত্যই আমার অন্তর্দৃষ্টি সমর্থন করে না যে 600/1000 6-10 এর চেয়ে বেশি বিশ্বাসযোগ্য। এমনকি যদি আমরা এটি একটি বিশেষ ক্ষেত্রে না হিসাবে গ্রহণ করি তবে এটি মূলত সমস্যাটিকে অন্য শতাংশের সাথে পুনরুদ্ধার করে।
নটথ্যগুই

2
@ জুয়া এটি একটি ওয়েব ভিত্তিক সরঞ্জাম যা কারও দ্বারা নির্মিত। আপনি এখানে
হাইতাও ডু

29

অনুপাতের দিক দিয়ে এটি সম্পর্কে ভাবেন। ধরা যাক যে কমলা পছন্দ করা একটি সাফল্য, অন্যদিকে আপেল পছন্দ করা ব্যর্থতা। সুতরাং আপনার গড় সাফল্যের হার বা এই ক্ষেত্রে 6।μ=# of sucessesn

এই পরিমাণ আদর্শ ত্রুটি অনুমান করা হয়। একটি ছোট নমুনা আকার (অর্থাত 10) জন্য, মান ত্রুটি কিন্তু 1000 একটি নমুনা আকার জন্য, মানক ত্রুটি । সুতরাং মূলত, মন্তব্যে যেমন উল্লেখ করা হয়েছিল, "নমুনা আকারের বিষয়গুলি।".155.0155μ(1μ)n.155.0155


17

এই ধারণাটি বিপুল সংখ্যক আইনের পরিণতি । উইকিপিডিয়া থেকে ,

আইন অনুসারে, বিপুল সংখ্যক বিচার থেকে প্রাপ্ত ফলাফলের গড় প্রত্যাশিত মানের কাছাকাছি হওয়া উচিত এবং আরও পরীক্ষাগুলি সঞ্চালিত হওয়ায় আরও কাছাকাছি যাওয়ার প্রবণতা থাকবে।

একটি ছোট নমুনা থেকে প্রাপ্ত ফলাফল বৃহত্তর নমুনার চেয়ে প্রত্যাশিত মান থেকে আরও দূরে হতে পারে। এবং তাই, প্রশ্নে যেমনটি বলা হয়েছে, ছোট নমুনা থেকে গণনা করা ফলাফলগুলি সম্পর্কে সতর্ক হওয়া উচিত। এই ইউটিউব ভিডিওতে ধারণাটিও বেশ ভালভাবে ব্যাখ্যা করা হয়েছে ।


5
পরিসংখ্যানগুলিতে "প্রচুর সংখ্যার আইন" হিসাবে পরিচিত বেশ কয়েকটি সুপরিচিত উপপাদ্য রয়েছে তবে এগুলির কেউই এমন প্রশ্নের বিবৃতি দেয় না যা প্রশ্নের উত্তরটির মতো লাগে। তাহলে কীভাবে আপনি সংযোগ স্থাপন করবেন?
হোবার

3
উইকিপিডিয়া en.wikedia.org/wiki/Law_of_large_numbers থেকে , "আইন অনুসারে, বিপুল সংখ্যক বিচার থেকে প্রাপ্ত ফলাফলের গড় প্রত্যাশিত মানের কাছাকাছি হওয়া উচিত এবং আরও ট্রায়ালগুলি সঞ্চালিত হওয়ায় আরও কাছাকাছি যাওয়ার প্রবণতা থাকবে"। । একটি ছোট নমুনা থেকে প্রাপ্ত ফলাফল বৃহত্তর নমুনার চেয়ে প্রত্যাশিত মান থেকে আরও দূরে হতে পারে। এবং তাই, প্রশ্নে যেমনটি বলা হয়েছে, ছোট নমুনা থেকে গণনা করা ফলাফলগুলি সম্পর্কে সতর্ক হওয়া উচিত।
ইভান ফিবস

6
এটি একটি ভাল ব্যাখ্যা, ধন্যবাদ। যদিও আপনি এই কথাটি সঠিক লিখেছেন যে আইনের উপর নির্ভরযোগ্য হওয়ার জন্য "" বিশাল সংখ্যক বিচার "কতগুলি হওয়া দরকার সে সম্পর্কে সতর্ক হওয়া উচিত, তবে অ্যাপ্লিকেশনটি স্বজ্ঞাতভাবে দৃ sound়। আমি আপনাকে পরামর্শ দিতে চাই যে আপনার ব্যাখ্যাটি আপনার উত্তরের সাথে সম্পর্কিত, যেখানে এটি কোনও মন্তব্যে না পড়ে বরং আরও ব্যাপকভাবে পড়া এবং প্রশংসা হবে। লিঙ্ক-কেবলমাত্র উত্তর (যেমন ইউটিউবে আপনার লিঙ্ক) এখানে শেষ হয় না।
whuber

6

আমরা কিছু নমুনার পরিমাণ দ্বারা জনসংখ্যার পরিমাণ অনুমান করার পরিস্থিতিতে আছি। এই ক্ষেত্রে, আমরা জনসংখ্যার অনুমান অনুমান করতে নমুনা অনুপাত ব্যবহার করছি, তবে নীতিটি যথেষ্ট সাধারণ more

আপনি মান গ্রহণ আপনার নমুনা সমস্ত পর্যবেক্ষণ যদি মনে করেন যখন তারা সুদ চারিত্রিক আছে ( "পছন্দসই আপেল থেকে কমলালেবু" উদাহরণ) ও যখন তারা না হয়, তাহলে অনুপাত 's একই এবং মানের সেটের গড় হিসাবে - যাতে আপনি সহজেই দেখতে পারেন যে একটি নমুনার অনুপাত আসলে একটি গড়।0 1 0 110101

যেহেতু আমরা বৃহত্তর এবং বৃহত্তর নমুনা নিই (এলোমেলো নমুনা ব্যবহার করে), নমুনাটির অর্থ জনসংখ্যার গড়তে রূপান্তরিত হবে। (এটি বৃহত সংখ্যার আইন)

তবে আমরা আসলে যা কিছু ধারণা করতে চাই তা হ'ল আমরা কতদূর দূরে থাকতে পারি (যেমন অনুপাতের জন্য একটি আত্মবিশ্বাসের ব্যবধানের প্রশস্ততা বা ত্রুটির প্রান্তিক দ্বারা প্রতিনিধিত্ব করা যেতে পারে যা সাধারণত এ জাতীয় প্রস্থের অর্ধেক) ।

সাধারণত, আপনার যত বেশি ডেটা থাকবে আপনার কোনও গড়ের মতো পরিমাণের পরিমাণ কম হবে। কারণ বড় আকারের নমুনাগুলি গ্রহণের সাথে সাথে নমুনার বন্টনের গড় বিচ্যুতি হ্রাস পায়। [আকারের বিভিন্ন বিভিন্ন নমুনা গ্রহণের কল্পনা করুন those মূল পর্যবেক্ষণগুলির বিতরণের চেয়ে এই মাধ্যমের বিতরণ কম পরিবর্তনশীল - মানক বিচ্যুতি প্রায় অর্ধেক বড় হতে হবে। এখন আপনি যদি আকার 400 এর বিভিন্ন বিভিন্ন নমুনার মাধ্যম গ্রহণ করেন তবে এর প্রমিত বিচ্যুতিটি আবার আরও ছোট হওয়া উচিত ( মূল পর্যবেক্ষণগুলির মানক বিচ্যুতির) ম)।120

নমুনা গড় বিতরণের স্ট্যান্ডার্ড ডেভিয়েশন ওয়ান ওয়ে টিপিক্যাল দূরত্ব একটি নমুনা গড় জনসংখ্যা গড়, যা হ্রাস পাচ্ছে থেকে পরিমাপ হয় (এটা যেমন কমে যায় , হিসাবে উপরের উদাহরণ)।1n

ফলস্বরূপ, নমুনা বড় হলে আমরা আমাদের অনুমানের নির্ভুলতা সম্পর্কে আরও আত্মবিশ্বাসী - আমরা যদি আবার আমাদের পরীক্ষার পুনরাবৃত্তি করি তবে এ জাতীয় অন্যান্য উপায় বর্তমানের কাছাকাছি থাকবে - তারা আরও বেশি শক্ত করে একসাথে ক্লাস্টার করে এবং কারণ (এই ক্ষেত্রে) আমাদের অনুমানটি পক্ষপাতহীন, তারা যে অনুমানগুলি আমরা অনুমান করার চেষ্টা করছি তার চারপাশে তারা একসাথে ক্লাস্টার করছে। একটি একক নমুনা গড় জনসংখ্যার গড় কোথায় হতে পারে সে সম্পর্কে আরও তথ্যবহুল হয়ে ওঠে।


4

"গণনা" পরিসংখ্যানগুলির জন্য একটি নিয়মের নিয়ম, যেমন কমলা পছন্দ করে এমন লোকের সংখ্যা গণনা বা তেজস্ক্রিয় ক্ষয়ের কারণে জিগার কাউন্টারে "ক্লিক" সংখ্যা গণনা করা, গণনার জন্য ত্রুটির ব্যবধানটি প্রায় বর্গক্ষেত্রের হয় প্রত্যাশিত গণনা মানের মূল। গণনা সংক্রান্ত পরিসংখ্যানগুলি হলেন পোয়েসনের পরিসংখ্যান।

Of এর বর্গমূল ২.৪-ইশ, সুতরাং ত্রুটির প্রান্তিকতা প্রায় ৪০% (২.৪ /))। 600 এর বর্গমূল 24-ইশ, সুতরাং ত্রুটির মার্জিন প্রায় 4% (24/600)। এ কারণেই counted০০ গণনা করা আরও উল্লেখযোগ্য যে counting টি গণনা অপেক্ষাকৃত ত্রুটিটি দশমাংশ।

ত্রুটির মার্জিনের সংজ্ঞা সম্পর্কে আমি কিছুটা ঝিমঝিম হয়েছি। এটি সত্যিই 1-সিগমা মান, এবং কোনও হার্ড কাট অফ নয়, তবে এটি এমন পরিসীমা যেখানে আপনি সবচেয়ে বেশি পরিমাপের (68%) মিথ্যা প্রত্যাশা করেন। সুতরাং আপনি যদি 6 কমলা খাওয়ার আশা করেন, আপনি পোলগুলির একটি সিরিজ 6,6,5,6,7,2,4,6,3,5,6 এর মতো 4 থেকে 8 রেঞ্জের বেশিরভাগ সংখ্যক দেবে বলে আশাবাদী, 6,7,6,10,8,6,5,6,6,9,3,7,8।


3

আপনি যে নামটি সন্ধান করছেন তা আমার কাছে নেই তবে বিষয়টি পরিসংখ্যানগত নয়। মনস্তাত্ত্বিকভাবে, মানুষ যেভাবে আমাদের মস্তিস্কে সংখ্যার প্রক্রিয়া করে তা ক্ষুদ্র সংখ্যার চেয়ে বৃহত্তর সংখ্যাকে বেশি ওজন (কর্তৃত্ব) দেয় কারণ দৈর্ঘ্য (শারীরিক আকার) প্রতিনিধির মান হিসাবে দৃষ্টিভঙ্গি হিসাবে গুরুত্বপূর্ণ। সুতরাং, 600/1000 6-10-এর চেয়ে বেশি বিশ্বাসযোগ্য বলে মনে হয়। এ কারণেই ক্রেতারা "10% ছাড়!" 100 এর চেয়ে কম মানের এবং "10 ডলার সংরক্ষণ করুন!" 100 এরও বেশি মানের জন্য ("100 এর বিধি" বলা হয়) আমাদের মস্তিষ্ক উপলব্ধি সম্পর্কে কীভাবে প্রতিক্রিয়া দেখায় এটি সম্পর্কে।

নিক এবং কোলেন্ডা তাঁর অনলাইন গ্রন্থ " প্রাইসিং সাইকোলজির জন্য এক বিরাট গাইড " -তে এই এবং এই জাতীয় ধরণের ঘটনার এক আশ্চর্য নজরে আলোচনা করেছেন ।


2
যদিও অন্য উত্তরগুলি ভুল না হলেও আমি এগুলিকে উদ্ধৃত পাঠ্যকে সঠিকভাবে সম্বোধন করতে দেখছি না। পাঠ্যটি সংখ্যা এবং অনুধাবনিত নির্ভুলতার উপস্থাপনের প্রভাবকে সম্বোধন করছে, যদি সংখ্যাগুলি আরও বেশি নির্ভুল হয় not এটিই, আপনি একজন ব্যক্তিকে বুঝতে পারেন যে আপনার তথ্যটি 1000 বা %০% বলে আপনার তথ্য আরও তাত্পর্যপূর্ণ বা আপনি কারণ হিসাবে তৈরি করতে পারেন 10 এর 6 বলার দ্বারা কম তাত্পর্যপূর্ণ বলে মনে হচ্ছে যদিও প্রতিটি একটি ছোট নমুনা প্রয়োগ করে একই জিনিসকে বোঝায় প্রকৃতপক্ষে যদি বলা হচ্ছে বা সম্ভবত সত্য হয় তবে এটির চেয়ে আকার size
dlb

1
এই উদাহরণটি আমার মতে মূলত ত্রুটিযুক্ত বলে মনে হচ্ছে। উদাহরণস্বরূপ, 100 এর কেনা মোট 90 টির জন্য 10% ছাড় পায় এবং 100.01 ক্রয় মোট 75.01 এর জন্য 25 ছাড় পায় যা ফলাফলগুলি একেবারে আলাদা দাম। বাস্তবে আপনি 250.05 (অথবা 250.10 রাউন্ডিং বা কাটা উপর নির্ভর করে) না পাওয়া পর্যন্ত মানগুলির মধ্যে পার্থক্য রয়েছে। প্রশ্নটি নমুনার আকার এবং স্ট্যান্ডার্ড ত্রুটির বিষয়ে কথা বলছে যখন আমাদের উদাহরণটি আমাদের উপলব্ধি করার কারণে প্রকৃত পার্থক্য সম্পর্কে আরও বেশি।
জো

@ জো ডব্লিউ, যদিও আমি "১০০ এর বিধি" (মনোবিজ্ঞানী নন) এর সুনির্দিষ্ট কথা বলতে পারি না, আমার উত্তরটি যে বক্তব্য দিচ্ছে তা হ'ল মনোবিজ্ঞানীরা স্থির করেছেন যে লোকেরা বৃহত্তর সংখ্যার উপর নির্ভর করে, বৃহত্তর কারণে নয় নমুনার আকার এটি প্রতিনিধিত্ব করে, তবে বৃহত্তর সংখ্যাকে দেওয়া বৃহত্তর গুরুত্বের উপলব্ধির কারণে। ইঞ্জিনিয়ার হিসাবে, আমি এটিকে এ জাতীয়ভাবে পছন্দ করব না --- তবে মানুষের মন কাজ করার উপায় এটি। আপনি যদি এটিকে চ্যালেঞ্জ করতে চান তবে আমি মিঃ কোলেন্দের উপস্থাপনার অন্তর্নিহিত বিশদটি পড়ার পরামর্শ দেব।
জেবিএইচ

আপনি আমার বক্তব্য মিস করছেন, 10% থেকে 100 এবং 25 এর মধ্যে আরও বড় পার্থক্য রয়েছে এটি কেবল উপলব্ধির বিষয় নয়। সাধারণ সত্যটি হ'ল যদি আপনি উভয় মান 100 এ গ্রহণ করেন তবে সেখানে 15% পার্থক্য রয়েছে যা একটি মান যা 10 এর মধ্যে একটি এবং 1000 এর মধ্যে দুটি পৃথক নমুনা বলার সময় আদর্শ ত্রুটি পরিমাপ করা অনেক সহজ
জো জো ডব্লু

আপনাকে সাহায্য করার জন্য আমি আমার প্রশ্নটি 10% এবং 10 ডলার ব্যবহার করে পরিবর্তন করেছি। "100 এর নিয়ম" এর বিন্দুটি হ'ল লোকেরা বৃহত্তর সংখ্যাকে বৃহত্তর প্রাসঙ্গিকতা হিসাবে উপলব্ধি করে এবং একক শতাংশের চেয়ে আর্থিক অনাবাদী হিসাবে আর্থিক মান উপলব্ধি করে। এটি ওপির উদ্দেশ্য নিয়ে আলোচনার বাইরে কিছুটা সমস্যা।
জেবিএইচ

3

যদিও প্রকৃত ত্রুটির মার্জিন গুরুত্বপূর্ণ, কারণ এটা শোনাচ্ছে আরো বিশ্বাসী আরো একটি অনুসন্ধানমূলক মানুষের সাথে অভিজ্ঞতা (চলতি রীতি) উপর ভিত্তি করে হয়। ত্রুটির প্রকৃত মার্জিন নিশ্চিত করে যে এই হিউরিস্টিকের যোগ্যতা রয়েছে।

যদি নমুনাটি 6 এর পক্ষে হয় এবং 4 এর বিপরীতে, যদি কোনও একক ব্যক্তি তাদের ভোট পরিবর্তন করে, বা কোনও একক ব্যক্তিকে ভুল করে রেকর্ড করা হয় তবে এটি 50/50 হতে পারে। শুধুমাত্র আছে দুই 6 পাশ আরও অনেক বেশি মানুষের। প্রত্যেকে দুটি ফ্লেক জানেন, প্রত্যেকে চেনেন যে নমুনাটি চেরি-বাছাই করা যেতে পারে: আপনি কেবল ওয়েট্রেস জিজ্ঞাসা করেছিলেন এবং অন্য কেউ নয়। অথবা আপনি কেবল কোনও বিশ্ববিদ্যালয়ের হলগুলিতে 10 টি কলেজের অধ্যাপককে পোল করেছেন। অথবা আপনি স্যাক্স পঞ্চম অ্যাভিনিউয়ের বাইরে 10 ধনী লোককে জিজ্ঞাসা করেছেন।

এমনকি গাণিতিক ব্যবধানের ত্রুটিটি সত্য এলোমেলোভাবে অনুমান করে এবং এটি নির্বাচন পক্ষপাত, বা স্ব-নির্বাচন পক্ষপাত, বা অন্য যে কোনও কিছুর জন্য নয়, লোকেরা স্বজ্ঞাতভাবে বুঝতে পারে।

বিপরীতে, 600 বনাম 400 ফলাফলের একপাশে 200 জন আরও বেশি লোক রয়েছে এবং 100 জনকে তাদের মত পরিবর্তন করতে হবে। আপনি কোথায় ভোট দিচ্ছিলেন এমন কোনও দুর্ঘটনার মাধ্যমে, তবে কীভাবে লোকেরা আপনাকে সম্মত করতে পেরেছে, ব্যক্তি কীভাবে প্রশ্নটি বুঝতে বা ব্যাখ্যা করেছেন ইত্যাদি দ্বারা এই সংখ্যাগুলি আসা খুব কঠিন (তবে অসম্ভব নয়) are

এটি গাণিতিক প্রমাণের কারণেই এটি আরও দৃinc়প্রত্যয়ী নয়, তবে আমরা অভিজ্ঞতা থেকে জানি যে ১০০ এর একটি দলের চেয়ে ১০০০ এর ভিড় তাদের মতামত (কোনও বিষয়ে) বিভিন্ন রকমের হওয়ার সম্ভাবনা অনেক বেশি (যদি আপনি গোপনে না করেন তবে কোনও রাজনৈতিক দলীয় সম্মেলনে বা কেকে-র সমাবেশে বা আপনার পক্ষে একতরফা জনতা আঁকার সম্ভাব্য অন্য কিছুতে ভোটদান।

গণিতটি কেবলমাত্র স্বজ্ঞাততা দ্বারা আমরা যা জানি তা কেবল স্পষ্টভাবে পরিমাপ করে; ১০ জনের মধ্যে দু'টি বিপথগামী ভোটকে এলোমেলোভাবে মোকাবিলা করা আরও সহজ, এটি 1000 এর মধ্যে 100 বা 200 ভ্রমন ভোটের এলোমেলোভাবে লড়াইয়ের চেয়ে বেশি।


3

বায়েশিয়ার দৃষ্টিকোণ থেকে সমস্যাটি দেখার বিষয়টি উল্লেখ করা হয়নি Some

একটি বায়েসিয়ান সেটিংয়ে, এই সমস্যার একটি প্রাকৃতিক পদ্ধতির মধ্যে বিটা-বাইনোমিয়াল বিতরণ ব্যবহার করা হবে । আপনি ধরে নিতে পারেন যে আপেলগুলির চেয়ে কমলা পছন্দ করার সম্ভাবনা হ'ল , যা বিটা বিতরণ করেছে এবং পর্যবেক্ষণগুলি প্যারামিটার প্যারামিটার দিয়ে বিতরণ করা হয়েছে : pp

pBeta(α,β)no|pBin(n,p).

আসুন ধরে নেওয়া যাক আপনার আপেল বা তদ্বিপরীত ( ) এর চেয়ে বেশি লোক কমলা পছন্দ করেন এমন বিশ্বাস করার কোনও পূর্ব -যুক্তির কারণ নেই তবে এটি সম্পর্কে আপনার কোনও দৃ opinion় মতামত নেই (দুর্বল পূর্বে: )। পূর্ববর্তী বিতরণ তাই অভিন্ন ।β=αβ=α=1pU(0,1)

নিকট থেকে উত্তর সংগ্রহের পর জনগণের পছন্দ সম্পর্কে প্রশ্নাবলীর, আপনি লক্ষ্য করুন যে উত্তরদাতাদের কমলালেবু পছন্দ এবং তাদের আপেল পছন্দ করে।nnona=nno

এর অবর বন্টন হল: পি | n o , n aB e t a ( n o + 1 , n a + 1 ) p

p|no,naBeta(no+1,na+1).

যদিও এর অবর মোড (অর্থাত সর্বোচ্চ-এ-আরোহী) হল উত্তরদাতাদের সংখ্যা নির্বিশেষে, বিতরণ নিজেই ভিন্ন: এটা আরো অনেক কিছু বৃহৎ জন্য শীর্ণ হয় ছোট চেয়ে বেশী।এন / ( এন + এন ) এনpno/(no+na)n

আপনাকে ধারণা দেওয়ার জন্য, এটি এবং :এন = 4no=6na=4

n_o = 6 এবং n_a = 4 সহ উত্তরবর্তী

যদিও এটি এবং : এন = 400no=600na=400এখানে চিত্র বর্ণনা লিখুন

এই প্লটগুলি আপনি কীভাবে পড়বেন? আপনি নিম্নরূপ যুক্তিযুক্ত হতে পারেন: "আমি পর্যবেক্ষণ করেছি যে 10 জনের মধ্যে 6 জন (এলোমেলোভাবে জনসংখ্যা থেকে বেছে নেওয়া হয়েছে) আপেলের চেয়ে কমলা পছন্দ করে তবে সত্যিকারের অন্তর্নিহিত সম্ভাবনা (পুরো জনসংখ্যার জন্য) 0.4 বা 0.8 হতে পারে? ভাল, প্রথম অনুসারে প্লট এটি বেশ সম্ভব। " আপনি যদি দ্বিতীয় চক্রান্তের জন্য একই করেন (যেমন 1000 উত্তরদাতাদের সাথে), আপনি পান যে বা খুব অসম্ভাব্য (আবার, আমি ধরে নিচ্ছি যে 1000 জনসংখ্যার আইআইডি নমুনা)।পি = 0.8p=0.4p=0.8

দয়া করে মনে রাখবেন যে এই প্লটগুলি ডেভিড 25272 এর মতো দেখতে হলেও তারা খুব আলাদা কিছু উপস্থাপন করে

তাঁর প্লটগুলি এই প্রশ্নটি জিজ্ঞাসা করে: "প্রদত্ত প্রদত্ত মূল্য ধরে নেওয়া , লোকেরা আপেলের চেয়ে কমলা পছন্দ করে বলে সাড়া দেওয়ার সম্ভাবনা কী ?"এন pno

আমার প্লটগুলি প্রশ্নের উত্তর দেয়: "ধরে নিলাম যে আমি লোককে যে তারা আপেলের চেয়ে কমলা পছন্দ করে, এর সম্ভাব্যতা বন্টন কি, আপেলের চেয়ে কমলা পছন্দ করে এমন লোকদের সম্ভাবনা?" পিnop


2

সংক্ষিপ্ত উত্তর:

মূলত এটি ১০ টির মধ্যে ছয়টির চেয়ে ১০০০ এর মধ্যে have০০ থাকা আরও দৃinc়প্রত্যয়ী কারণ সমান অগ্রাধিকার দিলে এলোমেলো সুযোগের ফলে ১০ এর মধ্যে 6 জনের সম্ভাবনা অনেক বেশি।

আসুন একটি অনুমান করা যাক - যে পরিমাণ কমলা এবং আপেল পছন্দ করে সেই অনুপাতটি আসলে সমান (সুতরাং, প্রতিটি 50%)। একে নাল অনুমান বলে। এই সমান সম্ভাবনাগুলি দেওয়া দুটি ফলাফলের সম্ভাবনা হ'ল:

  • 10 জনের একটি নমুনা দেওয়া , এলোমেলোভাবে কমলা পছন্দ করে এমন 6 বা ততোধিক লোকের নমুনা পাওয়ার 38% সম্ভাবনা রয়েছে (যা সমস্ত সম্ভাবনা কম নয়)।
  • ১০০০ জনের নমুনা সহ ১০০০ জনের মধ্যে 1000০০ বা তার বেশি সংখ্যক কমলার পছন্দ হওয়ার এক বিলিয়ন সম্ভাবনা রয়েছে।

(সরলতার জন্য আমি অসীম জনসংখ্যা ধরে নিচ্ছি যা থেকে সীমাহীন সংখ্যার নমুনা আঁকতে হবে)।


একটি সাধারণ ব্যয়

এই ফলাফলটি অর্জনের একটি উপায় হ'ল লোকেরা কীভাবে আমাদের নমুনায় একত্রিত করতে পারে সেই সম্ভাব্য উপায়গুলি তালিকাভুক্ত করা:

দশ জনের পক্ষে এটি সহজ:

আপেল বা কমলাগুলির জন্য সমান পছন্দ সহ অসীম জনসংখ্যার থেকে এলোমেলোভাবে 10 জনের নমুনা আঁকার বিষয়টি বিবেচনা করুন। সমান পছন্দগুলি সহ 10 জনের সমস্ত সম্ভাব্য সংমিশ্রনের তালিকাটি সহজভাবে করা সহজ:

এখানে সম্পূর্ণ তালিকা।

r   C (n=10)    p
10  1       0.09766%
9   10      0.97656%
8   45      4.39453%
7   120     11.71875%
6   210     20.50781%
5   252     24.60938%
4   210     20.50781%
3   120     11.71875%
2   45      4.39453%
1   10      0.97656%
0   1       0.09766%
    1024    100%

r হ'ল ফলাফলের সংখ্যা (কমলা পছন্দ করে এমন লোকেরা), সি কমলা বেশি পছন্দ করে এমন লোকের সম্ভাব্য উপায়গুলির সংখ্যা এবং সি আমাদের নমুনায় কমলা পছন্দ করে এমন অনেকেরই এর বিচ্ছিন্ন সম্ভাবনা রয়েছে।

(পি মোট সংমিশ্রণের দ্বারা কেবল সি বিভক্ত Note দ্রষ্টব্য যে মোট দুটি দুটি পছন্দকে সাজানোর 1024 উপায় রয়েছে (অর্থাত 10 এর শক্তিতে 2)।

  • উদাহরণস্বরূপ, কমলাগুলিকে পছন্দ করার জন্য 10 জনের জন্য কেবল একটি উপায় (একটি নমুনা) রয়েছে (r = 10) আপেল (r = 0) পছন্দ করে এমন সমস্ত লোকের ক্ষেত্রেও এটি একই।
  • 10 টি বিভিন্ন কম্বিনেশন রয়েছে যার মধ্যে নয়টি কমলা পছন্দ করে। (প্রতিটি নমুনায় আলাদা আলাদা ব্যক্তি আপেল পছন্দ করেন)।
  • 45 টি নমুনা (সংমিশ্রণ) রয়েছে যেখানে 2 জন আপেল ইত্যাদি পছন্দ করে etc.

(প্রায় সাধারণ আমরা আলাপ ইন এন সি আর ফলাফল সমন্বয় r একটি নমুনা থেকে এন মানুষ। অনলাইন ক্যালকুলেটর আপনি এই নম্বরগুলি যাচাই করার জন্য ব্যবহার করতে পারেন নেই।)

এই তালিকাটি আমাদের কেবলমাত্র বিভাগ ব্যবহার করে উপরের সম্ভাব্যতাগুলি সরবরাহ করতে দেয়। নমুনায় কমপক্ষে (সংমিশ্রনের 1024 এর মধ্যে 210) পছন্দ করে এমন 6 জন লোকের নমুনায় থাকার 21% সম্ভাবনা রয়েছে। আমাদের নমুনায় ছয় বা আরও বেশি লোক পাওয়ার সম্ভাবনা 38% (ছয় বা আরও বেশি লোকের সাথে সমস্ত নমুনার যোগফল বা 1024 টির মধ্যে 386)।

গ্রাফিক্যালি, সম্ভাব্যতাগুলি দেখতে এইরকম:

দ্বিপদী নমুনা আকার 10

বড় সংখ্যা সহ, সম্ভাব্য সংমিশ্রণের সংখ্যা দ্রুত বৃদ্ধি পায় grows

মাত্র 20 জনের একটি নমুনার জন্য 1,048,576 সম্ভাব্য নমুনা রয়েছে, সমস্ত সমান সম্ভাবনা সহ। (দ্রষ্টব্য: আমি কেবল নীচে প্রতিটি দ্বিতীয় সংমিশ্রণটি দেখিয়েছি)।

r    C (n=20)   p
20   1          0.00010%
18   190        0.01812%
16   4,845      0.46206%
14   38,760     3.69644%
12   125,970    12.01344%
10   184,756    17.61971%
8    125,970    12.01344%
6    38,760     3.69644%
4    4,845      0.46206%
2    190        0.01812%
0    1          0.00010%
     1,048,576  100%

এখনও একটি মাত্র নমুনা রয়েছে যেখানে সমস্ত 20 জন কমলা পছন্দ করে। মিশ্র ফলাফলগুলি সমন্বিত বৈশিষ্ট্যগুলির সংমিশ্রণগুলি আরও বেশি সম্ভাবনাযুক্ত, কেবলমাত্র কারণগুলি রয়েছে যে নমুনাগুলির লোকেরা একত্রিত হতে পারে ways

পক্ষপাতদুষ্ট নমুনাগুলি অনেক বেশি অসম্ভব, কেবলমাত্র কম লোকের সংমিশ্রণের কারণে এই নমুনাগুলির ফলাফল হতে পারে:

প্রতিটি নমুনায় মাত্র ২০ জন লোকের সাথে, আমাদের নমুনায় কমলা পছন্দ করে এমন sample০% বা তারও বেশি (12 বা ততোধিক) লোক থাকার সম্মিলিত সম্ভাবনা মাত্র 25% এ নেমে যায়।

সম্ভাব্যতা বিতরণ পাতলা এবং লম্বা হতে দেখা যেতে পারে:

দ্বিপদী নমুনা আকার 20

1000 জনের সাথে সংখ্যা বিশাল

আমরা উপরের উদাহরণগুলি বৃহত্তর নমুনায় প্রসারিত করতে পারি (তবে সংখ্যাগুলি খুব দ্রুত বেড়ে যায় এটির জন্য সমস্ত সংমিশ্রনের তালিকা তৈরি করা সম্ভব হয়), পরিবর্তে আমি আর এর সম্ভাব্যতাগুলি গণনা করেছি:

r   p (n=1000)
1000    9.332636e-302
900     5.958936e-162
800     6.175551e-86
700     5.065988e-38
600     4.633908e-11
500     0.02522502
400     4.633908e-11
300     5.065988e-38
200     6.175551e-86
100     5.958936e-162
0       9.332636e-302

১০০০ জনের মধ্যে or০০ বা তার বেশি সংখ্যক কমলার পছন্দের সম্ভাবনা হ'ল মাত্র ১.৩64৪৩২২ ই -10।

সম্ভাব্যতা বিতরণ এখন কেন্দ্রের আশেপাশে আরও অনেক বেশি কেন্দ্রীভূত:

[দ্বিপদী নমুনার আকার 1000 [3]

(উদাহরণস্বরূপ, আর ব্যবহারের মধ্যে কমলা পছন্দ করে এমন 1000 জনের মধ্যে ঠিক 600 জনের সম্ভাবনা গণনা করার জন্য dbinom(600, 1000, prob=0.5)যা 4.633908e-11 সমান, এবং 600 বা তার বেশি লোকের সম্ভাবনা 1-pbinom(599, 1000, prob=0.5), যা সমান 1.364232e-10 (এক বিলিয়নে 1 এরও কম))।


1

এটি কারণ উচ্চতর নম্বর বৃহত্তর নির্ভুলতা নিশ্চিত করে। প্রাক্তন হিসাবে, আপনি যদি গ্রহের যে কোনও জায়গা থেকে 1000 টি এলোমেলো মানুষকে বেছে নিয়েছেন এবং তাদের মধ্যে 599 জন 10 র্যান্ডম মানুষের বিপরীতে 6 পুরুষের সাথে পুরুষ হন তবে প্রাক্তনটি আরও সঠিক হবে। একইভাবে, আপনি যদি 7 বিলিয়ন জনসংখ্যা ধরে ধরে পুরুষদের সংখ্যা গণনা করেন তবে আপনি আরও একটি সুনির্দিষ্ট সংখ্যা পাবেন যা সম্ভবত 1000 জন লোকের চেয়ে বেশি বিশ্বাসযোগ্য হবে inc

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.