একটি কঠিন পরিসংখ্যান ধারণার জন্য আপনার প্রিয় সাধারণ ব্যক্তির ব্যাখ্যা কী?


36

জটিল সমস্যাগুলির সহজ ব্যাখ্যা আমি সত্যিই উপভোগ করি। আপনার প্রিয় উপমা বা উপাখ্যান কী যা একটি কঠিন পরিসংখ্যানের ধারণাটি ব্যাখ্যা করে?

আমার প্রিয় মারের মদখোর এবং তার কুকুর ব্যবহার cointegration ব্যাখ্যা। মারে ব্যাখ্যা করেছেন যে দুটি র্যান্ডম প্রক্রিয়া (একটি ঘোরাফেরা মাতাল এবং তার কুকুর, অলিভার) এর ইউনিট শিকড় থাকতে পারে তবে তারা এখনও যুক্ত হতে পারে (সমন্বিত) যেহেতু তাদের যৌথ প্রথম পার্থক্য স্থির হয়।

মাতাল বার থেকে বেরিয়ে আসে, এলোমেলোভাবে হাঁটার ফ্যাশনে লক্ষ্যহীনভাবে ঘুরে বেড়াতে চলেছে। তবে পর্যায়ক্রমে তিনি "অলিভার, আপনি কোথায়?" লিখেছেন এবং অলিভার তার লক্ষ্যহীন ঘুরে বেড়াতে বাধা দেয়। সে তার কথা শুনে; সে তার কথা শুনে। তিনি ভাবেন, "ওহ, আমি তাকে খুব বেশি দূরে যেতে দিতে পারি না; সে আমাকে লক করে ফেলবে।" তিনি ভাবেন, "ওহ, আমি ওকে খুব বেশি দূরে যেতে দিতে পারি না; সে মধ্যরাতে আমাকে তার ঘেউ ঘেউ করে জাগিয়ে তুলবে।" প্রত্যেকটি মূল্যায়ন করে যে অপরটি কত দূরে রয়েছে এবং আংশিকভাবে সেই ফাঁকটি বন্ধ করতে চলেছে।

উত্তর:


18

একটি পি মান হ'ল নকল অনুমানের জন্য ডেটা কত বিব্রতকর তা পরিমাপ

নিকোলাস ম্যাক্সওয়েল, ডেটা ম্যাটারস: র্যান্ডম ওয়ার্ল্ড এমেরিভিলি সিএর জন্য ধারণামূলক পরিসংখ্যান: কী কলেজ প্রকাশনা, 2004।


15
  1. যদি আপনি কাঠের বাইরে আপনার বিতরণ (হিস্টোগ্রাম) খোদাই করে থাকেন এবং এটি আপনার আঙুলের উপর ভারসাম্য বজায় রাখার চেষ্টা করেন তবে ব্যালেন্স পয়েন্টটি গড় হবে, বিতরণের আকারটি বিবেচনা করেই।

  2. আপনি যদি আপনার ছড়িয়ে পড়া প্লটের মাঝখানে একটি লাঠি রাখেন এবং স্টিকটি প্রতিটি ডাটা পয়েন্টের সাথে একটি বসন্তের সাথে সংযুক্ত করেন তবে স্টিকের বিশ্রামের স্থানটি আপনার রিগ্রেশন রেখা হবে। [1]

[1] এটি প্রযুক্তিগতভাবে প্রধান উপাদানগুলির রিগ্রেশন হবে। আপনাকে স্প্রিংসকে কেবল "উল্লম্বভাবে" ন্যূনতম স্কোয়ারে স্থানান্তর করতে বাধ্য করতে হবে, তবে উদাহরণটি উভয় দিক দিয়েই উদাহরণস্বরূপ।


2
স্প্রিং ফোর্সটি বিকৃতিটির সাথে সমানুপাতিক, সুতরাং এটি কোনও ন্যূনতম স্কোয়ারের রিগ্রেশন নয়!
shabbychef

1
ভাল চেষ্টা! বসন্ত উপর নির্ভর করে। উদাহরণস্বরূপ, যদি বসন্তের ধ্রুবক 1 / সিগমা হয় তবে দুর্দান্ত কাজ করে;)
নীল ম্যাকগুইগান

2
না, না, মুল বক্তব্যটি হ'ল স্থির ভারসাম্যতে, বাহিনীর যোগফল শূন্য হবে; সমতুল্য বসন্তের ধ্রুবক ধরে নিলে, আপনি নিখুঁত বিচ্যুতির যোগফলকে কম হবেন, অর্থাৎ রিগ্রেশন, কমপক্ষে স্কোয়ারগুলি নয়। এটি এই সত্যটিকে উপেক্ষা করে যে স্প্রিংসকে অবাধে কাঠিটিতে ভাসতে হবে, তাই তারা স্থানান্তরিত করবে যাতে বিকৃতিটি পুরোপুরি y দিকের মধ্যে না পড়ে , যার ফলে কোনও প্রিন্সিপাল উপাদানগুলির মতো কিছু ফিট হয় তবে পরম ত্রুটিগুলি থাকে। এল1Y
shabbychef

@ শ্যাববিচেফ: বিকৃতির সাথে আনুপাতিক স্প্রিং ফোর্স মানে স্প্রিং এনার্জি হ'ল ডিফল্ট স্কোয়ারের সমানুপাতিক। স্প্রিং এনার্জি আসলেই ভারসাম্যহীনভাবে ক্ষুদ্রতর হয়। শূন্য হওয়ার বাহিনীর যোগফল বাহিনী বা হ্রাস করা হয় না। L 1 পরম মানগুলির যোগফলকে হ্রাস করে। এল1এল1
জানুয়ারী

12

আমি আগে এলোমেলো হাঁটার জন্য মাতালদের হাঁটা এবং মাতাল এবং তার কুকুরটিকে একত্রিত করার জন্য ব্যবহার করেছি; তারা খুব সহায়ক (আংশিক কারণ তারা মজাদার)

আমার প্রিয় সাধারণ উদাহরণগুলির মধ্যে একটি হল জন্মদিনের প্যারাডক্স ( উইকিপিডিয়া এন্ট্রি ), যা সম্ভাবনার কয়েকটি গুরুত্বপূর্ণ ধারণাটি চিত্রিত করে। আপনি লোকেদের পূর্ণ কক্ষের সাথে এটি অনুকরণ করতে পারেন।

ঘটনাক্রমে, আমি পরিসংখ্যান সংক্রান্ত ধারণাটি শেখানোর সৃজনশীল উপায়গুলির কয়েকটি উদাহরণের জন্য অ্যান্ড্রু গেলম্যানের "টিচিং স্ট্যাটিস্টিস্টিকস: একটি ব্যাগ অফ ট্রিকস" দৃ strongly়ভাবে প্রস্তাব দিচ্ছি ( বিষয়বস্তুর সারণী দেখুন )। পাঠদানের পরিসংখ্যান সম্পর্কে তিনি যে পাঠ্যক্রমটি শেখাচ্ছেন সে সম্পর্কে তার কাগজটিও দেখুন: "বিশ্ববিদ্যালয় পর্যায়ে শিক্ষকতার পরিসংখ্যান সম্পর্কিত একটি কোর্স" । আর উপর "শিক্ষণ রাষ্ট্রবিজ্ঞান, সমাজবিজ্ঞান, জনস্বাস্থ্য, শিক্ষা, অর্থনীতিতে স্নাতক ছাত্র থেকে বায়েসের, ..."

বয়েসিয়ান পদ্ধতিগুলি বর্ণনা করার জন্য, অন্যায় মুদ্রা ব্যবহার করে এবং একাধিকবার এটি উল্টানো বেশ সাধারণ / কার্যকর পদ্ধতি।


1
অন্যায্য মুদ্রার মতো জিনিস নেই: স্ট্যাটাকলম্বিয়া.ইডু
টিম

11

আমি একটি "ইন-ক্লাস" অনুশীলনের মাধ্যমে নমুনার প্রকরণ এবং মূলত কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রদর্শন করতে চাই। ক্লাসের 100 জন শিক্ষার্থী প্রত্যেকে একটি কাগজের টুকরোতে তাদের বয়স লেখেন। আমি গড় গণনা করার পরে কাগজের সমস্ত টুকরা একই আকারের এবং একই ফ্যাশনে ভাঁজ হয়। এই জনসংখ্যা এবং আমি গড় বয়স গণনা করি। তারপরে প্রতিটি শিক্ষার্থী এলোমেলোভাবে 10 টুকরো কাগজ নির্বাচন করে, বয়সগুলি লিখে তাদের ব্যাগে ফেরত দেয়। (এস) তিনি গড় গণনা করেন এবং ব্যাগটি পাশের শিক্ষার্থীর কাছে পাস করেন। শেষ পর্যন্ত আমাদের কাছে জনসংখ্যার অনুমানের জন্য 10 জন শিক্ষার্থীর 100 টি নমুনা রয়েছে যার অর্থ আমরা হিস্টোগ্রাম এবং কিছু বর্ণনামূলক পরিসংখ্যানের মাধ্যমে বর্ণনা করতে পারি।

আমরা এবার 100 টি মতামতের একটি সেট ব্যবহার করে এই প্রদর্শনীর পুনরাবৃত্তি করলাম যা সাম্প্রতিক জরিপগুলি থেকে কিছু হ্যাঁ / কোনও প্রশ্নের প্রতিরূপ তৈরি করেছে উদাহরণস্বরূপ (ব্রিটিশ জেনারেল) নির্বাচন যদি আগামীকাল বলা হয়, আপনি কি ব্রিটিশ ন্যাশনাল পার্টিকে ভোট দেওয়ার কথা বিবেচনা করবেন? শিক্ষার্থীরা তাদের এই মতামতের 10 নমুনা দেয়।

শেষে আমরা ধারাবাহিক এবং বাইনারি উভয় ডেটা সহ নমুনা প্রবর্তন, কেন্দ্রীয় সীমাবদ্ধ তত্ত্ব ইত্যাদি প্রমানিত করেছি।


10

অবশ্যই মন্টি হল সমস্যা। http://en.wikipedia.org/wiki/Monty_Hall_problem


1
যখন আমি প্রথম পড়ি এবং এটি সম্পর্কে চিন্তা করি তখন +1 এই সমস্যাটি আমার মস্তিষ্ককে মোচড় দিয়েছিল- এবং সমাধানটি বেশ সহজ তবে সম্ভাবনা সম্পর্কে অনেক কিছু শেখায়।
শার্পি

1
আমি মন্টি হলের সমস্যাটির সম্ভাবনা সম্পর্কে সাধারণ সাধারণ ব্যক্তির ব্যাখ্যা ব্যতীত অন্য কিছু হতে পারে। আমি এটি বুঝতে পারি, তবে আমার মাথাটি এটির চারপাশে মুড়ে ফেলার ক্ষেত্রে এখনও আমার অসুবিধা রয়েছে, এটি কোনও অ-পরিসংখ্যান ব্যক্তির কাছে এটি ব্যাখ্যা করার জন্য এটি যথেষ্ট ভালভাবে বুঝতে দিন এবং তাদের এটি থেকে কিছু শিখতে দিন ... যাইহোক, আপনি সমস্যাটি নির্দিষ্ট করেছেন কিনা তা নির্দিষ্ট করে দেবেন না আপনার কঠিন ধারণা বা আপনার সাধারণ ব্যক্তির ব্যাখ্যা । -1 আপনি না করা পর্যন্ত।
nnot101

2
মন্টি হল সমস্যাটি বোঝানোর সহজ উপায়টি একই সমস্যাটি কল্পনা করা তবে 1000 টি দরজা রয়েছে - তাদের মধ্যে 999 এর পিছনে একটি ছাগল রয়েছে এবং এর মধ্যে কেবল 1 টির পিছনে একটি গাড়ি রয়েছে। বলুন যে আপনি একটি দরজা বেছে নিয়েছেন এবং গেম শো হোস্ট 998 টি অন্যান্য দরজা খুলেছে এবং আপনাকে জিজ্ঞাসা করেছে যে আপনি যে সিদ্ধান্তের দরজাটি তিনি খোলেননি সেটিতেই আপনি পরিবর্তন করতে চান কিনা। জেনে তিনি পেছনে গাড়ির সঙ্গে দরজা খুলে না পারে, আপনি হবে আছে অন্যান্য দরজা স্যুইচ করতে (বা যে আপনি আপনার প্রাথমিক পছন্দমত মধ্যে সঠিক ছিল হাস্যকর আত্মবিশ্বাসী হতে)।
বার্ক ইউ

10

1) নির্দিষ্ট ইভেন্টগুলির সম্ভাবনা কাজ করার জন্য কীভাবে "এলোমেলো" সংজ্ঞা দেওয়া দরকার তার একটি ভাল প্রদর্শন:

বৃত্ত জুড়ে আঁকা এলোমেলো রেখা ব্যাসার্ধের চেয়ে দীর্ঘ হওয়ার কী সুযোগ রয়েছে?

আপনি সম্পূর্ণরূপে কীভাবে আপনার লাইনটি আঁকেন প্রশ্নটি সম্পূর্ণরূপে নির্ভর করে। আপনি ভূমিতে টানা চেনাশোনাটির জন্য বাস্তব-বিশ্ব পদ্ধতিতে যে সম্ভাবনাগুলি বর্ণনা করতে পারেন তার মধ্যে অন্তর্ভুক্ত থাকতে পারে:

বৃত্তের ভিতরে দুটি এলোমেলো পয়েন্ট আঁকুন এবং সেগুলির মধ্য দিয়ে একটি লাইন আঁকুন। (দেখুন যেখানে দুটি মাছি / পাথর পড়েছে ...)

পরিধি সম্পর্কে একটি নির্দিষ্ট পয়েন্ট চয়ন করুন, তারপরে বৃত্তের অন্য কোথাও এলোমেলো একটি বেছে নিন এবং সেগুলিতে যোগদান করুন। (বাস্তবে এটি একটি নির্দিষ্ট বিন্দুর মাধ্যমে একটি চলক কোণে বৃত্ত জুড়ে একটি কাঠি স্থাপন করছে এবং এলোমেলো একটি উদাহরণ যেখানে একটি পাথর পড়ে।)

ব্যাস আঁকুন। এলোমেলোভাবে এটির সাথে একটি পয়েন্ট চয়ন করুন এবং এটির মধ্য দিয়ে একটি লম্ব আঁকুন। (একটি লাঠি একটি সরলরেখায় রোল করুন যাতে এটি বৃত্ত জুড়ে স্থির থাকে))

যে কেউ কিছু জ্যামিতি করতে পারে এমন কাউকে দেখাতে অপেক্ষাকৃত সহজ (তবে প্রয়োজনীয়ভাবে পরিসংখ্যান নয়) প্রশ্নের উত্তর বেশ ব্যাপকভাবে পরিবর্তিত হতে পারে (প্রায় 2/3 থেকে প্রায় 0.866 বা আরও)।

(1210)

3) কেন চিকিত্সা নির্ণয় সত্যই ত্রুটিযুক্ত মনে হতে পারে তা ব্যাখ্যা করে। যারা রোগ রয়েছে তাদের সনাক্তকরণে 99.9% সঠিক যা রোগের জন্য একটি পরীক্ষা, কিন্তু .1% মিথ্যা-ইতিবাচকভাবে তাদের নির্ণয় করে যাদের সত্যিকারের এটি নেই তাদের পক্ষে রোগের প্রকোপটি সত্যই কম হলে সত্যিই এটি প্রায়শই ভুল বলে মনে হতে পারে ( যেমন 1000 এর মধ্যে 1) তবে অনেক রোগীর জন্য এটি পরীক্ষা করা হয়।

এটি এমনটি যা আসল সংখ্যার সাথে সর্বোত্তমভাবে ব্যাখ্যা করা হয়েছে - কল্পনা করুন 1 মিলিয়ন লোক পরীক্ষা করা হয়েছে, তাই 1000 রোগ রয়েছে, 999 সঠিকভাবে চিহ্নিত হয়েছে, তবে 999,000 এর মধ্যে 0.1% 999 যারা তাদের কাছে আছে বলে জানিয়েছে কিন্তু তা নেই। সুতরাং যাদের অর্ধেক বলা হয় তাদের কাছে এটি আসলে না, উচ্চ স্তরের নির্ভুলতা (99.9%) এবং নিম্ন স্তরের মিথ্যা ধনাত্মক (0.1%) থাকা সত্ত্বেও তারা তা করে না। একটি দ্বিতীয় (আদর্শভাবে পৃথক) পরীক্ষা এর পরে এই গোষ্ঠীগুলিকে পৃথক করে দেবে।

[ঘটনাচক্রে, আমি সংখ্যাগুলি বেছে নিয়েছিলাম কারণ এগুলি কাজ করা সহজ, অবশ্যই তাদের সঠিকতা / মিথ্যা পজিটিভ হারগুলি পরীক্ষার স্বতন্ত্র কারণ হওয়ায় তাদের 100% পর্যন্ত যোগ করতে হবে না]]


2
আমি মনে করি আপনার প্রথম উদাহরণ বার্ট্র্যান্ডের প্যারাডক্সকে বোঝায়। সম্ভাব্য স্থান নির্ধারণের বিভিন্ন উপায়ের খুব সুন্দর চিত্রণ!
chl

9

স্যাম সেভেজের বই ফ্লো অফ এভারেজ- এ পরিসংখ্যানগত ধারণাগুলির ভাল সাধারণ ব্যাখ্যা দিয়ে পূর্ণ। বিশেষত, জেনসেনের অসমতা সম্পর্কে তার ভাল ব্যাখ্যা রয়েছে has যদি কোনও বিনিয়োগের ক্ষেত্রে আপনার রিটার্নের গ্রাফটি উত্তল হয়, যেমন এটি "আপনাকে দেখে হাসে", তবে এলোমেলোতা আপনার পক্ষে রয়েছে: আপনার গড় ফেরত গড় হিসাবে আপনার রিটার্নের চেয়ে বেশি।



6

শিক্ষার পরিসংখ্যানের জন্য বেহার এট-এর 25 টি উপমা সংগ্রহ রয়েছে। এখানে দুটি উদাহরণ দেওয়া হল:

২.৯ সমস্ত মডেল তাত্ত্বিক: মহাবিশ্বে কোনও নিখুঁত ক্ষেত্র নেই এটি দেখা যায় যে মহাবিশ্বের সর্বাধিক সাধারণ জ্যামিতিক রূপটি গোলক is তবে মহাবিশ্বে কতগুলি গাণিতিক নিখুঁত গোলক রয়েছে? উত্তর কিছুই না। পৃথিবী, সূর্য বা বিলিয়ার্ড বল একটিও সঠিক ক্ষেত্র নয়। সুতরাং, যদি সত্যিকারের ক্ষেত্রগুলি না থাকে তবে কোনও গোলকের ক্ষেত্রফল বা আয়তন নির্ধারণের জন্য সূত্রগুলি কী ভাল? সুতরাং এটি সাধারণত পরিসংখ্যানের মডেলগুলির সাথে এবং বিশেষত একটি সাধারণ বন্টন সহ। যদিও সর্বাধিক সাধারণ উদাহরণগুলির মধ্যে একটি হ'ল উচ্চতা বন্টন, যদি গ্রহের প্রতিটি প্রাপ্তবয়স্ক ব্যক্তির উচ্চতা আমাদের হাতে রাখতে হয় তবে হিস্টোগ্রাম প্রো কোনও লেবু দ্বারা লিখিতভাবে স্ট্র্যাটিড না হলেও, গাউসিয়ান বেল বক্রের সাথে মিল রাখে না, জাতি বা অন্য কোনও বৈশিষ্ট্য।

২.২25 রেসিডুয়ালদের তথ্য থাকা উচিত নয়: একটি ট্র্যাশ ব্যাগের অবশিষ্টাংশগুলি ডেটা থেকে সমস্ত তথ্য অপসারণের পরে অবশিষ্ট থাকে। যেহেতু তাদের কোনও তথ্য বহন করা উচিত নয়, তাই আমরা এগুলিকে "আবর্জনা" হিসাবে বিবেচনা করি make এটি নিশ্চিত হওয়া প্রয়োজন যে আমরা কোনও ধরণের আবর্জনা ফেলে না ফেলে যার মূল্য (তথ্য) রয়েছে এবং নির্ভরশীল ভেরিয়েবলের আচরণের আরও ভালভাবে ব্যাখ্যা করার জন্য এটি ব্যবহার করা যেতে পারে।

অন্যান্য উদাহরণ অন্তর্ভুক্ত

  • "চিকিত্সাগুলির তুলনা করে নমুনা আকারের প্রভাব: ম্যাগনি Bin বাইনোকুলারস এর বিবরণ"
  • "জনসংখ্যার আকারের তুলনায় নমুনা আকার: স্যুপটি টেস্ট করার জন্য একটি চামচ"

তথ্যসূত্র

  • বিহার, আর।, গ্রিমা, পি।, এবং মার্কো-আলমাগ্রো, এল। (2012)। পরিসংখ্যান সংক্রান্ত ধারণাটি ব্যাখ্যা করার জন্য পঁচিশটি অ্যানালগি ies আমেরিকান পরিসংখ্যানবিদ, (কেবলমাত্র স্বীকৃত)

3

মজার প্রশ্ন।

কেউ জানতে পেরেছিলেন যে আমি বায়োস্টাটাস্টিকসে কাজ করি এবং তারা আমাকে জিজ্ঞাসা করেছিল (মূলত) "পরিসংখ্যান কি মিথ্যা বলার উপায় নয়?"

(যা মিথ্যা, জঘন্য মিথ্যা এবং পরিসংখ্যান সম্পর্কে মার্ক টোয়েনের উদ্ধৃতি ফিরিয়ে আনে brings)

আমি ব্যাখ্যা করার চেষ্টা করেছি যে পরিসংখ্যানগুলি আমাদের 100 শতাংশ নির্ভুলতার সাথে বলতে দেয় যে অনুমানগুলি দেওয়া হয়, এবং দেওয়া ডেটা যে এই ধরণের এবং এর সম্ভাবনাটি ঠিক তেমন এবং এই জাতীয় ছিল।

তিনি মুগ্ধ হননি।


1
"আমাদের 100% নির্ভুলতার সাথে বলতে আমাদের মঞ্জুরি দেয়, ঠিক আমাদের সংক্ষিপ্ততার অভাবটি কতটা বড়"
নট 101

যদি প্রত্যক্ষ খণ্ডন না হয় তবে @ জেরোমির উত্তরটি "100% নির্ভুলতা" ধারণাটি কেন বাতিল করতে হবে তা বোঝায়।
রোল্যান্ডো 2
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.