পরীক্ষার স্কোরগুলি কি সত্যিই একটি সাধারণ বিতরণ অনুসরণ করে?


14

আমি জিএলএমগুলিতে কোন বিতরণগুলি ব্যবহার করব তা শিখার চেষ্টা করেছি এবং সাধারণ বিতরণ কখন ব্যবহার করব তা নিয়ে আমি একটু বিস্মিত হয়েছি। আমার পাঠ্যপুস্তকের একটি অংশে এটি বলে যে পরীক্ষার স্কোর মডেলিংয়ের জন্য একটি সাধারণ বিতরণ ভাল হতে পারে। পরবর্তী অংশে, এটি জিজ্ঞাসা করে যে কোনও গাড়ি বীমার দাবি মডেল করার জন্য কোন বিতরণ উপযুক্ত হবে। এবার, এটি বলেছিল যে উপযুক্ত বিতরণগুলি গামা বা বিপরীতমুখী গুশিয়ান হবে কারণ তারা কেবলমাত্র ইতিবাচক মান সহ অবিচ্ছিন্ন're ঠিক আছে, আমি বিশ্বাস করি যে পরীক্ষার স্কোরগুলি কেবলমাত্র ইতিবাচক মানগুলির সাথেই অবিচ্ছিন্ন থাকবে, তবে আমরা কেন সেখানে সাধারণ বিতরণ ব্যবহার করব? সাধারণ বিতরণ নেতিবাচক মানের জন্য অনুমতি দেয় না?


1
আপনি স্কোর উপর সীমা সম্পর্কে উদ্বিগ্ন হন, তাহলে আপনি চেষ্টা করে দেখতে পারেন en.wikipedia.org/wiki/Truncated_normal_distribution
JG

6
বাস্তব বিশ্বে, অবশ্যই, পরীক্ষার স্কোর বিতরণগুলি প্রায়শই যাই হোক না কেন সাধারণ বিতরণের মতো কিছু দেখায় না। আমার গণিতের আন্ডারগ্র্যাডের উদাহরণ হিসাবে, আমি টপোলজি I ক্লাসটি অত্যন্ত দ্বিপদী "ডাম্বেল কার্ভ" গ্রেড বিতরণের জন্য কুখ্যাত বলে মনে করি : আপনি হয় মূল ধারণাগুলি বুঝতে পেরেছিলেন এবং প্রায় নিখুঁত স্কোর পেয়েছিলেন, বা আপনি ছিলেন না এবং ছিলেন মোটামুটি কোন পয়েন্ট পেতে ভাগ্যবান। খুব কম লোকই এই দুটি চূড়ান্ততার মাঝখানে যে কোনও জায়গায় স্কোর করে শেষ করেছিল।
ইলমারি করোনেন

2
নং পরবর্তী প্রশ্ন।
কার্ল উইথফট

উত্তর:


14

উদাহরণস্বরূপ উচ্চতা প্রায়শই সাধারণ হিসাবে মডেল করা হয়। হতে পারে পুরুষদের উচ্চতা 2 ইঞ্চির স্ট্যান্ডার্ড বিচ্যুতি সহ 5 ফুট 10 এর মতো কিছু। আমরা জানি নেতিবাচক উচ্চতা অপ্রচলিত, তবে এই মডেলের অধীনে নেতিবাচক উচ্চতা পর্যবেক্ষণের সম্ভাবনাটি মূলত শূন্য। আমরা যাইহোক মডেলটি ব্যবহার করি কারণ এটি যথেষ্ট পরিমাণে সমীকরণ।

সমস্ত মডেল ভুল। প্রশ্নটি হ'ল "এই মডেলটি এখনও কার্যকর হতে পারে", এবং উদাহরণস্বরূপ যেখানে আমরা উচ্চতা এবং পরীক্ষার স্কোরগুলির মতো জিনিসগুলিকে মডেলিং করছি, ঘটনাটিকে সাধারণ হিসাবে মডেলিং করা প্রযুক্তিগতভাবে আনফিজিক্যাল জিনিসকে মঞ্জুরি দেওয়ার পরেও দরকারী।


এই বিশেষ ক্ষেত্রে, এটি সাধারণ বিতরণ এমনকি দরকারী প্রায় কিনা তা প্রশ্নবিদ্ধ । প্রায় প্রতিটি গ্রেড ডিস্ট্রিবিউশনটি আমি কিছুটা ডিগ্রিতে মন্তব্যগুলিতে উল্লিখিত বিমোডাল বক্ররেখার সাথে সাদৃশ্যপূর্ণ। (যদিও চূড়ান্ত প্রান্তের পরিবর্তে সাধারণত 0.6 এবং 0.9 এর মোডের সাথে থাকে) তবে, বিভিন্ন উপায়ে দুটি স্বাভাবিক বিতরণের একটি রৈখিক সংমিশ্রণটি কোনও খারাপ অনুমান হিসাবে চলবে না।
রায়

আমি বিতর্ক করছিলাম না যে স্বাভাবিকটিই সর্বাধিক সন্নিকট। আমার মন্তব্যের পুরো পয়েন্টটি সত্যই সেই শেষ অনুচ্ছেদে তৈরি হয়েছে। কমপক্ষে বিমূর্ততার এই স্তরে প্রকৃত গ্রেড বিতরণগুলির দ্বি দ্বিচতা সম্পর্কে মন্তব্যগুলি সত্যিই সহায়ক নয়।
দেমেট্রি পানানোস

আপনি আপনার উত্তরে যা বলেছিলেন তার সাথে আমি একমত, তবে প্রশ্নের একটি অংশ যা সাধারণ বিতরণ বিশেষভাবে মডেলিং গ্রেড বিতরণের ক্ষেত্রে প্রযোজ্য কিনা তা উদ্বেগের বিষয়। এবং তার উত্তরটি সাধারণত "না"। সমস্ত মডেলগুলি ভুল এবং কিছু মডেল দরকারী তবে কিছুটি অন্যের চেয়ে বেশি ভুল এবং কম দরকারী। এই সমস্যাটির জন্য বিশেষত সাধারণ বিতরণ বিশেষত খারাপ ফিট হিসাবে গুরুত্বপূর্ণ এবং এর উত্তর হিসাবে মনে হয় যে স্বাভাবিকটি কেবল ভুল কারণ লেজগুলি নেতিবাচক এবং অসীম হয়ে যায়, যখন আসলে অনেক গভীর সমস্যা থাকে।
রায়

আপনি এখানে একটু পেডেন্টিক হন। ওপির সমস্যাটি ছিল স্বাভাবিকটি নেতিবাচক স্কোরের জন্য অনুমতি দেয়। বিমোডালিটি বিষয়টি ছিল না। আপনি এই প্রশ্নের সম্মানের সাথে গাছের জন্য বন দেখছেন না। মডেলিংয়ের বিশদগুলি এখনই প্রাসঙ্গিক নয়।
দেমেট্রি পানানোস

10

সাধারণ বিতরণ নেতিবাচক মানের জন্য অনুমতি দেয় না?

সঠিক। এটিরও কোন upperর্ধ্বসীমা নেই।

আমার পাঠ্যপুস্তকের একটি অংশে এটি বলে যে পরীক্ষার স্কোর মডেলিংয়ের জন্য একটি সাধারণ বিতরণ ভাল হতে পারে।

পূর্ববর্তী বিবৃতি সত্ত্বেও তবুও কখনও কখনও এটি হয়। পরীক্ষার যদি আপনার অনেকগুলি উপাদান থাকে তবে খুব দৃ strongly়ভাবে সম্পর্কিত নয় (যেমন আপনি মূলত একই প্রশ্নটি কয়েকবার বার নন, বা প্রতিটি অংশের আগের অংশটির সঠিক উত্তরের প্রয়োজন নেই), এবং খুব সহজ বা খুব কঠিন নয় ( যাতে বেশিরভাগ চিহ্ন মাঝখানে কাছাকাছি কোথাও থাকে), তারপরে চিহ্নগুলি প্রায়শই একটি সাধারণ বিতরণ দ্বারা যুক্তিসঙ্গতভাবে ভাল কাছাকাছি হতে পারে; প্রায়শই যথেষ্ট যথেষ্ট যে আদর্শ বিশ্লেষণগুলির দ্বারা সামান্য উদ্বেগ হওয়া উচিত।

আমরা নিশ্চিতভাবে জানি যে এগুলি স্বাভাবিক নয় , তবে এটি স্বয়ংক্রিয়ভাবে কোনও সমস্যা নয় - যতক্ষণ আমরা ব্যবহার করি পদ্ধতিগুলির আচরণ যতক্ষণ না আমাদের উদ্দেশ্যে করা উচিত তার যথেষ্ট পরিমাণে (উদাহরণস্বরূপ স্ট্যান্ডার্ড ত্রুটি, আত্মবিশ্বাসের ব্যবধান, তাত্পর্য স্তর) এবং শক্তি - যার জন্য প্রয়োজন - আমরা যা আশা করি তার কাছাকাছি করুন)

পরবর্তী অংশে, এটি জিজ্ঞাসা করে যে কোনও গাড়ি বীমার দাবি মডেল করার জন্য কোন বিতরণ উপযুক্ত হবে। এবার, এটি বলেছিল যে উপযুক্ত বিতরণগুলি গামা বা বিপরীতমুখী গুশিয়ান হবে কারণ তারা কেবলমাত্র ইতিবাচক মান সহ অবিচ্ছিন্ন're

হ্যাঁ, তবে এর চেয়েও বেশি - এগুলি বৃহত্তর ডান স্কু হওয়ার প্রবণতা এবং গড় বড় হওয়ার সাথে সাথে পরিবর্তনশীলতা বাড়তে থাকে।

যানবাহনের দাবির জন্য দাবি-আকার বিতরণের উদাহরণ এখানে রয়েছে:

https://ars.els-cdn.com/content/image/1-s2.0-S0167668715303358-gr5.jpg

(গ্যারিডো, জেনেষ্ট এবং শুলজ থেকে চিত্র 5) "বীমা দাবির উপর নির্ভরশীল ফ্রিকোয়েন্সি এবং তীব্রতার জন্য সাধারণ রৈখিক মডেল", বীমা: গণিত ও অর্থনীতি, খণ্ড 70, সেপ্টেম্বর, পি 205-215। Https : //www.sज्ञानdirect । com / বিজ্ঞান / নিবন্ধ / পাই / এস0167668715303358 )

এটি একটি সাধারণ ডান-স্কিউ এবং ভারী ডান লেজ দেখায়। তবে আমাদের অবশ্যই খুব সাবধানতা অবলম্বন করা উচিত কারণ এটি প্রান্তিক বিতরণ, এবং আমরা শর্তসাপেক্ষ বিতরণের জন্য একটি মডেল লিখছি , যা সাধারণত খুব কম স্ক্রু হবে (প্রান্তিক বিতরণ আমরা লক্ষ্য করি যদি আমরা কেবল দাবির আকারের একটি হিস্টগ্রাম মিশ্রণ করি তবে এই শর্তযুক্ত বিতরণ)। তবুও এটি সাধারণত ক্ষেত্রে হয় যে আমরা যদি ভবিষ্যদ্বাণীকারীদের সাবগ্রুপগুলিতে (সম্ভবত ধারাবাহিক পরিবর্তনগুলি শ্রেণীবদ্ধ করে) দাবির আকারের দিকে তাকাই তবে বিতরণটি এখনও দৃ strongly়রূপে ডান স্কিউ এবং ডানদিকে বেশ ভারী লেজযুক্ত রয়েছে বলে বোঝায় যে গামা মডেল * এর মতো কিছু is গাউসির মডেলটির চেয়ে অনেক বেশি উপযুক্ত হতে পারে।

* এমন আরও কয়েকটি সংখ্যক বিতরণ থাকতে পারে যা কোনও গাউসির চেয়ে উপযুক্ত হবে - বিপরীত গাউসিয়ান অন্য পছন্দ - যদিও কম সাধারণ; লগনরমাল বা ওয়েইবুল মডেলগুলি, জিএলএমগুলি যেমন দাঁড়াচ্ছে না, সেগুলিও বেশ কার্যকর।

[এটি বিরল ক্ষেত্রেই দেখা যায় যে এগুলির কোনও বিতরণ নিকট-নিখুঁত বর্ণনার সাথে সম্পর্কিত; এগুলি নিখুঁত অনুমান, তবে অনেক ক্ষেত্রে যথেষ্ট ভাল যে বিশ্লেষণটি কার্যকর এবং পছন্দসই বৈশিষ্ট্যের নিকটে রয়েছে]]

ঠিক আছে, আমি বিশ্বাস করি যে পরীক্ষার স্কোরগুলি কেবলমাত্র ইতিবাচক মানগুলির সাথেই অবিচ্ছিন্ন থাকবে, তবে আমরা কেন সেখানে সাধারণ বিতরণ ব্যবহার করব?

কারণ (শর্তগুলির মধ্যে আমি আগে উল্লেখ করেছি - প্রচুর উপাদান, খুব বেশি নির্ভরশীল নয়, কঠিন বা সহজ নয়) বিতরণ মোটামুটি প্রতিসম, ইউনিমোডাল এবং ভারী-লেজযুক্ত না হয়ে মোটামুটি কাছাকাছি থাকে।


0

দ্বিগুণ বিতরণের মাধ্যমে পরীক্ষার স্কোরগুলি আরও ভাল মডেল করা যেতে পারে। অত্যন্ত সরলকরণের ক্ষেত্রে, আপনার প্রতিটি 1 পয়েন্টের মূল্য 100 সত্য / মিথ্যা প্রশ্ন থাকতে পারে, সুতরাং স্কোর 0 এবং 100 এর মধ্যে একটি পূর্ণসংখ্যা হবে you যদি আপনি পরীক্ষার থেকে সমস্যা থেকে সমস্যাটির যথার্থতার মধ্যে কোনও সম্পর্ক না নেন (সন্দেহজনক ধারণা) ), স্কোরটি স্বাধীন র্যান্ডম ভেরিয়েবলের যোগফল এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি প্রয়োগ হয়। প্রশ্নের সংখ্যা বাড়ার সাথে সাথে সঠিক সমস্যার ভগ্নাংশ একটি সাধারণ বিতরণে রূপান্তরিত করে।

আপনি 0 এর চেয়ে কম মান সম্পর্কে একটি ভাল প্রশ্ন জিজ্ঞাসা করতে পারেন 100% এর চেয়ে বেশি মানের সম্পর্কেও আপনি একই প্রশ্ন করতে পারেন। পরীক্ষার প্রশ্নের সংখ্যা বাড়ার সাথে সাথে যোগফলের প্রকরণটি হ্রাস পায়, তাই শীর্ষটি গড়ের দিকে টানা যায়। একইভাবে, সেরা ফিটের সাধারণ বিতরণে আরও ছোট পার্থক্য থাকবে এবং [0, 1] ব্যবধানের বাইরে পিডিএফের ওজন 0 এর দিকে ঝুঁকবে, যদিও এটি সর্বদা ননজারো হবে will "ভগ্নাংশ সঠিক" এর সম্ভাব্য মানগুলির মধ্যে স্থানও হ্রাস পাবে (100 প্রশ্নের জন্য 1/100, 1000 প্রশ্নের জন্য 1/1000, ইত্যাদি), তাই অনানুষ্ঠানিকভাবে, পিডিএফ আরও একটানা পিডিএফের মতো আচরণ শুরু করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.