"এই সমস্ত তথ্য পয়েন্ট একই বিতরণ থেকে আসে।" কিভাবে পরীক্ষা করবেন?


16

আমার মনে হচ্ছে আমি এখানে আগে এই বিষয়টি আলোচিত দেখেছি তবে আমি সুনির্দিষ্ট কিছু খুঁজে পাচ্ছি না। তারপরে আবার, আমি কী সন্ধান করব তাও নিশ্চিত নই।

আমার কাছে অর্ডার করা ডেটার একটি মাত্রিক সেট রয়েছে। আমি অনুমান করি যে সেটের সমস্ত পয়েন্ট একই বন্টন থেকে আঁকা।

আমি এই অনুমানটি কীভাবে পরীক্ষা করতে পারি? "এই ডেটা সেটে পর্যবেক্ষণগুলি দুটি পৃথক বিতরণ থেকে আঁকা" একটি সাধারণ বিকল্পের বিরুদ্ধে পরীক্ষা করা কি যুক্তিসঙ্গত?

আদর্শভাবে, আমি চিহ্নিত করতে চাই যে পয়েন্টগুলি "অন্যান্য" বিতরণ থেকে আসে। যেহেতু আমার ডেটা অর্ডার করা হয়েছে, কোনও উপায়ে ডেটা কাটা "বৈধ" কিনা তা পরীক্ষা করার পরে আমি কি কোনও কাটা পয়েন্ট চিহ্নিত করে পালাতে পারি?

সম্পাদনা করুন: গ্লেন_ব এর উত্তর অনুসারে, আমি কঠোরভাবে ইতিবাচক, সর্বজনীন বিতরণে আগ্রহী। আমি বিতরণ অনুমান করার এবং তারপর বিভিন্ন পরামিতিগুলির পরীক্ষার জন্য বিশেষ ক্ষেত্রে আগ্রহী ।


"একই বিতরণ" বলতে কী বোঝ? গামার পর্যবেক্ষণগুলি কি একই বিতরণ থেকে আসা হিসাবে বিবেচিত হয়, বা এটি ক্ষতিকারক বিতরণের যোগ হিসাবে বিবেচিত হয়?
মেট্রিয়েট

আপনার নিজের জিজ্ঞাসা করা +1 এটি একটি খুব ভাল প্রশ্ন।
user541686

@ মেটালিকিকা যতক্ষণ না প্রতিটি পর্যবেক্ষণটি তাত্পর্যপূর্ণ যোগফল হয়, আমি বলব যে তারা একই বিতরণ থেকে এসেছে
শেডলটাকার

@ মেহরদাদ আমার আন্ডারগ্রাড ডিগ্রি এবং মাস্টার্সে কয়েকটি বিবিধ ক্লাসের বাইরে আমার আনুষ্ঠানিক পরিসংখ্যান প্রশিক্ষণ নেই। আপনি যদি আমার উত্তরের ইতিহাসের দিকে তাকান তবে এটি স্পষ্ট যে আমি লিনিয়ার রিগ্রেশন সম্পর্কে অনেক কিছু জানি এবং অন্য কোনও কিছুর সম্পর্কেও অনেক কিছু না
শ্যাডটলকার

2
এই প্রশ্নের কাছে যাওয়ার একটি সম্ভাব্য উপায় হ'ল উদাহরণস্বরূপ কিছু শ্রেণীর বন্টনগুলির একটি সীমাবদ্ধ মিশ্রণ বিবেচনা করা এবং আপনার ডেটা ভালভাবে বর্ণনা করার জন্য আপনার 1 টিরও বেশি মিশ্রণ উপাদান প্রয়োজন কিনা তা দেখুন। তবে, প্রশ্নটি এমন একটি শ্রেণীর বিতরণ রয়েছে যা আপনার "নাল হাইপোথিসিস" কে একক মিশ্রণ উপাদান দ্বারা বর্ণনা করার জন্য যথেষ্ট নমনীয় (যেমন আপনি গামা বিতরণের একটি সীমাবদ্ধ মিশ্রণ ব্যবহার করেন তবে এগুলি স্কুডনেস বা লেজের ক্ষেত্রে নমনীয় নয়) আপনি কী করার চেষ্টা করছেন তার উপর নির্ভর করে আচরণ), যখন একটি বহু-উপাদান মিশ্রণ হিসাবে সম্ভাব্য বিকল্প রয়েছে।
Björn

উত্তর:


29

দুটি পরিস্থিতি কল্পনা করুন:

  1. ডেটা পয়েন্টগুলি সমস্ত একই বিতরণ থেকে আঁকা ছিল - এটি যা ইউনিফর্ম ছিল (১,,3636)

  2. দুটি জনসংখ্যার 50-50 মিশ্রণ থেকে ডেটা পয়েন্টগুলি আঁকা ছিল:

    ক। জনসংখ্যা এ, যা এর আকারযুক্ত:

এখানে চিত্র বর্ণনা লিখুন

খ। জনসংখ্যা বি, এর আকারযুক্ত:

এখানে চিত্র বর্ণনা লিখুন

... এরকম যে ২০১ of-তে দুজনের মিশ্রণটি দেখতে হুবহু দেখতে পাওয়া যায়।

কীভাবে তাদের আলাদা করে বলা যায়?

দুটি জনসংখ্যার জন্য আপনি যে আকার চয়ন করুন না কেন, সর্বদা একক জনসংখ্যার বন্টন হতে চলেছে যা একই আকারে থাকে। এই যুক্তিটি পরিষ্কারভাবে দেখায় যে সাধারণ ক্ষেত্রে আপনি কেবল এটি করতে পারবেন না। পার্থক্য করার কোনও সম্ভাব্য উপায় নেই।

যদি আপনি জনসংখ্যা সম্পর্কে তথ্য (অনুমান, কার্যকরভাবে) পরিচয় করিয়ে দেন তবে প্রায়শই এগিয়ে যাওয়ার উপায় থাকতে পারে, তবে সাধারণ ক্ষেত্রে মারা যায়।

* উদাহরণস্বরূপ আপনি যদি ধরে নেন যে জনসংখ্যা এককমনীয় এবং পর্যাপ্ত ভিন্ন উপায় রয়েছে তবে আপনি কোথাও যেতে পারবেন

[সেখানে উপরে বর্ণিত সমস্যার ধরণের একটি পৃথক সংস্করণ এড়াতে এই প্রশ্নের সাথে যুক্ত হওয়া বিধিনিষেধগুলি যথেষ্ট নয় - আমরা এখনও দুটি অবিমোচনীয় বিতরণের 50-50 মিশ্রণ হিসাবে ইতিবাচক অর্ধ-রেখার উপর একটি সর্বজনীন নাল লিখতে পারি ইতিবাচক অর্ধ-লাইনের উপর অবশ্যই যদি আপনার আরও নির্দিষ্ট নাল থাকে তবে এটি কোনও সমস্যার থেকে অনেক কম হয়ে যায়। বিকল্পভাবে এখনও কিছু শ্রেণীর বিকল্পের আরও সীমাবদ্ধ করা সম্ভব হবে যতক্ষণ না আমরা কিছু সংমিশ্রিত বিকল্পের বিরুদ্ধে পরীক্ষার অবস্থানে থাকি। অথবা নাল এবং বিকল্প উভয় ক্ষেত্রেই কিছু অতিরিক্ত বিধিনিষেধ প্রয়োগ করা যেতে পারে যা তাদের আলাদা করে তুলবে]]


1
ধন্যবাদ, দুর্দান্ত কাউন্টারিকাম। সুতরাং এটি সঠিকভাবে বিকল্প অনুমানকে সীমাবদ্ধ করতে নেমে আসে, সঠিক?
শ্যাডটলকার

@ এসএসডেকট্রোল হ্যাঁ, সংক্ষেপে; যদি (অনুমান দেওয়া হয়) বিকল্পটি শূন্য থেকে পৃথক করা যায়, আপনার তাত্পর্যপূর্ণ স্তরের চেয়ে পাওয়ারের সাথে পরীক্ষার কিছুটা আশা আপনার রয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

0

বিতরণের (গুলি) এবং পরীক্ষার জন্য রাষ্ট্র অনুমানের বিষয়ে কথা বলার জন্য আপনার অবশ্যই কিছু তত্ত্ব থাকতে হবে। এক বা একাধিক গ্রুপে বিষয়কে গোষ্ঠীযুক্ত এমন কিছু এবং এমন কিছু যা পরিমাপকে আলাদা করে দেয়।

তুমি সেখানে কিভাবে যেতে পার? আমি তিনটি বিকল্প দেখতে পাচ্ছি:

  • যদি আপনি ইতিমধ্যে আপনার বিষয় থেকে জেনে থাকেন তবে আপনার এটি কেবল পরিসংখ্যান অনুমানের ভাষায় অনুবাদ করা দরকার
  • চার্টগুলি প্লট করুন এবং পরীক্ষার অনুমান হিসাবে রূপগুলি সনাক্ত করুন
  • আপনি গাণিতিক পরীক্ষা করতে পারেন এমন ডিস্ট্রিবিউশনের একটি তালিকা নিয়ে আসুন। সম্ভাব্য প্রোগ্রামিং এখানে মূলশব্দ

অনুশীলনটি আপনাকে এই সিদ্ধান্তে আসতে দেয় যে আপনার নমুনায় বা কেবল একটিতে প্রতিনিধিত্ব করা এক বা একাধিক গ্রুপ রয়েছে। বা কোনও দলই নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.