বিতরণ অনুমান পরীক্ষা - যদি আপনি আপনার নাল অনুমানটি "গ্রহণ" করতে না পারেন তবে এটি করার কী লাভ?


26

বিভিন্ন হাইপোথিসিস টেস্ট, যেমন জিওএফ পরীক্ষা, কোলমোগোরভ-স্মারনভ, অ্যান্ডারসন-ডার্লিং ইত্যাদি এই মূল ফর্ম্যাটটি অনুসরণ করে:χ2

H0 : ডেটা প্রদত্ত বিতরণ অনুসরণ করে।

H1 : ডেটা প্রদত্ত বিতরণটি অনুসরণ করে না।

সাধারণত, কেউ দাবিটি মূল্যায়িত করে যে কিছু প্রদত্ত ডেটা কিছু প্রদত্ত বিতরণ অনুসরণ করে এবং যদি কেউ প্রত্যাখ্যান করে তবে কিছু স্তরে প্রদত্ত বিতরণের জন্য ডেটাটি উপযুক্ত নয় ।H0α

কিন্তু যদি আমরা কে প্রত্যাখ্যান করি না তবে কী হবে ? আমাকে সর্বদা শিখিয়ে দেওয়া হয়েছে যে কেউ '' গ্রহণ করতে পারে না ' , তাই মূলত, আমরা কে প্রত্যাখ্যান করার প্রমাণ পাই না । এটি হ'ল কোনও প্রমাণ নেই যা আমরা প্রত্যাখ্যান করি যে ডেটা প্রদত্ত বিতরণটি অনুসরণ করে।H0H0H0

সুতরাং, আমার প্রশ্নটি হ'ল, যদি আমরা কোনও উপাত্ত একটি প্রদত্ত বিতরণ অনুসরণ করি বা না তা সিদ্ধান্ত নিতে না পারি তবে এই জাতীয় পরীক্ষা করার কী লাভ?


1
শুধুমাত্র উত্তর দেওয়ার জন্য এটি অত্যন্ত লোভনীয় যে "যদি কেউ নাল অনুমানটি গ্রহণ করতে না পারে তবে [সাধারণভাবে] পরীক্ষার কী দরকার?"। সব ক্ষেত্রেই স্ট্যাটিস্টিকাল টেস্টগুলি সিদ্ধান্ত নেওয়ার একমাত্র ভিত্তি নয়। বরং, আমরা সিদ্ধান্ত নেব এবং প্রকার I / II ত্রুটির ঝুঁকি / ব্যয় মাপতে ডেটা ব্যবহার করি। যদি আমরা কেবল দরকারী গ্রাফিক্স, কিউকিপ্লোটস এবং ভবিষ্যদ্বাণীমূলক পরিসংখ্যানগুলির সাথে ফিটের মান বা ডিগ্রির সংক্ষিপ্ত বিবরণ দিই, তবে "নালকে গ্রহণ করার" ঝুঁকি হিসাবে আমাদের যথাযথভাবে পরামর্শ দেওয়া হবে।
অ্যাডমো

@ অ্যাডামো আমি যখন তিন বছর আগে এটি জিজ্ঞাসা করেছি, আমি সবেমাত্র একটি স্নাতক গণিত (স্ট্যাটাস জোর) ডিগ্রি শেষ করেছি। এখন যেহেতু আমি এমএসের পরিসংখ্যান প্রোগ্রাম এবং কিছু পেশাদার কাজ করার পরেও অর্ধেক হয়েছি, আমি এখন এটি বুঝতে পারি। এটি সত্যিই দুর্ভাগ্য যে কীভাবে প্রচুর আন্ডারগ্রাড প্রোগ্রামে স্ট্যাটাস শেখানো হয়, তবে আমি ডিগ্রি করি।
ক্লারিনেটিস্ট

উত্তর:


37

বিস্তৃতভাবে বলতে (কেবল ফিট টেস্টিংয়ের ধার্মিকতায় নয়, তবে অন্যান্য অনেক পরিস্থিতিতে) আপনি কেবল সিদ্ধান্ত নিতে পারবেন না যে নালটি সত্য, কারণ এমন কোনও বিকল্প রয়েছে যা কোনও নির্দিষ্ট নমুনার আকারে নাল থেকে কার্যকরভাবে পৃথক হতে পারে।

এখানে দুটি বিতরণ, একটি স্ট্যান্ডার্ড নরমাল (সবুজ শক্ত লাইন) এবং অনুরূপ দেখতে একটি (90% স্ট্যান্ডার্ড নরমাল এবং 10% স্ট্যান্ডার্ডাইজড বিটা (২,২), একটি লাল ড্যাশযুক্ত রেখার সাথে চিহ্নিত):

এখানে চিত্র বর্ণনা লিখুন

লালটি স্বাভাবিক নয়। বললে , আমাদের পার্থক্যটি চিহ্নিত করার খুব কম সম্ভাবনা রয়েছে, তাই আমরা কোনও সাধারণ বিতরণ থেকে ডেটা আঁকানো জোর দিয়ে বলতে পারি না - যদি এটি পরিবর্তে লালটির মতো একটি সাধারণ-সাধারণ বিতরণ থেকে হয় তবে কী ঘটবে?n=100

সমান তবে বৃহত্তর পরামিতিগুলির সাথে মানক বিটাগুলির ছোট ভগ্নাংশগুলি সাধারণ থেকে পৃথক হিসাবে দেখতে আরও শক্ত হবে।

তবে প্রদত্ত যে সত্যিকারের ডেটা প্রায় কোনও সাধারণ বিতরণ থেকে পাওয়া যায় না , যদি আমাদের কাছে একটি নিখুঁত ওরাকল (বা কার্যকরভাবে অসীম নমুনার আকার) থাকে, তবে আমরা অবশ্যই সবসময় এই অনুমানটিকে প্রত্যাখ্যান করব যে ডেটা কিছু সাধারণ বিতরণ ফর্ম থেকে ছিল।

জর্জ বক্স যেমন বিখ্যাতভাবে বলেছেন , " সমস্ত মডেল ভুল, তবে কিছু কার্যকর। "

উদাহরণস্বরূপ, স্বাভাবিকতা পরীক্ষা করা বিবেচনা করুন। এমনও হতে পারে যে ডেটা আসলে একটি স্বাভাবিক কিছু ঘনিষ্ঠ থেকে আসা, কিন্তু তারা কি কখনো হতে হবে ঠিক স্বাভাবিক? তারা সম্ভবত কখনও হয় না।

পরিবর্তে, আপনি যে ফর্মটির পরীক্ষার সাথে সবচেয়ে ভাল আশা করতে পারেন তা হ'ল আপনি যে পরিস্থিতিটি বর্ণনা করেছেন। (দেখুন, উদাহরণস্বরূপ, পোস্টটি কি স্বাভাবিকতা পরীক্ষা করা মূলত অকেজো? তবে এখানে আরও বেশ কয়েকটি পোস্ট রয়েছে যা সম্পর্কিত পয়েন্টগুলি তৈরি করে)

এই কারনেই আমি ঘন ঘন লোকেরা যে প্রশ্ন তারা আসলে প্রতি আগ্রহ দেখিয়েছেন সুপারিশ অংশ (যা প্রায়ই কিছু নিকটতম হল 'বিতরণের আমার ডেটা ঘনিষ্ঠ যথেষ্ট যে আমি যে ভিত্তিতে উপযুক্ত মতামতে উপনীত হতে পারি?') সাধারণত ধার্মিকতা-ফিটনেস পরীক্ষার দ্বারা ভাল উত্তর দেওয়া হয় না। স্বাভাবিকতার ক্ষেত্রে, প্রায়শই তারা প্রয়োগ করতে চান এমন অনন্য পদ্ধতি (টি-টেস্ট, রিগ্রেশন ইত্যাদি) বড় নমুনাগুলিতে বেশ ভালভাবে কাজ করার প্রবণতা দেখা দেয় - প্রায়শই এমনকি এমনকি যখন মূল বিতরণ মোটামুটি পরিষ্কারভাবে অ-সাধারণ হয় - ঠিক তখনই যখন কোনও মঙ্গল ফিট পরীক্ষা স্বাভাবিকতা প্রত্যাখ্যান করতে খুব সম্ভবত হবে । এটির একটি প্রক্রিয়া খুব কম ব্যবহার করে যা আপনাকে সম্ভবত বলে দেয় যে আপনার ডেটা অ-স্বাভাবিক যখন কেবল প্রশ্নটি বিবেচনা করে না।F

উপরের চিত্রটি আবার বিবেচনা করুন। লাল বিতরণ অ-স্বাভাবিক, এবং সত্যই বড় আকারের নমুনা সহ আমরা এর থেকে প্রাপ্ত নমুনার উপর ভিত্তি করে স্বাভাবিকতার একটি পরীক্ষা প্রত্যাখ্যান করতে পারি ... তবে তার চেয়ে অনেক ছোট নমুনার আকার, রিগ্রেশন এবং দুটি নমুনা টি-পরীক্ষা (এবং আরও অনেক পরীক্ষায়) তদাতিরিক্ত) এত অসাধারণ আচরণ করবে যে এটিকে অস্বাভাবিকতা এমনকি কিছুটা হলেও ভাবতেও অর্থহীন।

μ=μ0

আপনি কিছু বিচ্যুতি নির্দিষ্ট ধরণের নির্দিষ্ট করতে এবং সমতুল্য পরীক্ষার মতো কিছু দেখতে সক্ষম হতে পারেন তবে এটি উপযুক্ততার ধার্মিকতার সাথে কৌশলযুক্ত কারণ বিতরণ করার জন্য অনেকগুলি উপায় রয়েছে তবে একটি অনুমানযুক্তের থেকে আলাদা এবং আলাদা there পার্থক্যের ফর্মগুলির বিশ্লেষণে বিভিন্ন প্রভাব থাকতে পারে। বিকল্পটি যদি একটি বিস্তৃত পরিবার হয় যা একটি বিশেষ কেস হিসাবে নালকে অন্তর্ভুক্ত করে, তবে সমতা পরীক্ষা আরও বেশি অর্থবোধ করে (উদাহরণস্বরূপ গামার বিরুদ্ধে পরীক্ষামূলক ঘনিষ্ঠভাবে পরীক্ষা করা) - এবং সত্যই, "দুটি একতরফা পরীক্ষা" পদ্ধতির মধ্য দিয়ে চলেছে এবং এটি সম্ভবত "পর্যাপ্ত কাছাকাছি" আনুষ্ঠানিক করার একটি উপায় হয়ে উঠুন (বা এটি যদি গামা মডেলটি সত্য হয় তবে বাস্তবে ফিট টেস্টের একটি সাধারণ ধার্মিকতা দ্বারা প্রত্যাখাত হওয়া কার্যত নিশ্চিত হবে,

ফিটের পরীক্ষার ধার্মিকতা (এবং প্রায়শই আরও বিস্তৃতভাবে হাইপোথিসিস টেস্টিং) কেবলমাত্র পরিস্থিতিগুলির সীমিত পরিসরের জন্য উপযুক্ত। লোকেরা সাধারণত যে প্রশ্নের উত্তর দিতে চায় তা এতটা নির্ভুল নয়, তবে উত্তর দেওয়া আরও কিছুটা অস্পষ্ট এবং কঠিন - তবে জন টুকি যেমন বলেছিলেন, " সঠিক প্রশ্নের সঠিক অনুমানের উত্তর, যা প্রায়শই অস্পষ্ট, তার সঠিক উত্তরটির চেয়ে আরও ভাল better ভুল প্রশ্ন, যা সর্বদা সুনির্দিষ্ট করা যায় ""

আরও অস্পষ্ট প্রশ্নের উত্তর দেওয়ার যুক্তিসঙ্গত পদ্ধতির মধ্যে আপনি যে অনুমানটি বিবেচনা করছেন তাতে কাঙ্ক্ষিত বিশ্লেষণের সংবেদনশীলতা যাচাই করার জন্য সিমুলেশন এবং পুনরায় মডেলিং তদন্ত অন্তর্ভুক্ত থাকতে পারে, অন্যান্য অবস্থার তুলনায় যা উপলব্ধ তথ্যগুলির সাথে যুক্তিসঙ্গতভাবে সামঞ্জস্যপূর্ণ।

ε


গ্লেন, এটি দুর্দান্ত উত্তর। "আরও অস্পষ্ট প্রশ্নের উত্তর দেওয়ার জন্য যুক্তিসঙ্গত পদ্ধতির" আরও কি সংস্থান রয়েছে? কাজকর্মের উদাহরণগুলি দেখে লোকেরা যে উত্তর দিচ্ছে তা দেখতে খুব ভাল লাগবে "আমার উদ্দেশ্যে ডেটা বিতরণ করার জন্য কি যথেষ্ট পরিমাণে আমার কাছাকাছি?" প্রেক্ষাপটে.
স্টম্পি জো পিট

2
@StumpyJoePete আছে আরো একটি অস্পষ্ট (কিন্তু কিছুটা ভিন্ন) প্রশ্নের উত্তর একটি উদাহরণ এখানে , যেখানে সিমুলেশন মোটামুটিভাবে কি নমুনা আকার সাজানোর যুক্তিযুক্ত হতে পারে এ বিচারক করতে ব্যবহৃত হয় স্কিউ (সূচকীয় বলো) সহ একটি t-test এর আবেদন করতে ডেটা। তারপরে একটি ফলোআপ প্রশ্নে ওপি নমুনা সম্পর্কে আরও তথ্য নিয়ে আসে (এটি বিযুক্ত ছিল, এবং এটি হিসাবে প্রমাণিত হয়েছে যে "ক্ষতিকারক" এর চেয়ে অনেক বেশি স্কিউ পরামর্শ দেবে), ... (সিটিডি)
গ্লেন_বি -রিনস্টেট মনিকা

2
(সিটিডি) ... আরও সিমুলেশন ব্যবহার করে আরও বিস্তারিতভাবে ইস্যুটি অনুসন্ধান করা হয়েছিল । অবশ্যই, বাস্তবে তাদের প্রাথমিক ব্যাখ্যা থেকে কারও অনুমানের পরিবর্তে এটি ব্যক্তির আসল প্রয়োজনের সাথে যথাযথভাবে তৈরি করা হয়েছে তা নিশ্চিত করার জন্য আরও 'পিছনে পিছনে' থাকা দরকার।
গ্লেন_বি -রিনস্টেট মনিকা

ধন্যবাদ! ঠিক সেই ধরণের জিনিসটি আমি খুঁজছিলাম।
স্টম্পি জো পিট

17

পি-তাদের চেয়ে কম মূল্যবোধগুলি। ধার্মিকতা-ফিট-মূল্যায়নের ক্ষেত্রেও প্রাক্কলন প্রায়শই একটি ভাল পদ্ধতির। একটি পরিমাপ হিসাবে কোলমোগোরভ-স্মারনভ দূরত্ব ব্যবহার করতে পারেন। কোনও ত্রুটি মার্জিন ছাড়াই এটি ব্যবহার করা সহজ। একটি রক্ষণশীল পন্থা মডেলিংয়ের গাইডেন্সের জন্য KS দূরত্বের উপরের আত্মবিশ্বাসের সীমাটি গ্রহণ করবে। এটি (যথাযথভাবে) অনেকগুলি অনিশ্চয়তার দিকে পরিচালিত করবে, যার ফলে এটি এই সিদ্ধান্তে পৌঁছতে পারে যে প্রথম স্থানে একটি শক্ত পদ্ধতি বেছে নেওয়া পছন্দ করা হয়। এটি মনে রেখে এবং মূল লক্ষ্যে ফিরে আসা, যখন কেউ 2 সম্ভাব্য প্যারামিট্রিক ফর্মের চেয়ে বেশি অনুভূতিক বিতরণকে তুলনা করে, চূড়ান্ত লাগানো বিতরণের প্রকৃত প্রকরণটি অনুভূতিমূলক संचयी বিতরণ ফাংশনের চেয়ে ভাল স্পষ্টতা নেই। সুতরাং বিতরণের নির্বাচন চালানোর জন্য যদি কোনও বিষয় তত্ত্ব না থাকে,


3
এটিকে কেন হ্রাস করা হয়েছিল তার কারণ আমি জানতে পারি না; এখানে কিছু দুর্দান্ত পয়েন্ট আছে। এই ব্যক্তি সাহায্য করবে যদি নীচে চলা ব্যক্তিটি তাদের সমস্যাটি বোঝার বিষয়টি ব্যাখ্যা করে। আমরা কিছু শিখতে চাই
গ্লেন_বি -রিনস্টেট মনিকা

9

2

আমি মনে করি একাডেমিক কাজ এবং ব্যবহারিক সিদ্ধান্ত গ্রহণের মধ্যে পার্থক্য বোঝানোর জন্য এটি একটি নিখুঁত উদাহরণ is একাডেমিক সেটিংসে (যেখানে আমি আছি), আপনি যতক্ষণ চাইছেন কোনওভাবেই তর্ক করতে পারেন যতক্ষণ না এটি অন্যদের দ্বারা যুক্তিসঙ্গত বলে মনে করা হয়। অতএব, অপরিহার্যভাবে আমরা একে অপরের সাথে অন্তহীন, কখনও কখনও বিজ্ঞপ্তি, অ্যারজি বার্গি নিয়ে শেষ করি। সেই অর্থে, এটি লোককে কাজ করার জন্য কিছু সরবরাহ করে।

তবে, আপনি যদি সত্যিই সিদ্ধান্ত নেওয়ার মতো অবস্থানে থাকেন তবে উত্তরটি হ্যাঁ বা না একটি নির্দিষ্ট। সিদ্ধান্ত নির্ধারণকারী হিসাবে আপনার খ্যাতি ক্ষতিগ্রস্থ করবে ec অবশ্যই, একটি বাছাই করা শুধুমাত্র পরিসংখ্যানই নয়, কখনও কখনও জুয়া এবং বিশ্বাসের লাফের একটি উপাদানও জড়িত। সংক্ষেপে, এই ধরণের অনুশীলন কিছুটা সিদ্ধান্ত নেওয়ার জন্য কার্যকর। তবে এই অনুমানের পরীক্ষায় আপনার সিদ্ধান্তের উপর নির্ভর করতে হবে কিনা তা সম্পূর্ণ ভিন্ন গল্প।


2
এটি সঠিক আইএমএইচও নয়। আমি যে সেরা বইটি পড়েছি তা ব্যাখ্যা করে যে কেন সিদ্ধান্তের প্রতিটি পর্যায়ে সর্বদা অনিশ্চয়তা যুক্ত করে কেউ কেন আরও ভাল সিদ্ধান্ত নেয় is সেটি হ'ল নেট সিলভারের সিগন্যাল এবং নয়েজ । উদাহরণস্বরূপ, বিজয়ী পোকার খেলোয়াড়রা হলেন যারা কখনও বিশ্বাস করেন না যে কোনও নির্দিষ্ট হাতের সম্ভাবনা 0 বা 1
ফ্র্যাঙ্ক হ্যারেল

1
@ ফ্র্যাঙ্কহারেল আমি ভাবছি যে আপনি কীভাবে কোনও রাস্তা তৈরি করতে হবে, কোনও অংশ কিনবেন কিনা তা যেমন প্রশ্নের উত্তর দেবেন। এটি হ্যাঁ বা কোনও প্রশ্ন নয়। এগুলি এমন ধরণের প্রশ্ন যা প্রকৃত সিদ্ধান্ত গ্রহণকারীদের উত্তর দেওয়া দরকার।
ল্যাটেক্সফ্যান 21

1
@ ফ্র্যাঙ্কহারেল অবশ্যই পরিসংখ্যান সিদ্ধান্ত নিতে সহায়তা করার ক্ষেত্রে ভূমিকা পালন করে। তবে দৃ rob়তার দৃষ্টিতে আমরা যা করছি তা হ'ল বাস্তবের সান্নিধ্য। গণিতের পক্ষে হিসাব করতে না পারার মতো অনেকগুলি বিষয় রয়েছে। এবং এই যেখানে অন্যান্য উপায় প্রবৃত্তির মতো খেলায় আসে।
ল্যাটেক্সফ্যান 21

1
P

1
@ ফ্র্যাঙ্কহারেল আপনার মন্তব্যের জন্য আপনাকে ধন্যবাদ। আমি মনে করি অগ্রহণযোগ্য সিদ্ধান্ত এবং অন্যথায় আপনার পার্থক্য একটি ভাল বিষয়। সংক্ষেপে, এটি সমস্যার সময় মাত্রা সম্পর্কে। অল্প সময়ের মধ্যেই, বেশিরভাগ সিদ্ধান্তগুলি অপরিবর্তনীয়। লোকেরা কল করার জন্য ঘটনাস্থলে রাখলে এটি ঘটেছিল। অন্যদিকে, আমরা যদি দীর্ঘমেয়াদী দৃষ্টিভঙ্গি সহ্য করতে পারি তবে আপনি ঠিক বলেছেন - এমন পরিস্থিতিতে এমন একটি সিস্টেম থাকা ভাল যা পরিস্থিতিতে পরিবর্তনের প্রতিক্রিয়া জানাতে পারে। তবুও, আর্থিক বা শারীরিকভাবে কিছু ক্ষতি অনিবার্য।
LaTeXFan

2

মুল বক্তব্যটি হ'ল বিশুদ্ধ পরিসংখ্যানের দিক থেকে আপনি গ্রহণ করতে পারবেন না , তবে বাস্তবে আপনি তা করেন। উদাহরণস্বরূপ, আপনি যদি মান-ঝুঁকি বা অনুরূপ ব্যবস্থা ব্যবহার করে কোনও পোর্টফোলিওর ঝুঁকি নিয়ে অনুমান করছেন , তবে পোর্টফোলিওর রিটার্ন বিতরণ বেশ গুরুত্বপূর্ণ। কারণ আপনার বিতরণের লেজ দ্বারা ঝুঁকিটি সংজ্ঞায়িত করা হয়েছে।

পাঠ্য বইয়ের ক্ষেত্রে সাধারণত বিতরণ উদাহরণের জন্য ব্যবহৃত হয়। তবে, যদি আপনার পোর্টফোলিওর রিটার্নগুলিতে ফ্যাট-লেজ থাকে (যা তারা প্রায়শই করেন) তবে সাধারণ বিতরণ আনুমানিক ঝুঁকি হ্রাস করবে। সুতরাং, রিটার্নগুলি পরীক্ষা করা এবং আপনি সাধারণ আনুমানিক ব্যবহার করতে যাচ্ছেন কিনা তা সিদ্ধান্ত নেওয়া গুরুত্বপূর্ণ। দ্রষ্টব্য, এর অর্থাত্ স্ট্যাটিস্টিকাল টেস্ট চালানোর অর্থ এই নয়, এটি কিউকিউ-প্লট বা অন্য উপায় হতে পারে। তবে আপনাকে রিটার্ন এবং আপনার রিটার্ন মডেলগুলির বিশ্লেষণের ভিত্তিতে কোনও সিদ্ধান্ত নিতে হবে, এবং হয় সাধারণ ব্যবহার করুন বা না করুন।

সুতরাং, সমস্ত ব্যবহারিক উদ্দেশ্যে প্রত্যাখ্যান না করার অর্থ কঠোর পরিসংখ্যানগত বিবেচনায় না থাকলেও গ্রহণ করা । আপনি স্বাভাবিকটি গ্রহণ করতে এবং এটি আপনার গণনাগুলিতে ব্যবহার করতে যাচ্ছেন, যা উচ্চতর পরিচালকে প্রতিদিন আপনার নিয়ন্ত্রকগণ, নিরীক্ষক ইত্যাদিকে দেখানো হবে etc. এক্ষেত্রে প্রত্যাখ্যান না করা প্রতিটি অর্থেই সুদূরপ্রসারী পরিণতি অর্জন করেছে, তাই এটি যেমন বা মূর্খ পরিসংখ্যানগত ফলাফলের চেয়ে আরও শক্তিশালী।


0

আদালতে কোনও আসামী কখনও নিরীহ নন। তারা হয় দোষী (নির্দোষের নাল কল্পনা প্রত্যাখ্যান করুন) বা দোষী নয় (নির্দোষতার অনুমানকে প্রত্যাখ্যান করবেন না)।

প্রমাণের অনুপস্থিতি অনুপস্থিতির প্রমাণ নয়।


-1

সুতরাং, আমার প্রশ্নটি হ'ল, যদি আমরা কোনও উপাত্ত একটি প্রদত্ত বিতরণ অনুসরণ করি বা না তা সিদ্ধান্ত নিতে না পারি তবে এই জাতীয় পরীক্ষা করার কী লাভ?

যদি আপনার সাথে তুলনা করার বিকল্প বিকল্প বিতরণ (বা বিতরণের সেট) থাকে তবে এটি একটি দরকারী সরঞ্জাম হতে পারে।

আমি বলব: আমার হাতে একটি পর্যবেক্ষণ রয়েছে যা আমি মনে করি সাধারণত বিতরণ করা যেতে পারে। (আমি এমনটি মনে করি কারণ আমি একই জাতীয় চরিত্রের পর্যবেক্ষণগুলি দেখেছি যা আমি সন্তুষ্টভাবে স্বাভাবিক বক্ররেখাকে অনুসরণ করেছিলাম)) আমি আরও মনে করি তারা সাধারণ বক্রতা অনুসরণ না করে তবে কিছু নিয়মিত অ-স্বাভাবিক বক্ররেখা অনুসরণ করতে পারে। (আমি মনে করি এটি এর কারণ হতে পারে কারণ আমি এই জাতীয় ডেটা দেখেছি যা সাধারণ বক্ররেখা অনুসরণ করে না তবে উদাহরণস্বরূপ, স্কিউ ইত্যাদি ছিল)) তারপর আমি নিম্নোক্ত রেখাগুলি নিয়ে তদন্ত করব: যদি পর্যবেক্ষণগুলি হয় একটি সাধারণ বিতরণ থেকে এসেছেন, আমি যেমন ঘটেছিলাম এমন চি-স্কোয়ারটি কত ঘন ঘন হত? উপসংহারটি হল, "বেশ কমই একশতে দু'বার"। তারপরে আমি তদন্ত করি, বিবৃত এবং গণনা করা হয়নি, তবে আমি বৈধ যুক্তি সমাপ্ত করার জন্য একেবারে প্রয়োজনীয় বিশ্বাস করি, নীচে: যদি বিতরণটি স্বাভাবিক হয় না, তবে এই অভিজ্ঞতাটি চি-বর্গের পার্থক্যের দ্বারা বিবেচিত, প্রায়শই ঘন ঘন ঘটে। (আমাকে যা করতে হবে তা কল্পনা করেই মনে হয় যে নরমাল বক্ররেখা বিতরণের পর্যবেক্ষণের স্কিউ চরিত্রটি রয়েছে)) সুতরাং আমি সেই নীতিতে সাধারণ অনুমানকে প্রত্যাখ্যান করি যে বিকল্প হিসাবে বিবেচিত হাইপোথেসিসগুলির মধ্যে যেটি অভিজ্ঞ ইভেন্টটি আরও বেশি হবে তা আমি গ্রহণ করি principle ঘন। আমি বলছি নাল হাইপোথিসিসের প্রত্যাখ্যান কেবলমাত্র কোনও বিকল্প গ্রহণ করার ইচ্ছুকের উপরই বৈধ (এই বিকল্পটি সমস্ত ক্ষেত্রে সুনির্দিষ্টভাবে সংজ্ঞায়িত করা হয়নি)। ) তাই আমি সেই নীতিতে সাধারণ অনুমানকে প্রত্যাখ্যান করি যে আমি গ্রহণ করি যে বিকল্পধারা বিবেচিত হাইপোথেসিসগুলির মধ্যে একটি যা অভিজ্ঞ ইভেন্টটি আরও ঘন ঘন ঘটত। আমি বলছি নাল হাইপোথিসিসের প্রত্যাখ্যান কেবলমাত্র কোনও বিকল্প গ্রহণ করার ইচ্ছুকের উপরই বৈধ (এই বিকল্পটি সমস্ত ক্ষেত্রে সুনির্দিষ্টভাবে সংজ্ঞায়িত করা হয়নি)। ) তাই আমি সেই নীতিতে সাধারণ অনুমানকে প্রত্যাখ্যান করি যে আমি গ্রহণ করি যে বিকল্পধারা বিবেচিত হাইপোথেসিসগুলির মধ্যে একটি যা অভিজ্ঞ ইভেন্টটি আরও ঘন ঘন ঘটত। আমি বলছি নাল হাইপোথিসিসের প্রত্যাখ্যান কেবলমাত্র কোনও বিকল্প গ্রহণ করার ইচ্ছুকের উপরই বৈধ (এই বিকল্পটি সমস্ত ক্ষেত্রে সুনির্দিষ্টভাবে সংজ্ঞায়িত করা হয়নি)।

এখন আমি যে যুক্তিটির রেখাটি বর্ণনা করেছি, তার তুলনায় আমি যতটা স্বাভাবিক হিসাবে বর্ণনা করেছি, তা ব্যাখ্যা করবে যে আমার সিদ্ধান্তটি কেন তৃতীয় ও চতুর্থ ক্ষেত্রে রুটিনের চেয়ে আলাদা।

তৃতীয় কেস সম্পর্কিত, আমি চ-বর্গ পরীক্ষার চেষ্টা করার পরে, আমি এই সিদ্ধান্তে পৌঁছেছি যে স্বাভাবিকতা থেকে কোনও পার্থক্য না করার অনুমানের উপর, এত বড় চি-স্কোয়ারের সাথে একটি বিতরণ খুব কমই ঘটে would এখন পর্যন্ত আমরা ঠিক একই অবস্থানে রয়েছি যেমনটি আমরা দ্বিতীয় ক্ষেত্রে এই সময়ে ছিলাম। তবে এখন আসল সরবরাহটি যদি নিয়মিত অ-স্বাভাবিক হয় তবে এই অভিজ্ঞতা হওয়ার সম্ভাবনাটি আমাকে পরীক্ষা করতে দিন। এই অভিজ্ঞতা আরও ঘন ঘন ঘটবে? তা বলার কোনও কারণ নেই। বিতরণটি পুরোপুরি প্রতিসাম্যযুক্ত, অর্থাত্ skewness শূন্য (বিভিন্ন দিকের প্রতিটি ক্ষেত্রে প্রায় 50 শতাংশ কেস ছিল), এবং বিভিন্ন শ্রেণীর প্রত্যাশিত ফ্রিকোয়েন্সি থেকে পার্থক্যগুলির একটি নিরীক্ষণ পরীক্ষায় দেখা যায় যে তারা sys- নয়- টেম্যাটিক, অর্থাৎ, প্লাস বিচ্যুতি এবং বিয়োগ বিচক্ষণতা এলোমেলো ক্রমে বিকল্প। এই জাতীয় বিতরণটি কোনওরকম দুর্ভাগ্যজনক অ-স্বাভাবিক বাঁক থেকে ঘন ঘন আশা করা যায় না। তাই সাধারণ বক্ররেখাকে প্রত্যাখ্যান করার জন্য আমাদের হাতে কোনও কারণ নেই।

আমার দৃষ্টিভঙ্গি হ'ল কোনও বিকল্পের উচ্চারণের ইচ্ছার বাদ দিয়ে নাল অনুমানের প্রত্যাখার কোনও বৈধ কারণ নেই is

চি-স্কোয়ার পরীক্ষার প্রয়োগে ব্যাখ্যার কিছু অসুবিধা হয়েছে। জোসেফ বার্কসন। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল। ভোল। 33, নং 203 (সেপ্টেম্বর, 1938), পিপি 526-536


1
বার্কসনের উক্তি / কাগজ আমার কাছে প্রাসঙ্গিক এবং যুক্তিসঙ্গত বলে মনে হয়। এটি জনপ্রিয় জ্ঞান যে যথেষ্ট পরিমাণে নমুনা আকারের সাথে কোনও অনুমিত বন্টন বাতিল করা হবে, এমনকি যদি পরিমাপের ত্রুটির কারণেও হয়। যদি আমরা দেখতে পাই যে ডেটাটি অনুমান করা কিছু বিতরণের অধীনে সম্ভাব্য নয়, তবে কী আরও ভাল পছন্দ হবে তা কী আমরা খুঁজে বের করার চেষ্টা করা উচিত নয়? এবং যদি আমরা এই অন্যান্য পছন্দগুলি ন্যায্য প্রমাণ করতে না পারি তবে আমাদের যদি প্রয়োজন হয় তবে সহজ বিতরণ সম্ভব? কেন এটিকে নিম্নমানের করা হয়েছিল কেউ ব্যাখ্যা করতে পারেন?
লাইভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.