কন্টিনজেন্সি টেবিল: কখন কী পরীক্ষা করতে হবে?


17

আমি বয়স্ক চি চি-বর্গ বনাম ফিশারের যথাযথ পরীক্ষার বিতর্কের এই আলোচনার একটি বর্ধন দেখতে চাই , সুযোগটি কিছুটা প্রসারিত করব। কন্টিনজেন্সি টেবিলের সাথে ইন্টারঅ্যাকশনের জন্য অনেকগুলি পরীক্ষা রয়েছে, আমার মাথা স্পিন করার পক্ষে যথেষ্ট। আমার কোন পরীক্ষাটি কখন ব্যবহার করা উচিত এবং কখন এবং কেন অবশ্যই একটি পরীক্ষা অন্য পরীক্ষার চেয়ে বেশি পছন্দ করা উচিত সে সম্পর্কে একটি ব্যাখ্যা পেতে আমি প্রত্যাশা করছি।

আমার বর্তমান সমস্যাটি ক্লাসিক n×m কেস, তবে উচ্চ মাত্রিকতা সম্পর্কিত উত্তরগুলি স্বাগত, যেমন কমপক্ষে আর ক্ষেত্রে বিভিন্ন সমাধান বাস্তবায়নের জন্য টিপস রয়েছে, যেখানে এটি কীভাবে এগিয়ে যাওয়া যায় তা স্পষ্ট নয়।

নীচে আমি সমস্ত পরীক্ষাগুলি তালিকাভুক্ত করেছি যা আমি সচেতন; আমি আশা করি আমার ত্রুটিগুলি প্রকাশ করে সেগুলি সংশোধন করা যেতে পারে।

  • χ2 । পুরানো স্ট্যান্ডবাই। এখানে তিনটি প্রধান বিকল্প রয়েছে:

    • 2x2 টেবিলের জন্য আর-তে সংশোধন করা হয়েছে: "অর্ধেকটি সমস্ত |OE| পার্থক্য থেকে বিয়োগ করা হয় ।" আমি কি সবসময় এই কাজ করা উচিত?
    • " N1 " χ2 টেস্ট, আরে এটি কীভাবে করবেন তা নিশ্চিত নন।
    • মন্টে কার্লো সিমুলেশন। এটি কি সর্বদা সেরা? আমি যখন এটি করি তখন আর কেন আমাকে ডিএফ দেয় না?
  • ফিশারের সঠিক পরীক্ষা

    • Cellতিহ্যগতভাবে পরামর্শ দেওয়া হয় যে কোনও কোষ <4 হওয়ার সম্ভাবনা থাকে তবে দৃশ্যত কেউ কেউ এই পরামর্শ নিয়ে বিতর্ক করেন।
    • (সাধারণত মিথ্যা) অনুমান করা হয় যে প্রান্তিকরগুলি এই পরীক্ষার সবচেয়ে বড় সমস্যাটি স্থির হয়ে গেছে?
  • বার্নার্ডের সঠিক পরীক্ষা

    • আর একটি সঠিক পরীক্ষা, আমি এর আগে শুনিনি except
  • পয়সন রিগ্রেশন

    • একটি জিনিস যা সর্বদা আমাকে গ্ল্যামস সম্পর্কে বিভ্রান্ত করে তা হ'ল এই তাত্পর্য পরীক্ষা কীভাবে করা যায় তাই এতে প্রশংসা হবে। নেস্টেড মডেল তুলনা করা কি ভাল? একটি বিশেষ ভবিষ্যদ্বাণীকারী জন্য একটি ওয়াল্ড পরীক্ষা সম্পর্কে কি?
    • আমার কি সত্যই পয়সন রিগ্রেশন করা উচিত? এটি এবং একটি পরীক্ষার মধ্যে ব্যবহারিক পার্থক্য কী ?χ2

উত্তর:


13

এটি একটি ভাল প্রশ্ন, কিন্তু একটি বড়। আমি মনে করি না আমি একটি সম্পূর্ণ উত্তর সরবরাহ করতে পারি, তবে আমি কিছু খাবার চিন্তাভাবনার জন্য ফেলে দেব।

প্রথমত, আপনার শীর্ষ বুলেট পয়েন্টের নীচে, আপনি যে সংশোধনটির কথা উল্লেখ করছেন তা ধারাবাহিকতার জন্য ইয়েটসের সংশোধন হিসাবে পরিচিত । সমস্যাটি হ'ল আমরা একটি স্বতন্ত্র আনুপাতিক পরিসংখ্যান গণনা করি :
(এটি পৃথক) কারণ একটি সংঘাতের টেবিলে কেবলমাত্র সীমাবদ্ধ সংখ্যার উদাহরণ রয়েছে, এই পরিসংখ্যানটি গ্রহণ করতে পারে এমন সম্ভাব্য সংখ্যার সীমাবদ্ধ সংখ্যা রয়েছে)) তবুও এটিকে একটিধারাবাহিকরেফারেন্স বিতরণেরসাথে তুলনা করা হয়(যেমন,স্বাধীনতার ডিগ্রি সহχ2বিতরণ(r-1)(সি-1))। এটি অগত্যা কিছু স্তরের অমিলের দিকে পরিচালিত করে। একটি বিশেষ করে ছোট ডেটা সেট সহ, এবং যদি কিছু কোষ 5 টিরও কম মানের আশা করে থাকে তবে পি-মানটি খুব ছোট হতে পারে। ইয়েটসের সংশোধন এটির জন্য সামঞ্জস্য করে।

χ2=(OE)2E

χ2 (r1)(c1)

হাস্যকরভাবে, একই অন্তর্নিহিত সমস্যা (পৃথক-অবিচ্ছিন্ন অমিল) পি-মানগুলিকে বাড়িয়ে তুলতে পারে যা খুব বেশি । বিশেষত, পি-মানটি প্রচলিতভাবে ডেটা পাওয়ার সম্ভাবনা হিসাবে সংজ্ঞায়িত করা হয় যা চূড়ান্ত বা আরও বেশিপর্যবেক্ষণ করা তথ্য চেয়ে। অবিচ্ছিন্ন ডেটা সহ, এটি বোঝা যায় যে কোনও সঠিক মান পাওয়ার সম্ভাবনাটি অদৃশ্যভাবে ছোট, এবং এইভাবে আমাদের কাছে ডেটার সম্ভাবনা রয়েছে যা আরও চরম। তবে, পৃথক ডেটা সহ আপনার মত ডেটা পাওয়ার সীমাবদ্ধ সম্ভাবনা রয়েছে is কেবলমাত্র আপনার চেয়ে নামমাত্র পি-ভ্যালু পাওয়া যায় যা খুব কম (যে ধরণের প্রথম ধরণের ত্রুটি বাড়ে) এর চেয়ে বেশি ডেটা প্রাপ্তির সম্ভাবনা গণনা করে, তবে আপনার যেমন ডেটা পাওয়ার সম্ভাবনাও থাকে তেমন নামমাত্র পি-ভ্যালু বাড়ে যা খুব বেশি are (যা প্রকারের দ্বিতীয় ধরণের ত্রুটি বাড়িয়ে তুলবে)। এই তথ্যগুলি মধ্য পি-মান সম্পর্কে ধারণা দেয় অর্ধেকের। এই পদ্ধতির অধীনে, পি-মান হ'ল আপনার চেয়ে আরও চরম ডেটার সম্ভাবনা এবং আরও আপনার ডেটার সম্ভাব্যতা।

আপনি উল্লেখ হিসাবে, কন্টিজেন্সি টেবিল তথ্য পরীক্ষা করার জন্য অনেক সম্ভাবনা আছে। বিভিন্ন পদ্ধতির উপকারের পক্ষে সবচেয়ে বিস্তৃত চিকিত্সা এখানে । এই কাগজটি 2x2 টেবিলের সাথে সুনির্দিষ্ট, তবে আপনি এখনও आकस्मिकতা সারণীর ডেটা পড়ার মাধ্যমে বিকল্পগুলি সম্পর্কে অনেক কিছু জানতে পারেন।

আমি এটাও গুরুত্ব সহকারে মডেল বিবেচনা মূল্য মনে করি না। চি-স্কোয়ারের মতো পুরানো পরীক্ষাগুলি দ্রুত, সহজ এবং অনেকের দ্বারা বোঝা যায় তবে উপযুক্ত মডেল তৈরির ফলে আপনি যতটা আপনার ডেটা বোধগম্যতা বোধ করবেন না। যদি আপনার কন্টিনজেন্সি টেবিলের সারি [কলামগুলি] প্রতিক্রিয়াশীল ভেরিয়েবল হিসাবে এবং কলামগুলি [সারি] ব্যাখ্যাযোগ্য / ভবিষ্যদ্বাণীশীল ভেরিয়েবল হিসাবে ভাবা যুক্তিসঙ্গত হয় তবে একটি মডেলিংয়ের পদ্ধতিটি খুব সহজেই অনুসরণ করে। উদাহরণস্বরূপ, যদি আপনার কেবল দুটি সারি থাকে তবে আপনি একইভাবে ব্যবহার করতে পারেন একটি তৈরি করতে পারেন । আপনার সারিগুলিতে একটি অন্তর্নিহিত ক্রম হওয়া উচিত, লর্ডিক্যাল লজিস্টিক রিগ্রেশন লজিস্টিক রিগ্রেশন মডেল ; যদি বেশ কয়েকটি কলাম থাকে তবে আপনি একটি আনোভা-টাইপ মডেল তৈরি করতে রেফারেন্স সেল কোডিং (ডামি কোডিং) ব্যবহার করতে পারেন। অন্যদিকে, আপনার যদি দুটিরও বেশি সারি থাকে, তবে বহু বহুবিধ লজিস্টিক রিগ্রেশন বহুজাতিকের চেয়ে উচ্চতর কর্মক্ষমতা অর্জন করে। আমার মতে, লগ-লিনিয়ার মডেল (পয়সন রিগ্রেশন) সম্ভবত কম প্রাসঙ্গিক যদি আপনার কাছে দুটি মাত্রার বেশি মাত্রার কন্টিনজেন্সি টেবিল না থাকে।

এ জাতীয় বিষয়গুলির একটি ব্যাপক চিকিত্সার জন্য, সেরা উত্সগুলি হ'ল আগ্রেস্তির বই: তার পুরোপুরি চিকিত্সা (আরও কঠোর), তার অন্তর্গ্রন্থ (সহজ তবে এখনও ব্যাপক এবং খুব ভাল), অথবা সম্ভবত তাঁর মূল বইও

G2-test

G2=Oln(OE)


1
অন্তর্নিহিত সমস্যার একটি দুর্দান্ত ব্যাখ্যা ছিল, ধন্যবাদ! এছাড়াও আমাকে অতীতে বলা হয়েছিল যে আগ্রেস্তির পাঠ্যটি একটি দুর্দান্ত উত্স, তাই আমি এটি পরীক্ষা করে দেখব।
JVMcDonnell

4

আমি আমার দৃষ্টিকোণ থেকে আপনার প্রশ্নগুলির যথাসাধ্য চেষ্টা করার চেষ্টা করব। প্রথম ফিশার-ইরউইন টেস্ট হ'ল ফিশারের সঠিক পরীক্ষার আরেকটি নাম। এটি কখনও কখনও গণনামূলকভাবে তীব্র হয় তা বাদে আমি সাধারণত ফিশার পরীক্ষাটি ব্যবহার করতে পছন্দ করি। এই পরীক্ষার সাথে যদি কোনও সমস্যা হয় তবে তা প্রান্তিক মোটের উপর কন্ডিশনার। পরীক্ষার সৌন্দর্য হ'ল নাল অনুমানের অধীনে পর্যবেক্ষণ করা সারণীর একটি হাইপারজোমেট্রিক বিতরণ হওয়ার কারণে একই প্রান্তিক যোগফলগুলির সাথে কন্টিনজেন্সি টেবিলগুলির সেট। কিছু লোক যুক্তি দেখান যে তারা একই প্রান্তিক মোটের সাথে সারণিতে বিবেচনা সীমাবদ্ধ করার যৌক্তিকতা দেখছেন না।

পিয়ারসনের চি-স্কোয়ার টেস্টটি সাধারণভাবে কন্টিনজেন্সি টেবিলগুলিতে অ্যাসোসিয়েশনের জন্য পরীক্ষা করা হয়। অন্যান্য অনেক পরীক্ষার মতো এটিও আনুমানিক এবং তাই তাত্পর্য স্তর সর্বদা সঠিক হয় না। কোচরান দেখিয়েছিলেন যে ছোট নমুনাগুলিতে যখন কয়েকটি কোষ খুব কম থাকে (উদাহরণস্বরূপ কিছু কোষে 5 টিরও কম কেস থাকে) প্রায় অনুমানযোগ্য হবে।

আরও অনেক আনুমানিক পরীক্ষা আছে। সাধারণত এসএএস ব্যবহার করে ফিশারের পরীক্ষার আবেদন করার সময় আমি এই সমস্ত পরীক্ষার ফলাফল পাই এবং তারা সাধারণত প্রায় একই ফলাফল দেয়। তবে ফিশারের পরীক্ষা সর্বদা প্রান্তিক মোটের জন্য যথাযথ শর্তযুক্ত।

পইসন রিগ্রেশন সম্পর্কিত, এটি এমন একটি মডেল যা ঘরের মোটের সাথে শ্রেণিবদ্ধ পরিবর্তনগুলি সম্পর্কিত। যে কোনও মডেলের মতো এটি অনুমানের একটি সেট উপর নির্ভর করে। সর্বাধিক গুরুত্বপূর্ণটি হল যে সেল গণনাগুলি একটি পইসন বিতরণ অনুসরণ করে যার অর্থ যে গণনাগুলির গড় সংখ্যা তার প্রকরণের সমান। এটি সেল গণনা বিতরণের ক্ষেত্রে সাধারণত সত্য নয়। অতিরিক্ত বিতরণের ক্ষেত্রে (গড়ের চেয়ে বেশি পরিমাণে বৈকল্পিক) একটি নেতিবাচক দ্বিপদী মডেল আরও উপযুক্ত হতে পারে।


"ফিশার-ইরউইন টেস্ট হ'ল ফিশারের সঠিক পরীক্ষার আরেকটি নাম" ... আহা, এই মন্তব্যটি আমার কাছে কম বিভ্রান্তিকর করে তোলে , ধন্যবাদ!
JVMcDonnell

3
আপনার উত্তরটি কখন এই জিনিসগুলি করা উচিত তা সম্পর্কে আমার বিভ্রান্তিটি সত্যিই কমিয়ে দেয়। আমি অনুমান করি যেগুলির মধ্যে আমি যে বিষয়ে শোনার আশা করছিলাম সেগুলি হ'ল চি ^ 2 সহ সমস্যাগুলি কতদূর পর্যন্ত মন্টে কার্লো সিমুলেশন বা সংশোধন ইত্যাদির দ্বারা সমাধানযোগ্য; বা যে পরিমাণে এটি উজ্জ্বলতা দ্বারা দমন করা যায়। তাই আমি আরও কিছুটা কামড় পেতে পারি কিনা তা দেখার জন্য আমি কেবল এই উন্মুক্তটি ছেড়ে যাচ্ছি। তবে কেউ যদি কিছুক্ষণ পরে ওজন না করে তবে আমি আপনার উত্তরটি গ্রহণ করব।
JVMcDonnell

ফিশার এবং চি-স্কোয়ারের জন্য আমি মনে করি আমি আপনাকে বলেছিলাম যখন আপনি চি স্কোয়ার ব্যবহার করতে পারেন। আপনি যদি ফিশারের ধারণাটি স্বীকার করেন যে আপনার সর্বদা প্রান্তিক মোটের উপর শর্ত থাকা উচিত, ফিশারের পরীক্ষা সর্বদা প্রযোজ্য। তবে আপনি যদি তা গ্রহণ না করেন তবে আমার ধারণা, আপনাকে একটি শর্তহীন পরীক্ষা করতে হবে। অন্যান্য পরীক্ষার ব্যাটারি উপলব্ধ হিসাবে আমি তাদের সম্পত্তিগুলি সম্পর্কে কিছুই জানি না এবং তাই এগুলি কখন ব্যবহার করতে হবে সে বিষয়ে আপনাকে সত্যিই পরামর্শ দিতে পারি না। ফর্ম অভিজ্ঞতা আমি এমন ঘটনাগুলি দেখেছি যেখানে এটি মেলে কারণ ফলাফলটি সাধারণত ঘনিষ্ঠ চুক্তিতে থাকে।
মাইকেল আর চেরনিক

আসলেই কি সত্য যে ফিশার ভেবেছিলেন "আপনার সর্বদা প্রান্তিক মোটের উপর শর্ত থাকা উচিত"? প্রান্তিক যোগফলগুলি স্থির হয়ে গেলে এই অনুমানটি বৈধ হয়। চায়ের স্বাদ গ্রহণের চর্চায় মহিলাটি জানেন যে 5 টি দুধের প্রথম এবং 5 টি দুধের শেষ। তবে এটি পরীক্ষাগুলিতে আরও সাধারণ যে প্রান্তিকর বল প্রয়োগ করার মতো কোনও শক্তি নেই। দুটি মুদ্রা প্রতিটি 10 ​​বার উল্টানোর ক্ষেত্রে বিবেচনা করুন। যখন মুদ্রার চারপাশে 5 টি মাথা গড়িয়ে পড়ে তখন প্রান্তিকালগুলি সংরক্ষণের জন্য লেজ দেওয়া শুরু হয় না। এই ধরনের ক্ষেত্রে এটি নথিভুক্ত করা হয়েছে যে ফিশারগুলি অত্যন্ত রক্ষণশীল। এজন্য আমি বিকল্পগুলিতে আগ্রহী।
JVMcDonnell

হ্যাঁ. এটি আমার বোঝার বিষয় যে ফিশার রেফারেন্স বিতরণগুলি চয়ন করতে বিশ্বাস করেছিলেন যা প্রদত্ত ডেটা থেকে তথ্য ব্যবহার করে। সুতরাং তিনি ভাবেন যে আপনার পর্যবেক্ষণ করা ডেটা সম্পর্কে সামুদ্রিক মোটগুলি কীভাবে এসেছিল তা কেবলমাত্র সেই উপাত্তের সাথে তুলনা করা উচিত যা নূতন অনুমানের অধীনে ঘটেছিল যা উপাত্তের প্রান্তিক যোগফলগুলির উপর নির্ভর করে data ফিশারের অন্যান্য ধারণার মতো এটিও বিতর্কিত ছিল।
মাইকেল আর চেরনিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.