পরিসংখ্যানবিদরা কেন পারস্পরিক তথ্য মেলামেশা হিসাবে ব্যবহার করেন না?


10

অ-পরিসংখ্যানবিদদের দ্বারা আমি একটি দম্পতি আলোচনা দেখেছি যেখানে তারা মনে হয় রিগ্রেশন (বা সমতুল্য / ঘনিষ্ঠ-সম্পর্কিত পরিসংখ্যানগত পরীক্ষা) এর পরিবর্তে পারস্পরিক তথ্য ব্যবহার করে পারস্পরিক সম্পর্ককে পুনরায় উদ্ভাবন করে।

আমি এটি গ্রহণ করার একটা উপযুক্ত কারণ আছে যে পরিসংখ্যানবিদরা এই পদ্ধতিটি গ্রহণ করবেন না। আমার সাধারণ লোকের বোঝা হ'ল এন্ট্রপি / পারস্পরিক তথ্যের অনুমানকারীরা সমস্যাযুক্ত এবং অস্থির হয়ে থাকে। আমি ধরে নিয়েছি যে পাওয়ারটিও সমস্যা হিসাবে রয়েছে ফলে: তারা প্যারামেট্রিক টেস্টিং ফ্রেমওয়ার্ক ব্যবহার করছে না এমন দাবি করে এটিকে ঘিরে চেষ্টা করে। সাধারণত এই ধরণের কাজ পাওয়ার গণনা, এমনকি আত্মবিশ্বাস / বিশ্বাসযোগ্য অন্তর নিয়েও বিরক্ত করে না।

তবে শয়তানের উকিলের অবস্থান নিতে, যখন ডেটাসেটগুলি চূড়ান্ত হয় তখন কি ধীরে ধীরে কনভার্জেশন হয়? এছাড়াও, কখনও কখনও এই পদ্ধতিগুলি এই অর্থে "কাজ" বলে মনে হয় যে সমিতিগুলি ফলো-আপ স্টাডি দ্বারা বৈধতাপ্রাপ্ত। সহযোগিতার পরিমাপ হিসাবে পারস্পরিক তথ্য ব্যবহারের বিরুদ্ধে সর্বোত্তম সমালোচনা কোনটি এবং এটি পরিসংখ্যান চর্চায় কেন ব্যাপকভাবে ব্যবহৃত হয় না?

সম্পাদনা: এছাড়াও, কোনও ভাল কাগজপত্র রয়েছে যা এই বিষয়গুলি কভার করে?


3
এমআই দুটি পৃথক ভেরিয়েবলের মধ্যে সংযোগের একটি পরিমাপ। সাধারণ পরিসংখ্যানগুলিতে এটি সত্যিই সাধারণ কিছু নয় (কিছু বিশেষায়িত উপক্ষেত্রে হতে পারে)। তবে সেই সেটিংয়ের মধ্যেই আমি এটি প্রায়শই যথেষ্ট ব্যবহার করতে দেখি। অবশ্যই, যখন আমি বাইভারিয়েট পৃথক ডেটাসেটের সাথে পিয়ারসন পারস্পরিক সম্পর্ক ব্যবহার করে লোকদের মুখোমুখি হই তখন আমি তাদের কাছে এমআই নির্দেশ করি।
ব্যবহারকারী 60

1
এছাড়াও দেখুন stats.stackexchange.com/questions/1052/… তবে, এখানে আলোচনাটি ইতিমধ্যে আমার দৃষ্টিতে, ভাল বা আরও ভাল, তাই সদৃশ সম্পর্কে সাধারণ প্রশ্নটি মূল বিষয়।
নিক কক্স

এছাড়াও রেফারেন্সের জন্য দেখুন stats.stackexchange.com/q/20011/1036
অ্যান্ডি ডাব্লু

2
আরও একটি সাধারণ রেফারেন্স হলেন ম্যাথিউ রেিমার এবং ড্যান এল নিকোলি। 2013. নির্ভরশীলতা পরিমাপের উপর: ব্যাখ্যামূলক ব্যবস্থা উন্নয়নের জন্য একটি কাঠামো। পরিসংখ্যান বিজ্ঞান 28: 116-130।
নিক কক্স

উত্তর:


4

আমি মনে করি আপনার বিভাগীয় (পৃথক) ডেটা এবং অবিচ্ছিন্ন ডেটার মধ্যে পার্থক্য করা উচিত।

অবিচ্ছিন্ন তথ্যের জন্য, পিয়ারসন পারস্পরিক সম্পর্ক একটি রৈখিক (একজাতীয়) সম্পর্ককে পরিমাপ করে, র‌্যাঙ্কের সম্পর্কটি একঘেয়েমিক সম্পর্ক।

অন্যদিকে এমআই যে কোনও সম্পর্ককে "সনাক্ত করে"। এটি সাধারণত আপনি যা আগ্রহী এবং / বা সম্ভবত শব্দ হতে পারে তা নয়। বিশেষত, আপনাকে বিতরণের ঘনত্বটি অনুমান করতে হবে। তবে যেহেতু এটি অবিচ্ছিন্ন, আপনি প্রথমে একটি হিস্টোগ্রাম [পৃথক বিন্দু] তৈরি করবেন এবং তারপরে এমআই গণনা করবেন। তবে যেহেতু এমআই কোনও সম্পর্কের অনুমতি দেয় তাই আপনি ছোট্ট বিনগুলি ব্যবহার করার সাথে সাথে এমআই পরিবর্তন হবে (যেমন আপনি আরও উইগলগুলি মঞ্জুর করেন)। সুতরাং আপনি দেখতে পাচ্ছেন যে এমআই এর প্রাক্কলনটি খুব অস্থিতিশীল হবে, আপনাকে অনুমানের উপর কোনও আত্মবিশ্বাসের অন্তর স্থাপন করতে দেয় না [[যদি আপনি একটি ধ্রুবক ঘনত্ব অনুমান করেন তবে একই যায়] মূলত গণনা করার আগে অনেকগুলি অনুমান করা যায়) এমআই

অন্যদিকে শ্রেণিবদ্ধ তথ্য এমআই কাঠামোর (জি-পরীক্ষা দেখুন) এ বেশ সুন্দরভাবে ফিট করে এবং জি-পরীক্ষা এবং চি-স্কোয়ারের মধ্যে পছন্দ করার মতো খুব বেশি কিছু নেই।


আমি বেশিরভাগ বিচ্ছিন্ন সংস্থার ক্ষেত্রে উল্লেখ করছি (রিগ্রেশন দ্বারা, আমার মনে জিএলএম ছিল, কেবল ওএলএস নয়)। প্রকৃতপক্ষে, জটিল ঘটনা (যেমন জেনেটিক্স) অধ্যয়নরত প্রচুর বিজ্ঞানীরা বলতে পারেন যে আপনি যেভাবে বর্ণনা করছেন (তাতে কোনও সম্পর্ক সনাক্ত করুন ) তার প্রতি তারা আরও আগ্রহী । "পারস্পরিক সম্পর্কের কার্যকরী রূপটি ভুল হলে অবশ্যই কী হবে?" এর স্পষ্ট সাধারণ সমালোচনা থেকে বাঁচার লোভ? অবশ্যই আমি কোনও সম্পর্ক সনাক্ত করতে চাই ! " শক্তিশালী। যাইহোক, আমি মনে করি এখানে খেলতে কোনও নিখরচায় মধ্যাহ্নভোজ নেই, তবে সেটিকে উপেক্ষা করা হবে যে আমি আরও ভালভাবে বলতে / বোঝার চেষ্টা করছি।
user4733

1
... আমি এলআর টেস্ট এবং এমআইয়ের মধ্যে সম্পর্কের বিষয়ে অবগত ছিলাম না, এটি খুব আকর্ষণীয়!
user4733
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.