আপনি ডেটাতে কার্যকারিতা কীভাবে খুঁজে পাবেন?


11

বলুন যে আমার কাছে "A", "B" কলামযুক্ত একটি টেবিল রয়েছে

"এ" "বি" সংঘটিত হয় কিনা তা নির্ধারণের জন্য কোনও পরিসংখ্যান পদ্ধতি আছে? কেউ পিয়ারসনের আর ব্যবহার করতে পারে না কারণ:

  • এটি কেবল মানগুলির মধ্যে পারস্পরিক সম্পর্ক পরীক্ষা করে
  • পারস্পরিক সম্পর্ক কারণ নয়
  • পিয়ারসনের আর কেবল রৈখিক সম্পর্কের সাথে সম্পর্কিত হতে পারে

সুতরাং আমি এখানে অন্য বিকল্প আছে?


1
এখানে নেই. এই জাতীয় ডেটা থেকে আপনি একটি উচ্চ মাত্রার পারস্পরিক সম্পর্ক প্রদর্শন করতে পারেন; আপনি কার্যকারিতা প্রদর্শন করতে পারবেন না।

এটি দেখুন: cms.ieis.tue.nl/ বেটা

1
কারণগুলি সংখ্যা থেকে আপনি কেটে নিতে পারেন এমন কিছু নয় ... সুতরাং, আমার পরে পুনরাবৃত্তি করুন: কারণ পরস্পর সম্পর্ক নয় , কারণটি পরস্পরের সম্পর্ক নয় ...
জেএম পরিসংখ্যানবিদ নয়

1
জুডিয়া পার্লের "কার্যকারিতা" দেখুন (২০১১ টিউরিং পুরষ্কার বিজয়ী)।

উত্তর:


4

এখনও অবধি উত্তর এবং মন্তব্যগুলি ব্যবহারিক স্তরে মূলত সঠিক, তবে সম্পূর্ণতার জন্য, তথাকথিত কার্যকারিতা মডেলগুলির গবেষণা রয়েছে যা বেয়েশিয়ার পরিসংখ্যান এবং গ্রাফ তত্ত্বের উপর ভিত্তি করে তৈরি হয়েছে। সুতরাং যদিও সাধারণ সম্পর্কগুলি প্রকৃতপক্ষে কার্যকারণকে বোঝায় না, আরও জটিল মডেল রয়েছে যা কার্যকারণকে আঁচড়ানোর চেষ্টা করে। আরও তথ্যের জন্য জুডিয়া পার্লের কার্যকারিতা বইটি দেখুন , তবে এটি খুব ভারী-দায়বদ্ধ গণিত এবং সম্ভবত আপনি যা চান তা নয়।


2

এমন অনেক তথাকথিত অর্ধ-পরীক্ষামূলক পদ্ধতি রয়েছে যার সাথে আপনি কার্যকারিতা সম্পর্কে বিশ্বাসযোগ্যতার সাথে তর্ক করতে পারেন, যদিও আপনার ডেটা পর্যবেক্ষণমূলক। এই পদ্ধতিগুলি আপনার আগ্রহের পরিবর্তনশীলটিতে বহিরাগত পরিবর্তনের উত্স খুঁজে পাওয়ার উপর নির্ভর করে।

আমি মনে করি "মোস্টলি হার্মলেস একনোমেট্রিক্স" বইটিতে একটি ভাল এবং অ্যাক্সেসযোগ্য ওভারভিউ দেওয়া হয়েছে। এগুলি মূলত সমস্ত আধা-পরীক্ষামূলক পদ্ধতিগুলি অন্তর্ভুক্ত করে যা লোকেরা (অর্থাত্ অর্থনীতিবিদ) বিশ্বাস করে (কমপক্ষে কখনও কখনও)। তারা উদাহরণস্বরূপ trb456 দ্বারা উল্লিখিত পদ্ধতিগুলি কভার করে না (একই কারণে: তাদের মধ্যে অনেকেই বিশ্বাস করে না)।


1

কার্যকারিতা নির্ধারণ করার জন্য আপনাকে একটি এলোমেলোকরণ পরীক্ষা করতে হবে। আপনি আপনার পরীক্ষার বিষয়গুলি নিয়ে যান এবং এলোমেলোভাবে তাদের অর্ধেকটি মান A এবং অর্ধেক না পাওয়ার জন্য বেছে নিন। আপনি তখন দেখতে পাবেন যে দুটি গ্রুপের মধ্যে মানের বিতে একটি পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ পার্থক্য রয়েছে।

কোনও পরিমাপ করার আগে আপনি র্যান্ডমাইজেশন করা গুরুত্বপূর্ণ । বিশেষত, যদি আপনি ইতিমধ্যে মাপা এবং সাথে ডেটা সেট দেওয়া হয় তবে কার্যকারিতা নির্ধারণ করা অসম্ভব isAB

নোট করুন যে র্যান্ডমাইজেশন পরীক্ষাটি আপনি করতে চান তা করা অসম্ভব হতে পারে। উদাহরণস্বরূপ, লম্বা হওয়ার কারণে আপনি আরও বেশি ওজনের কারণ কীভাবে আপনি পরীক্ষা করতে পারেন? অবশ্যই উচ্চতা এবং ওজনের মধ্যে পারস্পরিক সম্পর্ক রয়েছে তবে আপনি এলোমেলোভাবে একটি গ্রুপকে 'লম্বা' গ্রুপে এবং একটিকে 'শর্ট' গ্রুপে নির্ধারণ করতে পারবেন না। এই ক্ষেত্রে, র্যান্ডমাইজেশন পরীক্ষা করা যাবে না।


0

সামার্স ডি আডিনাল ভেরিয়েবলের মধ্যে সম্পর্কটি এমনভাবে ব্যাখ্যা করার জন্য কাজ করে যা পার্সনের পারস্পরিক সম্পর্কের সহগ ডাটা সেটগুলির জন্য করে।


1
আমি সম্মত হই যে কার্যকারিতা প্রতিষ্ঠায় সংখ্যার চেয়ে বেশি সময় লাগে। অর্ডিনাল ভেরিয়েবলের ব্যবহার কীভাবে প্রশ্নে প্রবেশ করবে?
মাইকেল আর চেরনিক

1
@ মিশেল চের্নিক সামার্স ডি হ'ল সংঘবদ্ধতার একটি অসামঞ্জস্য পরিমাপ। এটা তোলে আলাদা করতে পারেন মধ্যে "যদি বৃষ্টি হয়, তাহলে ইহা মেঘাচ্ছন্ন, 'থেকে" যদি এটা মেঘলা হয়, তাহলে বৃষ্টি হচ্ছে "এটা পূরণবাচক বা উচ্চতর ডেটার জন্য কাজ করে এটা করণ প্রতিষ্ঠা করে না, কিন্তু এটা অভিমুখ কায়েম
ডেভ হ্যারিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.