পরিসংখ্যান এবং কার্যকারণ অনুমান?


51

পল হল্যান্ড তার ১৯৮৪ সালের গবেষণাপত্রে "পরিসংখ্যান এবং কার্যকারণ সূচনা" তে পরিসংখ্যানগুলির মধ্যে একটি অন্যতম মৌলিক প্রশ্ন উত্থাপন করেছিলেন:

কোনও পরিসংখ্যান মডেল কার্যকারণ সম্পর্কে কী বলতে পারে?

এটি তার নীতিবাক্য বাড়ে:

ম্যানিপুলেশন ব্যতীত কোন কারণ নেই

যা কার্যকারিতা বিবেচনা করে এমন পরীক্ষাগুলির চারদিকে বিধিনিষেধের গুরুত্বকে জোর দিয়েছিল। অ্যান্ড্রু গেলম্যানও একই রকম কথা বলেছেন :

"আপনি যখন কোনও কিছু পরিবর্তন করেন তখন কী হয় তা সন্ধান করার জন্য এটি পরিবর্তন করা দরকার" "... এমন কোনও সিস্টেম রয়েছে যা আপনি কোনও সিস্টেমকে ঘৃণা করে শিখেছিলেন যা আপনি কোনও পরিমাণে নিষ্ক্রিয় পর্যবেক্ষণ থেকে খুঁজে পাবেন না।

তাঁর ধারণাগুলি সংক্ষেপে এই নিবন্ধে দেওয়া হয়েছে

কোনও পরিসংখ্যানের মডেল থেকে কার্যকারণকে বিবেচনা করার সময় কী বিবেচনা করা উচিত?


2
ভালো প্রশ্ন: এছাড়াও পারস্পরিক সম্পর্ক এবং করণ এই সংশ্লিষ্ট প্রশ্ন দেখতে পাবেন stats.stackexchange.com/questions/534/...
Jeromy Anglim


5
অনেক কিছু বলতে। তবে আপনি পার্লের বই "কার্যকারিতা" (২০০২, তবে নতুন দ্বিতীয় সংস্করণ), বা হার্নান এবং রবিন্সের বই "কার্যকারণ ইনফারেন্স" (2015, নিখরচায় নিখরচায় বৈদ্যুতিন খসড়া) পড়তে পারেন।

উত্তর:


28

এটি একটি বিস্তৃত প্রশ্ন, তবে বাক্সটি দেওয়া হান্টার এবং হান্টারের উদ্ধৃতিটি সত্য বলে আমি মনে করি এটি কী নেমে আসে

  1. পরীক্ষামূলক ডিজাইনের গুণমান:

    • র্যান্ডমাইজেশন, নমুনা আকার, কনফাউন্ডার নিয়ন্ত্রণ ...
  2. নকশা বাস্তবায়নের গুণমান:

    • প্রোটোকলের আনুগত্য, পরিমাপ ত্রুটি, ডেটা হ্যান্ডলিং, ...
  3. সঠিকভাবে নকশাটি প্রতিবিম্বিত করতে মডেলটির গুণমান:

    • অবরুদ্ধ কাঠামোগুলি সঠিকভাবে উপস্থাপিত হয়, স্বাধীনতার সঠিক ডিগ্রিগুলি প্রভাবগুলির সাথে যুক্ত হয়, অনুমানকারীরা পক্ষপাতহীন, ...

স্পষ্টত উল্লেখ করার ঝুঁকিতে আমি প্রত্যেকটির মূল পয়েন্টগুলিতে আঘাত করার চেষ্টা করব:

  1. পরিসংখ্যানের একটি বৃহত উপ-ক্ষেত্র, তবে এটি বেশিরভাগ মৌলিক আকারে আমার মনে হয় যে এটি কার্যকরী অনুভূতি তৈরির সময় আমরা আদর্শভাবে অভিন্ন ইউনিটগুলির সাথে শুরু করি যা কোনও চিকিত্সার জন্য নির্ধারিত ছাড়া অন্য অভিন্ন পরিবেশে তদারকি করা হয়। দায়িত্ব গ্রহণের পরে গোষ্ঠীগুলির মধ্যে যে কোনও পদ্ধতিগত পার্থক্য হ'ল তাত্ক্ষণিকভাবে চিকিত্সার জন্য দায়ী (আমরা কারণ নির্ধারণ করতে পারি)। তবে, বিশ্বটি এমন নয় যে চিকিত্সার আগে সুন্দর এবং ইউনিটগুলি পৃথক হয় এবং পরীক্ষাগুলির সময় বিলোপকারীদের পুরোপুরি নিয়ন্ত্রণ করা হয় না। সুতরাং আমরা "আমরা যা পারি তা নিয়ন্ত্রণ করি এবং যা আমরা পারি না তা এলোমেলো করে তুলি", যা নিশ্চিত করতে সাহায্য করে যে আমরা যে নিয়মবদ্ধ বা র্যান্ডমাইজড করেছি তা নিশ্চিত করার জন্য পদ্ধতিগত পক্ষপাত হবে না। একটি সমস্যা হ'ল পরীক্ষাগুলি কঠিন (অসম্ভব) এবং ব্যয়বহুল হতে থাকে এবং ব্যয়ের ব্যয় করে যতটা সম্ভব সাবধানতার সাথে নিয়ন্ত্রণে যতটা সম্ভব দক্ষতার সাথে যথাসময়ে উত্তোলনের জন্য বিভিন্ন ধরণের নকশা তৈরি করা হয়েছে। এর মধ্যে কয়েকটি বেশ কঠোর (যেমন medicineষধে ডাবল-ব্লাইন্ড, এলোমেলোভাবে তৈরি করা, প্লেসবো-নিয়ন্ত্রিত পরীক্ষায়) এবং অন্যরা এত কম (যেমন 'অর্ধ-পরীক্ষার বিভিন্ন রূপ)।

  2. এটিও একটি বড় বিষয় এবং এটি একটি যা পরিসংখ্যানবিদরা সাধারণত ভাবেন না ... যদিও আমাদের উচিত should প্রয়োগের পরিসংখ্যান সংক্রান্ত কাজগুলিতে আমি এমন ঘটনাগুলি স্মরণ করতে পারি যেখানে ডেটাতে পাওয়া 'প্রভাবগুলি' ডেটা সংগ্রহ বা হ্যান্ডলিংয়ের অসঙ্গতিগুলির উত্সাহজনক ফলাফল ছিল। আমি আরও আশ্চর্য হয়েছি যে এই সমস্যাগুলির কারণে আগ্রহের সত্যিকারের কার্যকারণের প্রভাবগুলি প্রায়শই প্রায়শই হারিয়ে যায় (আমি বিশ্বাস করি যে প্রয়োগকৃত বিজ্ঞানের শিক্ষার্থীরা সাধারণত যেভাবে ডেটাগুলি বিকশিত হতে পারে সে সম্পর্কে কোনও প্রশিক্ষণ নেই - তবে আমি এখানে বিষয়টি বন্ধ করছি) ...)

  3. আরেকটি বৃহত প্রযুক্তিগত বিষয়, এবং উদ্দেশ্যমূলক কার্যনির্বাহের জন্য অন্য প্রয়োজনীয় পদক্ষেপ। একটি নির্দিষ্ট ডিগ্রিতে এটি যত্ন নেওয়া হয় কারণ নকশাকর্মীদের ভিড় একসাথে ডিজাইন এবং মডেল বিকাশ করে (যেহেতু কোনও মডেল থেকে অনুকরণই লক্ষ্য হয়, অনুমানকারীরা ড্রাইভ ডিজাইনের বৈশিষ্ট্য)। তবে এটি কেবল আমাদের এ পর্যন্ত পেয়েছে কারণ 'বাস্তব জগতে' আমরা পাঠ্যপুস্তকবিহীন নকশাগুলি থেকে পরীক্ষামূলক তথ্য বিশ্লেষণ করে শেষ করি এবং তারপরে উপযুক্ত নিয়ন্ত্রণগুলির মতো জিনিসগুলি সম্পর্কে এবং তাদের মডেলটিতে কীভাবে প্রবেশ করা উচিত এবং কী সম্পর্কিত ডিগ্রিগুলি নিয়ে আমাদের কঠোরভাবে চিন্তা করতে হবে স্বাধীনতা হওয়া উচিত এবং অনুমানগুলি পূরণ করা হয় কিনা তা যদি হয় না তবে কীভাবে লঙ্ঘনের সামঞ্জস্য করা যায় এবং অনুমানকারীরা কোনও অবশিষ্ট লঙ্ঘনের ক্ষেত্রে কতটা দৃ are় হয় এবং ...

যাইহোক, আশা করি উপরোক্ত কয়েকটি মডেল থেকে কার্যকারিতা অনুগ্রহ করে বিবেচনা সম্পর্কে চিন্তাভাবনা করতে সহায়তা করে। আমি কি বড় কিছু ভুলে গেছি?


3
২ নং পয়েন্টের জন্য একটি বিশাল প্লাস ওয়ান, মানব বিষয় সুরক্ষা প্রশিক্ষণের মধ্য দিয়ে যাওয়া ছাড়া, আমি কখনই ডেটা সংগ্রহ এবং স্টোরেজ সম্পর্কে প্রশিক্ষণের সবচেয়ে ক্ষুদ্রতম প্রশিক্ষণ পাইনি। বিশ্লেষণের চেয়ে সঠিকভাবে তথ্য সংগ্রহ করা অনেক বেশি গুরুত্বপূর্ণ।
ম্যাট পার্কার 18

আমিও উত্তর দিতে খুব পছন্দ করব, তবে আমি ভয় করি কিংসফোর্ড যা বলেছিল তাতে যুক্ত করার মতো কিছুই নেই।
জোরিস মেজ

7

উপরোক্ত উত্তরের উত্তরের পাশাপাশি, একটি পরিসংখ্যান পদ্ধতি রয়েছে যা আপনাকে কার্যকারিতা প্রদর্শনের আরও কাছে নিয়ে যেতে পারে। এটি গ্রেঞ্জার কার্যকারিতা যা প্রমাণ করে যে নির্ভরশীল ভেরিয়েবলের আগে ঘটে যাওয়া একটি স্বতন্ত্র পরিবর্তনশীলটির কার্যকারিতা রয়েছে বা না। আমি নীচের লিঙ্কে উপস্থাপনা অনুসরণ করতে এই পদ্ধতিটি প্রবর্তন করি:

http://www.slideshare.net/gaetanlion/granger-causality-presentation

প্রতিযোগিতামূলক সামষ্টিক অর্থনৈতিক তত্ত্বগুলির পরীক্ষার জন্যও আমি এই পদ্ধতিটি প্রয়োগ করি: http://www.slideshare.net/gaetanlion/economic-theory-testing- preferencesation

সচেতন হন যে এই পদ্ধতিটি নিখুঁত নয়। এটি কেবলমাত্র নিশ্চিত করে যে নির্দিষ্ট ইভেন্টগুলি অন্যের আগে ঘটে এবং সেই ইভেন্টগুলির একটি সুসংগত দিকনির্দেশক সম্পর্ক বলে মনে হয়। এটি সত্যিকারের কার্যকারিতা জড়িত বলে মনে হয় তবে এটি সর্বদা হয় না। মোরগের সকালের ডাকের কারণে সূর্য ওঠে না।


4

কোনও পরিসংখ্যান মডেল কার্যকারণ সম্পর্কে কী বলতে পারে? কোনও পরিসংখ্যানের মডেল থেকে কার্যকারণকে বিবেচনা করার সময় কী বিবেচনা করা উচিত?

পরিষ্কার করার প্রথম জিনিসটি আপনি খাঁটি পরিসংখ্যানের মডেল থেকে কার্যকারিতা অনুগ্রহ করতে পারবেন না। কোনও পরিসংখ্যানের মডেল কার্যকারণ অনুমান ছাড়া কার্যকারিতা সম্পর্কে কিছুই বলতে পারে না। তা হল, কার্যকারণ অনুমিতকরণ করতে আপনার একটি কার্যকারক মডেল প্রয়োজন

এমনকি র‌্যান্ডমাইজড কন্ট্রোল ট্রায়ালস (আরসিটি) এর মতো স্বর্ণের মান হিসাবে বিবেচিত এমন কিছু ক্ষেত্রেও আপনাকে এগিয়ে যাওয়ার জন্য কার্যকারণ অনুমান করা দরকার। আমাকে এই পরিষ্কার করা যাক। উদাহরণস্বরূপ, ধরুন এলোমেলোকরণ পদ্ধতি, সুদের চিকিত্সা এবং সুদের ফলাফল। একটি নিখুঁত আরসিটি ধরে নেওয়ার সময়, আপনি যা অনুমান করছেন এটিই:ZXY

এখানে চিত্র বর্ণনা লিখুন

এই ক্ষেত্রে তাই কিছু ভাল কাজ করছে। তবে, ধরুন আপনার অসম্পূর্ণ সম্মতি রয়েছে যার ফলে এবং মধ্যে বিভ্রান্তিকর সম্পর্ক রয়েছে । তারপরে, এখন, আপনার আরসিটি এর মতো দেখাচ্ছে:P(Y|do(X))=P(Y|X)XY

এখানে চিত্র বর্ণনা লিখুন

আপনি এখনও বিশ্লেষণের চিকিত্সার উদ্দেশ্যে করতে পারেন। তবে আপনি যদি জিনিসগুলির প্রকৃত প্রভাবটি অনুমান করতে চান তবে আর সহজ নয়। এটি একটি ইনস্ট্রুমেন্টাল ভেরিয়েবল সেটিং এবং আপনি কিছু প্যারামেট্রিক অনুমান করাতে পারলে আপনি প্রভাবটি চিহ্নিত করতে বা এমনকি নির্দেশ করতে সক্ষম হতে পারেন ।X

এটি আরও জটিল হতে পারে। আপনার পরিমাপের ত্রুটির সমস্যা হতে পারে, অন্যান্য বিষয়গুলির মধ্যে বিষয়গুলি অধ্যয়ন বাদ দিতে পারে বা নির্দেশাবলী অনুসরণ না করতে পারে। এই জিনিসগুলি কীভাবে অনুক্রমের সাথে এগিয়ে যাওয়ার সাথে সম্পর্কিত তা নিয়ে আপনাকে অনুমান করা দরকার। "বিশুদ্ধরূপে" পর্যবেক্ষণের তথ্য সহ এটি আরও সমস্যাযুক্ত হতে পারে, কারণ সাধারণত গবেষকরা ডেটা উত্পন্নকরণ প্রক্রিয়া সম্পর্কে ভাল ধারণা রাখবেন না।

সুতরাং, মডেলগুলি থেকে কার্যকারণ সূচনার জন্য আপনাকে কেবল এটির পরিসংখ্যানগত অনুমানগুলিই বিচার করতে হবে না, তবে সবচেয়ে গুরুত্বপূর্ণ এটির কার্যকারণ অনুমানগুলি। কার্যকারণ বিশ্লেষণের জন্য এখানে কিছু সাধারণ হুমকি রয়েছে:

  • অসম্পূর্ণ / অসম্পূর্ণ ডেটা
  • টার্গেট কার্যকারণ পরিমাণের সুদের সংজ্ঞা দেওয়া হয়নি (আপনি যে কার্যকারিতাটি চিহ্নিত করতে চান তা কী? লক্ষ্য জনসংখ্যা কী?)
  • বিস্ময়কর (অরক্ষিত বিভ্রান্তকারী)
  • নির্বাচন পক্ষপাত (স্ব-নির্বাচন, কাটা নমুনা)
  • পরিমাপ ত্রুটি (এটি কেবল গোলমাল নয়, বিভ্রান্তিকর প্ররোচিত করতে পারে)
  • ভুল বানান (উদাহরণস্বরূপ, ভুল কার্যকরী ফর্ম)
  • বাহ্যিক বৈধতা সমস্যা (জনসংখ্যার লক্ষ্যে ভুল অনুমান)

কখনও কখনও এই সমস্যাগুলির অনুপস্থিতির দাবী (বা এই সমস্যাগুলির সমাধান করার দাবি) নিজেই অধ্যয়নের নকশা দ্বারা ব্যাক আপ করা যেতে পারে। এজন্য পরীক্ষামূলক ডেটা সাধারণত আরও বিশ্বাসযোগ্য। কখনও কখনও, তবে মানুষ তত্ত্ব বা সুবিধার্থে এই সমস্যাগুলি সরিয়ে নেবে। তত্ত্বটি যদি নরম হয় (সামাজিক বিজ্ঞানের মতো) তবে মুখের মূল্যে সিদ্ধান্তটি নেওয়া আরও কঠিন হবে।

যে কোনও সময় আপনি যদি ভাবেন যে এমন একটি অনুমান আছে যা ব্যাক আপ করা যায় না, আপনার মূল্যায়ন করা উচিত যে এই অনুমানগুলির প্রশংসনীয় লঙ্ঘনের জন্য সিদ্ধান্তগুলি কতটা সংবেদনশীল --- এটিকে সাধারণত সংবেদনশীলতা বিশ্লেষণ বলা হয়।


অতিরিক্ত নোড থেকে দুটি এক-দিকনির্দেশক শক্ত তীরের সাথে ড্যাশযুক্ত দ্বি-নির্দেশমূলক তীরটি প্রতিস্থাপন করা সমান হবে কি?
টেলর

@ টেলর হ্যাঁ, একটি সুপ্ত (অরক্ষিত) অতিরিক্ত নোড।
কার্লোস সিনেলি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.