মিথস্ক্রিয়া প্রভাব চিহ্নিত করার জন্য সেরা অনুশীলনগুলি কী কী?


35

আক্ষরিকভাবে কোনও মডেল ( x1:x2বা x1*x2 ... xn-1 * xn) এ চলক (গুলি) এর প্রতিটি সম্ভাব্য সংমিশ্রণের পরীক্ষা করা ছাড়াও । আপনার স্বতন্ত্র (আশাবাদী) ভেরিয়েবলের মধ্যে কোনও মিথস্ক্রিয়া বা কোল্ড বিদ্যমান থাকলে আপনি কীভাবে সনাক্ত করবেন?

মিথস্ক্রিয়া শনাক্ত করার চেষ্টা করার সেরা অভ্যাসগুলি কী কী? এমন কোনও গ্রাফিক্যাল প্রযুক্তি রয়েছে যা আপনি ব্যবহার করতে পারেন বা করতে পারেন?


আপনি আপনার তথ্য সম্পর্কে কিছুটা বলতে পারেন? আকার (সিএফ আমার উত্তর) এবং প্রকৃতি (সিএফ
গ্যাভিনের

@ রবিন: তাকে বিছানা থেকে নামার জন্য সময় দিন, ব্র্যান্ডন টরন্টোয় রয়েছেন ;-)
মনিকা

1
@ রবিন, আমি এটিকে আরও সাধারণ রাখতে পছন্দ করব যদি, আপনার প্রতিক্রিয়াতে আপনি এমন একটি পদ্ধতি সরবরাহ করছেন যা তথ্যের আকার বা প্রকৃতি সম্পর্কে অনুমানের প্রয়োজন হয় তবে দয়া করে এটি উল্লেখ করুন। আমার যে সমস্যাটি হচ্ছে সেগুলি বিভিন্ন ডেটা সহ বিভিন্ন মডেলিংয়ের বিভিন্ন কাজ করে। সুতরাং, এই ক্ষেত্রে, আমি ইন্টারঅ্যাকশন প্রভাবগুলি সনাক্ত করার জন্য সাধারণ সুপারিশ খুঁজছি।
ব্র্যান্ডন বার্টেলসেন

উত্তর:


20

কক্স এবং ওয়ার্মুথ (1996) বা কক্স (1984) ইন্টারঅ্যাকশন সনাক্তকরণের জন্য কয়েকটি পদ্ধতি নিয়ে আলোচনা করেছে। সমস্যাটি সাধারণত ইন্টারঅ্যাকশন শর্তাবলী হওয়া উচিত। মূলত, আমরা (ক) সমস্ত দ্বিতীয়-ক্রমের ইন্টারঅ্যাকশন শর্তাদি একসাথে একবারে ফিট করি এবং (খ) তাদের সম্পর্কিত পি-মানগুলি (যেমন, ফাংশন হিসাবে নং পদগুলি) প্লট করি । তারপরে ধারণাটি হ'ল নির্দিষ্ট সংখ্যক ইন্টারঅ্যাকশন শর্তাদি বজায় রাখা উচিত কিনা: এই অনুমানের অধীনে যে সমস্ত মিথস্ক্রিয়া শর্তগুলি পি-মানগুলির বন্টন নালার হয় (বা সমতুল্যভাবে, স্ক্যাটারপ্লোটের পয়েন্টগুলি মোটামুটি বন্টন করা উচিত) উৎপত্তিস্থল দিয়ে যাওয়ার একটি লাইন)।1p

এখন, যেমন @ গ্যাভিন বলেছেন, অনেকগুলি (সমস্ত না থাকলে) মিথস্ক্রিয়াগুলি ফিট করার ফলে অতিরিক্ত মানানসই হতে পারে তবে এটি একটি নির্দিষ্ট অর্থেও অকেজো (কিছু উচ্চ-অর্ডার ইন্টারঅ্যাকশন শর্তাবলী প্রায়শই কোনও ধারণা নেই)। তবে এটি ইন্টারফেসের সাথে সম্পর্কিত নয়, মিথস্ক্রিয়া সনাক্তকরণ নয়, এবং ইতিমধ্যে ইন্টারফেসের ব্যাখ্যায় কক্সের দ্বারা একটি ভাল পর্যালোচনা সরবরাহ করা হয়েছিল : একটি পর্যালোচনা ( ফলিত পরিসংখ্যানগুলির 2007, 1 (2), 371–385) - এটি উপরে বর্ণিত রেফারেন্স অন্তর্ভুক্ত। গবেষণার অন্যান্য লাইনগুলি গ্রাফিকাল মডেলের উপর ভিত্তি করে বিশেষ পদ্ধতিগুলিতে জেনেটিক স্টাডির এপিস্ট্যাটিক প্রভাবগুলির অধ্যয়ন (যেমন, জিন অ্যাসোসিয়েশন নেটওয়ার্কগুলিতে পরিসংখ্যানিক ইন্টারঅ্যাক্টর সনাক্তকরণের একটি কার্যকর পদ্ধতি )।

তথ্যসূত্র

  • কক্স, ডিআর এবং ওয়ার্মুথ, এন (1996)। মাল্টিভারিয়েট নির্ভরতা: মডেল, বিশ্লেষণ এবং ব্যাখ্যা । চ্যাপম্যান এবং হল / সিআরসি।
  • কক্স, ডিআর (1984)। মিথস্ক্রিয়াআন্তর্জাতিক পরিসংখ্যান পর্যালোচনা , 52, 1–31।

16

আমার সেরা অনুশীলনটি হ'ল মডেলটি ফিট করার আগে সমস্যাটি সম্পর্কে চিন্তা করা । আপনি যে ঘটনাটি অধ্যয়ন করছেন তা প্রদত্ত কোন প্রতারণামূলক মডেল কী? ভেরিয়েবল এবং ইন্টারঅ্যাকশনগুলির সমস্ত সম্ভাব্য সংমিশ্রণগুলি আমার কাছে ডেটার ড্রেজিংয়ের মতো শোনাচ্ছে।


5
একটি মন্তব্য মত শোনাচ্ছে বা উত্তর "মনে হয়"?
রবিন গিরার্ড

2
@ রবিন - পরেরটি। আমি পরিসংখ্যানগত মডেলিংটি বেশ কঠিন খুঁজে পেয়েছি (আমি সামান্য আনুষ্ঠানিক পরিসংখ্যান প্রশিক্ষণ নিয়ে একটি বাস্তুবিদ, আমি যা শিখেছি তার বেশিরভাগ স্ব-শিক্ষিত হয়েছি) তবে আমি যদি সমস্যাটি সম্পর্কে প্রথমে চিন্তা করি তবে নির্ধারিত কি তা নির্ধারণ করুন, এটি অনেক সহজ সেই মডেলটি তৈরি করুন, আমার মডেল ডায়াগোনস্টিকগুলি করুন, মিথস্ক্রিয়াগুলি চেষ্টা করুন যেখানে এগুলি বৈজ্ঞানিক বোধ করে।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

2
@ ব্র্যান্ডন: যদি কোনও অনুপস্থিত মিথস্ক্রিয়া ঘটে থাকে, তবে কোভেরিয়েটগুলির মান অনুসারে শর্তাধীন শর্তে অবশিষ্টাংশগুলির নিদর্শন থাকবে। কোভেরিয়েটের বিরুদ্ধে অবশিষ্টাংশ প্লট করা কোন ইন্টারঅ্যাকশন উপযুক্ত হতে পারে তা নির্ধারণে সহায়তা করতে পারে।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

2
@ ব্র্যান্ডন: এটি স্ট্যান্ডার্ড মডেল ডায়াগনস্টিকস এবং অনুসন্ধানের প্লট করার দক্ষতা। আমি মনে করি যে কোভেরিয়েটের মিথস্ক্রিয়ায় জড়িত রয়েছে তার মানগুলিতে কন্ডিশনড (ggplot2 বা জালির উপায়ে) একটি ইন্টিরিশনের প্রার্থী হতে পারি বলে আমি মনে করি যে কোনও কোভেরিয়েটের বিপরীতে আমি তাদের বিরুদ্ধে প্লট করব। নিদর্শন আছে কিনা তা দেখতে প্রতিটি প্যানেলের মাধ্যমে একটি স্বাচ্ছন্দ্যযুক্ত কাঠি বেঁধে রাখুন। আপনার covariates কি ধরণের পরিবর্তনশীল উপর নির্ভর করে।
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

2
ডেটা ড্রেজিং? আপনি যদি ডেটাটিকে যথেষ্ট দীর্ঘ নির্যাতন করেন তবে তা স্বীকার করবে ...
কৌতূহল

16

একটি ট্রি মডেল ফিট করা (অর্থাত্ আর ব্যবহার করে), ব্যাখ্যামূলক ভেরিয়েবলের মধ্যে জটিল মিথস্ক্রিয়া সনাক্ত করতে আপনাকে সহায়তা করবে। 30 পৃষ্ঠায় উদাহরণটি এখানে পড়ুন


খুব সহজ এবং খুব দরকারী। পাশাপাশি ক্রলির লেখার রেফারেন্সের জন্য ধন্যবাদ!
ব্র্যান্ডন বার্টেলসেন

সাবধানতা অবলম্বন করুন - লিনিয়ার মডেল হিসাবে আপনি সহজেই এই ধরণের মিথস্ক্রিয়াকে ফিট করতে পারবেন না। মিথস্ক্রিয়া গাছের একটি শাখায় (বা কিছু অংশে) ঘটে। বাস্তব বিশ্বের ডেটাতে এই ধরণের সরঞ্জাম ব্যবহার করতে আপনার প্রচুর ডেটা প্রয়োজন data
মনিকা পুনরায় ইনস্টল করুন - জি সিম্পসন

3
@ গ্যাভিন যেমন বলেছিলেন, সম্ভাব্য বিভ্রান্তির মধ্যে একটি হ'ল সিদ্ধান্ত গাছের একটি বৃহত নমুনা আকার প্রয়োজন এবং এটি বেশ অস্থির হয় (যা ব্যাগিং এবং এলোমেলো বনগুলি व्यवहार्य বিকল্প হিসাবে প্রস্তাবিত হওয়ার অন্যতম কারণ)। আরেকটি সমস্যা হ'ল আমরা দ্বিতীয় বা উচ্চতর আদেশের ইন্টারঅ্যাকশন প্রভাবগুলির জন্য অনুসন্ধান করি কিনা তা স্পষ্ট নয়। আগের ক্ষেত্রে, কার্টগুলি কোনও সমাধান নয়। যে কোনও ক্ষেত্রে, আমি কোনও ধরণের গবেষণায় (পর্যবেক্ষণমূলক বা নিয়ন্ত্রিত) 6 ভেরিয়েবলের মধ্যে মিথস্ক্রিয়াটির খুব সন্দেহজনক ব্যাখ্যা খুঁজে পাব।
chl

7

আমি গ্যাভিনের সাথে পুরোপুরি একমত হওয়ায় আমি এই প্রতিক্রিয়াটির উপস্থাপনা করব এবং আপনি যদি কোনও ধরণের মডেল ফিট করতে আগ্রহী হন তবে এটি অধ্যয়নের অধীনে হওয়া ঘটনার প্রতিফলিত হওয়া উচিত। সমস্যাটি হ'ল যে কোনও এবং সমস্ত প্রভাব চিহ্নিত করার যুক্তি (এবং গ্যাভিন যখন ডেটার ড্রেজিং বলেন তখন কী বোঝায়) তা হ'ল আপনি অসীম সংখ্যক ইন্টারঅ্যাকশন, বা ভেরিয়েবলের জন্য চতুর্ভুজ পদ, বা আপনার ডেটাতে রূপান্তরকরণের উপযুক্ত হতে পারেন এবং আপনি অনিবার্যভাবে আপনার ডেটাগুলির কিছু পরিবর্তনের জন্য "গুরুত্বপূর্ণ" প্রভাবগুলি খুঁজে পেতে পারে।

চিএল হিসাবে বলা আছে যে এই উচ্চতর অর্ডার ইন্টারঅ্যাকশন ইফেক্টগুলির সত্যিকার অর্থে কোনও ব্যাখ্যা নেই এবং প্রায়শই নিম্নতর ক্রিয়াকলাপগুলির কোনও অর্থ হয় না। যদি কোনও কার্যকারণীয় মডেল বিকাশ করতে আপনার আগ্রহী হয় তবে কেবলমাত্র এমন শর্তাদি অন্তর্ভুক্ত করা উচিত যা আপনি বিশ্বাস করেন যে আপনার নির্ভরশীল পরিবর্তনশীলটির জন্য উপযুক্ত হতে পারে আপনার মডেলটি ফিট করার জন্য একটি অগ্রাধিকার

যদি আপনি বিশ্বাস করেন যে তারা আপনার মডেলটির ভবিষ্যদ্বাণীপূর্ণ শক্তি বাড়িয়ে তুলতে পারে তবে আপনার মডেলকে অতিরিক্ত মানিয়ে যাওয়া রোধ করতে আপনার মডেল নির্বাচন কৌশলগুলির সংস্থানগুলি অনুসন্ধান করা উচিত।


7

কত বড় এন? আপনার কত পর্যবেক্ষণ আছে? এটি গুরুত্বপূর্ণ ...

আপনার যদি অনেকগুলি পর্যবেক্ষণ এবং কয়েকটি থাকে তবে সোবোল সূচকগুলি আপনাকে ইন্টারঅ্যাকশন দ্বারা ব্যাখ্যা করা বৈকল্পিকের অনুপাতটি বলে দেবেএন, অন্যথায় আপনাকে মডেলিং করতে হবে (শুরু করতে লিনিয়ার)। সংবেদনশীলতা বলে এটির জন্য আপনার কাছে একটি দুর্দান্ত আর প্যাকেজ রয়েছে। যাইহোক ধারণাটি প্রায়শই প্রায়শই বৈকল্পিক (যা জেনারালাইজড এএনওওএও বলা হয়) পচে যাওয়ার জন্য।

যদি আপনি জানতে চান যে এই ভিন্নতার অনুপাতটি তাৎপর্যপূর্ণ হয় তবে আপনাকে মডেলিং করতে হবে (মোটামুটিভাবে, আপনাকে বৈচিত্রের সাথে তুলনা করার জন্য আপনার মডেলের স্বাধীনতার ডিগ্রিগুলির সংখ্যা জানতে হবে)।

আপনার ভেরিয়েবলগুলি কি বিযুক্ত বা ধারাবাহিক? আবদ্ধ বা না (যেমন আপনি সর্বোচ্চ জানেন না)?


সোবোল সূচকগুলির দিকনির্দেশের জন্য ধন্যবাদ। আবার, আমি উল্লেখ করতে চাই যে আমি এখানে একটি নির্দিষ্ট উত্তরের চেয়ে একজন সাধারণের সন্ধান করছি। আমি নির্দিষ্ট একটি ডেটা সেট সম্পর্কে জিজ্ঞাসা করছি না বরং বরং বিভিন্ন সংখ্যক সেট নিয়ে যে সমস্যাটি হয়েছে তা বোঝানোর চেষ্টা করছি explain
ব্র্যান্ডন বার্টেলসেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.