কথোপকথন অন্তর্ভুক্ত তবে কোনও মডেলের প্রধান প্রভাব নয়


85

মূল প্রভাবগুলি বাদ দিয়ে কোনও মডেলটিতে দ্বিমুখী ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা কি কখনও বৈধ? যদি আপনার হাইপোথিসিসটি কেবল ইন্টারঅ্যাকশন সম্পর্কে হয় তবে কী আপনার এখনও প্রধান প্রভাবগুলি অন্তর্ভুক্ত করতে হবে?


3
আমার দর্শন প্রচুর মডেল চালিত হয়, তাদের পূর্বাভাস পরীক্ষা করে দেখুন, তুলনা করুন, ব্যাখ্যা করুন, আরও বেশি মডেল চালান।
মাইকেল বিশপ

11
যদি প্রতিক্রিয়াগুলি কেবলমাত্র তখনই তাৎপর্যপূর্ণ হয় যখন মূল প্রভাবগুলি মডেলটিতে থাকে, তবে এটি হতে পারে যে প্রধান প্রভাবগুলি তাৎপর্যপূর্ণ এবং ইন্টারঅ্যাকশনগুলি নয়। 100 এর ক্রমের পরিবর্তনের সাথে একটি অত্যন্ত তাত্পর্যপূর্ণ প্রধান প্রভাব এবং অন্যটি তুচ্ছ মূল প্রভাব বিবেচনা করুন যার জন্য সমস্ত মান খুব কম বৈকল্পিকের সাথে প্রায় এক। তাদের মিথস্ক্রিয়া তাত্পর্যপূর্ণ নয়, তবে ইন্টারঅ্যাকশন প্রভাবটি উল্লেখযোগ্য হিসাবে উপস্থিত হবে যদি প্রধান প্রভাবগুলি মডেল থেকে সরানো হয়।
টমাস লেভাইন

4
@ থমাসকে আপনার প্রথম লাইনে পড়া উচিত 'যদি মূল প্রভাবগুলি মডেলটিতে না থাকে তবে ইন্টারঅ্যাকশনগুলি কেবল তাৎপর্যপূর্ণ হয় ...'?
গ্লেন

2
ওহ হ্যাঁ, এটা করা উচিত!
টমাস লেভাইন

উত্তর:


55

আমার অভিজ্ঞতায়, কেবলমাত্র উচ্চতর অর্ডার প্রভাবের সাথে সংযুক্ত থাকাকালীন কেবলমাত্র মডেলটিতে সমস্ত নিম্নতর অর্ডার এফেক্ট থাকতে হবে তা নয়, তবে এটি সঠিকভাবে মডেল করাও গুরুত্বপূর্ণ (যেমন, ননলাইনারের অনুমতি দেওয়া) মূল প্রভাবগুলি যা আপাতদৃষ্টিতে সম্পর্কিত নয় বলে মনে হচ্ছে আগ্রহের মিথস্ক্রিয়াগুলির কারণগুলি। এর কারণ হল এবং মধ্যে মিথস্ক্রিয়াগুলি এবং এর প্রধান প্রভাবগুলির জন্য স্ট্যান্ড-ইন হতে পারে । কথোপকথন কখনও কখনও প্রয়োজন বলে মনে হয় কারণ এগুলি বাদ দেওয়া ভেরিয়েবল বা বাদ দেওয়া ননলাইনার (উদাহরণস্বরূপ, স্প্লাইন) পদগুলির সাথে কোলাইনারি।x 2 x 3 x 4x1x2x3x4


1
এর অর্থ হ'ল আমাদের y ~ x1 * x2 * x3 * x4 থেকে শর্তগুলি মুছে ফেলা শুরু করা উচিত, সর্বোচ্চ অর্ডার শর্তগুলি মুছে ফেলা শুরু করা, অর্থাৎ সাধারণ মোছার পদ্ধতি, তাই না?
কৌতুহল

9
আপনি "অংশ" হিসাবে পুরো ক্লাসের শর্তাদি পরীক্ষা করতে না পারলে শর্তগুলি মোছার প্রস্তাব দেওয়া হয় না। উদাহরণস্বরূপ, হয় যাবতীয় ইন্টারঅ্যাকশন শর্তাবলী রাখা বা মুছে ফেলা, বা তৃতীয় বা চতুর্থ অর্ডারযুক্ত সমস্ত মিথস্ক্রিয়া রাখা বা মুছে ফেলা যুক্তিসঙ্গত হতে পারে।
ফ্র্যাঙ্ক হ্যারেল

কোনও নির্দিষ্ট ক্রমে কেবলমাত্র কিছু মিথস্ক্রিয়া মুছে ফেলতে সমস্যা হয়েছে?
ব্যবহারকারী1205901

3
যদি আপনার কাছে সম্পূর্ণ পূর্বনির্ধারিত অর্ডার থাকে যা ডেটা দেখে দেখে নির্ধারিত হয় না, তবে আপনি তা করতে ঠিকই পারেন। একাধিক পি-মান ব্যবহার করে একাধিক সিদ্ধান্ত নেওয়ার সময় সাধারণভাবে আপনার সহ-লৈখিকতা এবং বহুগুণে সমস্যা হবে।
ফ্র্যাঙ্ক হ্যারেল

2
আমি মনে করি এই উত্তরটি অস্পষ্ট, এবং কেবলমাত্র আংশিকভাবে প্রশ্নের উত্তর দিয়েছে। প্রকৃতপক্ষে, এই উত্তরটি বলেছে যে মূল প্রভাবটির মডেল করা প্রয়োজন, তবে কেবল ইন্টারঅ্যাকশনটিতে ফোকাস করার জন্য এটি পুনরায় চাপিয়ে দেওয়া বৈধ কিনা তা উত্তর দেয় না, এটি জিপিপিআইয়ের মতো কিছু মডেলগুলিতে ব্যবহৃত এবং ব্যবহৃত হয় (আমার উত্তর দেখুন নিচে).
চমত্কার

37

আপনি জিজ্ঞাসা করুন এটি কখনও বৈধ কিনা। আমাকে একটি সাধারণ উদাহরণ প্রদান করুন, যার বর্ণনাটি আপনার জন্য অতিরিক্ত বিশ্লেষণাত্মক পদ্ধতির পরামর্শ দিতে পারে।

কথোপকথনের সহজ উদাহরণ হ'ল একটি নির্ভরশীল ভেরিয়েবল এবং দুটি স্বতন্ত্র ভেরিয়েবল X , Y আকারে একটি মডেলZXY

Z=α+βX+γY+δXY+ε,

সাথে এলোমেলো টার্ম ভেরিয়েবলের শূন্য প্রত্যাশা রয়েছে এবং এবং । এটি প্রায় কিনা তা যাচাই করা উপযুক্ত কারণ একই মডেলের একটি বীজগণিত সমতুল্য প্রকাশα , β ' , γ ' , δ ' δ ' β ' γ 'εα,β,γ,δδβγ

Z=α(1+βX+γY+δXY)+ε

=α(1+βX)(1+γY)+α(δβγ)XY+ε

(যেখানে ইত্যাদি)।β=αβ

যেহেতু, যদি মনে হয় যে কোনও কারণ আছে , আমরা এটি ত্রুটি শব্দ শোষন করতে পারি । এটি কেবল "খাঁটি মিথস্ক্রিয়া" দেয় না, এটি একটি ধ্রুবক শব্দ ছাড়া তা করে এর পরিবর্তে দৃ log়ভাবে লগারিদম গ্রহণের পরামর্শ দেয়। অবশিষ্টাংশগুলিতে কিছু ভিন্নধর্মীতা - অর্থাৎ বৃহত্তর মানগুলির সাথে সম্পর্কিত রেসিডুয়ালিদের জন্য গড়ের তুলনায় নিখুঁত মানের চেয়ে বড় হওয়ার প্রবণতাও এই দিকে নির্দেশ করবে। তারপরে আমরা একটি বিকল্প সূত্রটি ঘুরে দেখতে চাইε জেড(δβγ)0εZ

log(Z)=log(α)+log(1+βX)+log(1+γY)+τ

IID র্যান্ডম ত্রুটি সহ । তদ্ব্যতীত, আমরা যদি তুলনায় এবং বড় হওয়ার প্রত্যাশা করি , আমরা পরিবর্তে কেবলমাত্র মডেলটির প্রস্তাব করবβ এক্স γ ওয়াই 1τβXγY1

log(Z)=(log(α)+log(β)+log(γ))+log(X)+log(Y)+τ

=η+log(X)+log(Y)+τ.

এই নতুন মডেলের চারটি প্যারামিটার ( , ইত্যাদি) এর পরিবর্তে কেবলমাত্র একটি একক প্যারামিটার যা যথেষ্ট সরলকরণ। ( ) এর সাথে সম্পর্কিত।α β ' δ ' = β ' γ 'ηαβδ=βγ

আমি বলছি না যে এটি প্রয়োজনীয় বা এমনকি একমাত্র পদক্ষেপ নেওয়া, তবে আমি পরামর্শ দিচ্ছি যে মডেলটির এই ধরণের বীজগণিত পুনঃস্থাপন সাধারণত যখনই একা মিথস্ক্রিয়াগুলি গুরুত্বপূর্ণ বলে মনে হয় তা বিবেচনার জন্য উপযুক্ত।

13 Tukey এর - বিশেষ করে মাত্র দুই ও তিন স্বাধীন ভেরিয়েবল সঙ্গে, মিথষ্ক্রিয়া সঙ্গে মডেল এক্সপ্লোর করার কিছু চমৎকার উপায়ে, অধ্যায় 10 মধ্যে প্রদর্শিত EDA


আপনি কখন আনুমানিক শূন্য হিসাবে ধরে নিতে সক্ষম হবেন তার একটি উদাহরণ সরবরাহ করতে পারেন ? মূল শর্তাদি এবং সেগুলির অর্থ কী হবে সে সম্পর্কে এই পদগুলির সম্পর্কে ভাবা আমার পক্ষে কঠিন। δβγ
ডিজেহকিং

@ ডিজেহকিং যে কোনও পরিস্থিতিতে বিকল্প গঠনের পক্ষে একটি ভাল মডেল হ'ল প্রথম মডেলটিতে অবশ্যই বোঝানো হবে । একটি বিশেষ কেস হ'ল চূড়ান্ত মডেল, যা এবং এবং লগগুলির মধ্যে একটি সরল রৈখিক সম্পর্ক , মূল স্কেলে একটি গুণগত সম্পর্কের সমান । এ জাতীয় সম্পর্ক প্রকৃতিতে প্রচুর - এটি কেবল বলে যে সরাসরি এবং পৃথকভাবে এবং উভয়ের সমানুপাতিক । লগ ( জেড ) এক্স ওয়াই জেড α এক্স ওয়াই জেড এক্স ওয়াইα(δβγ)0log(Z)XYZXYZXY
হোবার

30

যদিও এটি প্রায়শই পাঠ্যপুস্তকগুলিতে বর্ণিত হয় যে কোনওরূপে মূল প্রভাবগুলির সাথে মডেলটির সাথে কোনও ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা উচিত নয়, অবশ্যই এর উদাহরণ রয়েছে যেখানে এটি নিখুঁতভাবে অনুধাবন করতে পারে। আমি কল্পনা করতে পারি এমন সহজ উদাহরণটি দেব।

ধরুন, দুটি গ্রুপকে এলোমেলোভাবে নির্ধারিত বিষয়গুলি একবার বেসলাইনে (অর্থাত্‍, র‌্যান্ডমাইজেশনের ঠিক পরে) দুবার পরিমাপ করা হয় এবং গ্রুপ টি পরে একবার একধরনের চিকিত্সা পেয়েছে, যখন গ্রুপ সি হয় নি। তারপরে এই তথ্যগুলির জন্য একটি পুনরাবৃত্ত-পরিমাপ মডেলটি পরিমাপ উপলক্ষে (ডামি ভেরিয়েবল যা বেসলাইনটির জন্য 0 এবং ফলোআপের জন্য 1 হয়) এবং গ্রুপ ডামি (0 ডিগ্রি সি এর জন্য, টি এর জন্য 1) এর মধ্যে একটি ইন্টারঅ্যাকশন শব্দ অন্তর্ভুক্ত করবে ) এবং সময় ডামি।

মডেল ইন্টারসেপ্ট তখন বেসলাইনে বিষয়গুলির গড় স্কোরের অনুমান করে (তারা যে গ্রুপে থাকুক না কেন)। পরিমাপ উপলক্ষে ডামিটির সহগগুলি বেসলাইন এবং ফলোআপের মধ্যে নিয়ন্ত্রণ গ্রুপের পরিবর্তনকে নির্দেশ করে। এবং মিথস্ক্রিয়া শব্দটির জন্য সহগ নির্দেশ করে যে নিয়ন্ত্রণ গ্রুপের তুলনায় চিকিত্সা গ্রুপে কত বড় / ছোট পরিবর্তন হয়েছিল।

এখানে, গোষ্ঠীর জন্য মূল প্রভাব অন্তর্ভুক্ত করার প্রয়োজন নেই, কারণ বেসলাইনগুলিতে, গ্রুপগুলি এলোমেলোকরণের কারণে সংজ্ঞা অনুসারে সমতুল্য।

একজন অবশ্যই তর্ক করতে পারে যে গ্রুপের জন্য মূল প্রভাবটি এখনও অন্তর্ভুক্ত করা উচিত, যাতে যদি এলোমেলোকরণ ব্যর্থ হয় তবে এটি বিশ্লেষণ দ্বারা প্রকাশিত হবে। যাইহোক, এটি একে অপরের বিরুদ্ধে দুটি গ্রুপের বেসলাইন উপায়গুলি পরীক্ষা করার সমতুল্য। এবং প্রচুর লোক রয়েছে যারা এলোমেলোভাবে পড়াশুনায় বেসলাইন পার্থক্যের জন্য পরীক্ষার বিষয়ে ভ্রান্ত হয়েছিলেন (অবশ্যই, এখানে প্রচুর পরিমাণে রয়েছে যারা এটি দরকারী বলে মনে করেন, তবে এটি অন্য একটি বিষয়)।


4
যখন সময় শূন্য (বেসলাইন) পরিমাপ প্রথম প্রতিক্রিয়া পরিবর্তনশীল হিসাবে ব্যবহৃত হয় তখন সমস্যা দেখা দেয়। বেসলাইনটি প্রায়শই অধ্যয়নের জন্য প্রবেশের মানদণ্ড হিসাবে ব্যবহৃত হয়। উদাহরণস্বরূপ, একটি সমীক্ষায় সিস্টোলিক রক্তচাপ (বিপি)> 140 আক্রান্ত রোগীদের তালিকাভুক্ত করা যেতে পারে, তারপরে এলোমেলো আকারে 2 বিপি চিকিত্সা করুন এবং বিপিএস অনুসরণ করুন। প্রাথমিকভাবে, বিপির একটি ছাঁটাই বিতরণ রয়েছে এবং পরবর্তী পরিমাপগুলি আরও প্রতিসাম্যযুক্ত হবে। একই মডেলের 2 বিতরণ আকারগুলিতে মডেল করা অগোছালো। বেসলাইনটি কোভারিয়েট হিসাবে বেসলাইনটিকে আচরণ করার আরও অনেক কারণ রয়েছে many
ফ্রাঙ্ক হ্যারেল

3
এটি একটি ভাল বিষয়, তবে সাম্প্রতিক গবেষণাগুলি বোঝায় যে এটি কোনও সমস্যা নয়। প্রকৃতপক্ষে, মনে হয় যে কোভারিয়েট হিসাবে বেসলাইন স্কোরগুলি ব্যবহার করার আরও অসুবিধা রয়েছে। দেখুন: লিউ, জিএফ, ইত্যাদি। (2009)। ক্লিনিকাল ট্রায়ালগুলিতে বেসলাইন থেকে পরিবর্তনের বিশ্লেষণে বেসলাইনটি কোনও সমবায় বা নির্ভরশীল পরিবর্তনশীল হওয়া উচিত? মেডিসিনে পরিসংখ্যান, 28, 2509-2530।
ওল্ফগ্যাং

3
আমি এই কাগজ পড়েছি। এটি বিশ্বাসযোগ্য নয় এবং লিউ আমি বর্ণিত বিভিন্ন ধরণের ক্লিনিকাল ট্রায়াল পরিস্থিতি নিয়ে অধ্যয়ন করেনি। সিরিয়াল (অনুদৈর্ঘ্য) তথ্য বিশ্লেষণ সম্পর্কে অধ্যায়ে আরও যুক্তি বায়োস্ট্যাট.এমসি.ভ্যান্ডার্বিল্ট.ইডু / উইকি / পব / মাইন / আরএমএস / কোর্স 2.pdf এ রয়েছে।
ফ্র্যাঙ্ক হ্যারেল

1
লিঙ্কের জন্য ধন্যবাদ। আমি ধরে নিচ্ছি আপনি 8.2.3 এর অধীনে আলোচনার কথা উল্লেখ করছেন। সেগুলি কিছু আকর্ষণীয় বিষয়, তবে আমি মনে করি না এটি একটি নির্দিষ্ট উত্তর দেয়। আমি নিশ্চিত যে লিউ এট আল এর কাগজটি। হয় চূড়ান্ত উত্তর নয়, তবে এটি উদাহরণস্বরূপ প্রস্তাব দেয় যে বেসলাইন মানগুলির স্বাভাবিকতা কোনও গুরুত্বপূর্ণ বিষয় নয়। হতে পারে এটি পৃথক আলোচনার আইটেমের জন্য এটি, কারণ এটি সরাসরি ওপি-র প্রশ্নের সাথে সম্পর্কিত নয়।
ওল্ফগ্যাং

2
হ্যাঁ, এটি সাধারণ-অ-স্বাভাবিকতার পরিমাণের উপর নির্ভর করে। কোনও মডেল তৈরি করার সময় সৌভাগ্যের উপর কেন নির্ভর করে? সময় শূন্য পরিমাপকে বেসলাইন পরিমাপ হিসাবে বিবেচনা করার জন্য বিশুদ্ধভাবে দার্শনিক কারণও রয়েছে (আমার নোটগুলিতে সেন এবং রোচনের উদ্ধৃতি দেখুন)।
ফ্র্যাঙ্ক হ্যারেল

19

মডেলটিতে প্রধান প্রভাবগুলি রাখার কারণটি শনাক্তকরণের জন্য। অতএব, যদি উদ্দেশ্যটির প্রতিটি প্রভাব সম্পর্কে পরিসংখ্যানগত অনুমান হয় তবে আপনার উচিত মডেলগুলিতে প্রধান প্রভাবগুলি। তবে, যদি আপনার মডেলিংয়ের উদ্দেশ্যটি কেবলমাত্র নতুন মানগুলির পূর্বাভাস দেওয়া হয়, তবে এটি যদি ভবিষ্যদ্বাণীমূলক নির্ভুলতার উন্নতি করে তবে কেবল ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা পুরোপুরি বৈধ।


5
আপনি দয়া করে সনাক্তকরণের সমস্যা সম্পর্কে আরও কিছুটা স্পষ্ট হয়ে উঠতে পারেন?
ocram

6
আমি বিশ্বাস করি না যে মুখ্য প্রভাবগুলি বাদ দেওয়া কোনও মডেল অগত্যা অজ্ঞাত। সম্ভবত আপনি "সনাক্তকরণযোগ্যতা" (যা একটি সুনির্দিষ্ট সংজ্ঞা সহ প্রযুক্তিগত শব্দ) এর চেয়ে "ব্যাখ্যাযোগ্যতা" বলতে চাইছেন
জেএমএস

6
@ জেএমএস: হ্যাঁ, এটি ব্যাখ্যাকে মেরে ফেলেছে। তবে, "পরিচয়যোগ্যতা" শব্দটি পরিসংখ্যানবিদরা এবং সমাজ বিজ্ঞানীরা পৃথকভাবে ব্যবহার করেছেন। আমি বোঝাতে চেয়েছি দ্বিতীয়টি, যেখানে (আলগাভাবে কথা বলতে) আপনি একটি নির্দিষ্ট নির্মাণের সাথে প্রতিটি পরিসংখ্যান পরামিতি সনাক্ত করতে চান। মূল প্রভাবটি ফেলে দিয়ে আপনি আর প্যারামিটারের সাথে আর মিলতে পারবেন না।
গ্যালিট শমুয়েলি

13

এটি অন্যদের দেওয়া অনেক জবাবের মধ্যে অন্তর্ভুক্ত তবে সাধারণ বিষয়টি হ'ল মডেলগুলি ডাব্লু / একটি পণ্য পদ তবে ডাব্লু / ও ডাব্লু / ও মডারেটর এবং ভবিষ্যদ্বাণীকারী কেবল ভিন্ন মডেল। আপনি মডেলিংয়ের যে প্রক্রিয়া দেওয়া হয়েছে তার প্রতিটি কী বোঝায় এবং আপনার তত্ত্ব বা অনুমানটি বিবেচনা করে একজন মডেল ডাব্লু / ও মডারেটর এবং প্রেডিকটর আরও বোধগম্য কিনা তা নির্ধারণ করুন। পণ্যের পরিভাষাটি গুরুত্বপূর্ণ তা পর্যবেক্ষণ করলেও কেবল যখন মডারেটর এবং ভবিষ্যদ্বাণীকারীকে অন্তর্ভুক্ত করা হয় না তখন আপনাকে কিছুই বলে না (সম্ভবত আপনি "তাত্পর্য" হিসাবে মাছ ধরছেন) ডাব্লু / ওএ কেন তাদের ছেড়ে চলে যাওয়ার ইচ্ছাকৃত ব্যাখ্যা রয়েছে তার বিশদ বিবরণ ।


আমি এখানে একটি গুরুত্বপূর্ণ ইন্টারঅ্যাকশন শর্তের উপস্থিতিতে প্রধান প্রভাবগুলির ব্যাখ্যা অনুসন্ধান করতে এসেছি এবং এই উত্তরটি সত্যিই অনেক সাহায্য করেছিল। ধন্যবাদ!
প্যাট্রিক উইলিয়ামস

9

যুক্তিযুক্তভাবে, আপনি কীসের জন্য আপনার মডেলটি ব্যবহার করছেন তা নির্ভর করে। তবে হাইপোথিসিস কেবল ইন্টারঅ্যাকশন সম্পর্কিত এমন ক্ষেত্রে এমনকি মূল প্রভাবগুলির সাথে মডেলগুলি চালনা এবং বর্ণনা না করার কারণ আমি কখনও দেখিনি।


যদি মূল প্রভাবগুলি মডেলটিতে না থাকে তবে ইন্টারঅ্যাকশনটি কেবল তাৎপর্যপূর্ণ হলে কী হবে?
গ্লেন

3
@ গ্লেন - পরিসংখ্যানগত তাত্পর্য বাদে অন্য অনেক বিষয় চিন্তা করতে হবে। এই দেখুন । আপনার সামগ্রিক মডেল ফিট (আপনার উপযুক্ত প্রতিটি মডেলের জন্য আপনার ভবিষ্যদ্বাণীগুলির বিরুদ্ধে আপনার অবশিষ্টাংশের পরিকল্পনা করুন), আপনার তত্ত্ব এবং মডেলিংয়ের জন্য আপনার অনুপ্রেরণাগুলি পরীক্ষা করা আরও ভাল।
মাইকেল বিশপ

7

আমি বই থেকে একটি অনুচ্ছেদ ধার করবে Stata ব্যবহার বেঁচে থাকা বিশ্লেষণ একটি উপস্থাপনা দ্বারা M.Cleves, R.Gutierrez, W.Gould, Y.Marchenko সম্পাদিত Stata প্রেস আপনার প্রশ্নের উত্তর দিতে।

এটি সাধারণভাবে পড়তে পারা যায় যে ইন্টারঅ্যাকশন ইফেক্টগুলি কেবলমাত্র মডেলটিতে অন্তর্ভুক্ত করা উচিত যখন সংশ্লিষ্ট মূল প্রভাবগুলিও অন্তর্ভুক্ত থাকে তবে নিজের দ্বারা মিথস্ক্রিয়া প্রভাবগুলি অন্তর্ভুক্ত করার সাথে কোনও ভুল নেই। [...] একজন গবেষকের লক্ষ্য হ'ল সমস্যাটি বিবেচনা করে এবং কেবলমাত্র একটি প্রেসক্রিপশন অনুসরণ না করে ডেটাগুলির পক্ষে যথাযথভাবে সত্য হওয়ার সম্ভাবনা রয়েছে বলে প্যারামিট্রাইজ করা।


3
একেবারে ভয়ানক পরামর্শ।
ফ্র্যাঙ্ক হ্যারেল

3
@ ফ্র্যাঙ্ক, আপনার মন্তব্যটি প্রসারিত করতে আপনি কি মনে করবেন? এর মুখোমুখি, "ডেটাগুলির পক্ষে যথাযথ হওয়ার সম্ভাব্য কারণগুলি প্যারামিটারাইজ করুন" অনেক অর্থবোধ করে।
শুক্র

6
Stats.stackexchange.com / জিজ্ঞাসা / 11009/ … দেখুন । তথ্যটি আপনাকে সত্য বলার ক্ষেত্রে অক্ষম এবং এই ধরণের পদ্ধতির পরিবর্তনশীলগুলি গুণিত করার জন্য পরিমাপের উত্সের উপর খুব বেশি নির্ভর করে। ফারেনহাইটের তাপমাত্রার বিচ্ছিন্ন মিথস্ক্রিয়া প্রতিক্রিয়ার মূল্যায়ন সেলসিয়াস ব্যবহার না করে আলাদা চিত্র দেবে।
ফ্রাঙ্ক হ্যারেল

@ ফ্র্যাঙ্ক: ধন্যবাদ, আমি এটি পেয়েছি :-)। এটি এখন এই থ্রেডের অংশ।
হোয়বার

7

এক্স এবং y উভয়ই xy এর সাথে সম্পর্কিত হবে (যদি না আপনি কেন্দ্রীকরণ ব্যবহার করে এটি প্রতিরোধের জন্য একটি নির্দিষ্ট ব্যবস্থা গ্রহণ না করেন)। সুতরাং আপনি যদি আপনার পদ্ধতির সাথে উল্লেখযোগ্য ইন্টারঅ্যাকশন প্রভাব অর্জন করেন তবে এটি ইন্টারঅ্যাকশন হিসাবে ছড়িয়ে পড়া এক বা একাধিক প্রধান প্রভাবের পরিমাণ হয়ে দাঁড়াবে। এটি পরিষ্কার, ব্যাখ্যাযোগ্য ফলাফল আনতে যাচ্ছে না। এক্স , ওয়াই এবং (পরবর্তী পর্যায়ে পরবর্তী পর্যায়ে ) এক্সকে অন্তর্ভুক্ত করে মূল প্রভাবগুলি কী কী এবং এর উপরে কীভাবে ইন্টারঅ্যাকশনটি ব্যাখ্যা করতে পারে তা দেখার পরিবর্তে কাঙ্ক্ষিত ।

পরিভাষা হিসাবে: হ্যাঁ, β 0 কে "ধ্রুবক" বলা হয়। অন্যদিকে, "আংশিক" প্রতিরোধের নির্দিষ্ট অর্থ রয়েছে এবং তাই আমি এখানে আপনার কৌশলটি বর্ণনা করতে সেই শব্দটি ব্যবহার করব না।

নীল চাঁদে একবার উত্থিত কিছু আকর্ষণীয় উদাহরণ এই থ্রেডে বর্ণিত হয়েছে


7

আমি এটি কেবল মডেল অনিশ্চয়তার একটি বিশেষ ক্ষেত্রে পরামর্শ দেব। বায়েশীয় দৃষ্টিকোণ থেকে আপনি অন্যভাবে যে কোনও ধরনের অনিশ্চয়তার আচরণ করবেন, ঠিক তেমনভাবে আপনি এটিকে ব্যবহার করেন:

  1. যদি এটি আগ্রহের বিষয় হয় তবে এর সম্ভাবনা গণনা করা হচ্ছে
  2. এটি আগ্রহী না হলে এটি একীভূত বা গড় গড়ে তোলা, তবে এটি এখনও আপনার সিদ্ধান্তে প্রভাব ফেলতে পারে

সাধারণ কোয়ান্টাইলের পরিবর্তে টি-কোয়ান্টাইল ব্যবহার করে "উল্লেখযোগ্য প্রভাবগুলি" পরীক্ষা করার সময় লোকেরা ঠিক এটি করে। কারণ "সত্যিকারের শব্দ স্তর" সম্পর্কে আপনার অনিশ্চয়তা রয়েছে কারণ আপনি পরীক্ষায় আরও ছড়িয়ে পড়া বিতরণ ব্যবহার করে এটিকে বিবেচনায় রাখেন। সুতরাং আপনার দৃষ্টিকোণ থেকে "মূল প্রভাব" আসলে আপনি যে প্রশ্নটি জিজ্ঞাসা করছেন সে সম্পর্কে একটি "উপদ্রব পরামিতি"। সুতরাং আপনি কেবল দু'টি কেসটি গড়ুন (বা আরও সাধারণভাবে, আপনি যে মডেলগুলি বিবেচনা করছেন তার উপরে)। সুতরাং আমার কাছে (অস্পষ্ট) হাইপোথিসিস হবে:

Hint:The interaction between A and B is significant
আমি বলব যে সুনির্দিষ্টভাবে সংজ্ঞায়িত না হলেও এটি আপনি এখানে উত্তর দিতে চান এমন প্রশ্ন। এবং মনে রাখবেন যে এটি মৌখিক বিবৃতি যেমন উপরের অনুমানটিকে "সংজ্ঞায়িত" করে না, তবে গাণিতিক সমীকরণগুলিও নয়। আমাদের কাছে কিছু তথ্য , এবং পূর্ববর্তী তথ্য , তারপরে আমরা সহজেই গণনা করি: (ছোট দ্রষ্টব্য: আমি এই সমীকরণটি যতবার লিখি না কেন, এটি আমাকে সর্বদা সমস্যাটি আরও ভালভাবে বুঝতে সহায়তা করে we অদ্ভুত)। গণনা করার মূল পরিমাণটি হ'ল সম্ভাবনা , এটি মডেলটির কোনও উল্লেখ করে না, সুতরাং মডেলটিকে অবশ্যই মোট সম্ভাবনার আইন ব্যবহার করে সরিয়ে নেওয়া উচিত: I P ( H i n t | D I ) = P ( H i n t | I ) P ( D | H i n t I )DI
P(Hint|DI)=P(Hint|I)P(D|HintI)P(D|I)
P(D|HintI)
P(D|HintI)=m=1NMP(DMm|HintI)=m=1NMP(Mm|HintI)P(D|MmHintI)
কোথায় ইনডেক্স mth মডেল এবং হয় বিবেচনা করা হচ্ছে মডেল সংখ্যা। প্রথম শব্দটি হ'ল "মডেল ওজন" যা বলে যে ডেটা এবং পূর্বের তথ্যগুলি গণিতের মডেলটিকে কতটা সমর্থন করে। দ্বিতীয় শব্দটি mth মডেলটি অনুমানকে কতটা সমর্থন করে তা নির্দেশ করে। এই সমীকরণটি মূল বেয়েস উপপাদ্যটিতে আবার প্লাগ করে দেয়: MmNM
P(Hint|DI)=P(Hint|I)P(D|I)m=1NMP(Mm|HintI)P(D|MmHintI)
=1P(D|I)m=1NMP(DMm|I)P(MmHintD|I)P(DMm|I)=m=1NMP(Mm|DI)P(Hint|DMmI)

এবং আপনি এ থেকে দেখতে পাচ্ছেন যে মডেলের অধীনে অনুমানের "শর্তসাপেক্ষ উপসংহার" (এটি সাধারণত নির্বাচিত "সেরা" মডেলের জন্য বিবেচিত হয়) )। মনে রাখবেন যে এই স্ট্যান্ডার্ড বিশ্লেষণ যখনই - একটি "স্পষ্টতই সেরা" মডেল - বা যখনই - সমস্ত মডেল একই / অনুরূপ উপসংহার দেয়। তবে যদি উভয়কেই পূরণ না করা হয়, তবে বেয়েসের উপপাদ্য বলেছেন যে ফলাফলগুলি নির্ধারণের সর্বোত্তম পদ্ধতি হ'ল মডেলগুলির উপর উচ্চতর ওজন রাখা যা ডেটা এবং পূর্বের তথ্য দ্বারা সর্বাধিক সমর্থিত।পি ( এম এম | ডি আমি ) 1 পি ( এইচ আমি এন টি | ডি এম আমি ) পি ( এইচ আমি এন t | ডি এম আমি )P(Hint|DMmI)P(Mm|DI)1P(Hint|DMjI)P(Hint|DMkI)


5

এর সাথে জড়িত মূল প্রভাব ব্যতীত কোনও ইন্টারঅ্যাকশন শব্দটিকে অন্তর্ভুক্ত করা খুব কমই একটি ভাল ধারণা। সিসিএনওয়াইয়ের ডেভিড রিন্ডস্কোফ এই বিরল দৃষ্টান্তগুলি সম্পর্কে কিছু কাগজ লিখেছেন।


5

প্রকৃতিতে এমন বিভিন্ন প্রক্রিয়া রয়েছে যা কেবলমাত্র একটি মিথস্ক্রিয়া প্রভাব এবং আইনগুলি তাদের ডিক্রিবিযুক্ত করে। উদাহরণস্বরূপ ওহমের আইন। মনোবিজ্ঞানে আপনার উদাহরণস্বরূপ ভর্মের পারফরম্যান্সের মডেল রয়েছে (1964): পারফরম্যান্স = দক্ষতা x মোটিভেশন ow এখন, এই আইনটি সত্য হলে আপনি একটি গুরুত্বপূর্ণ ইন্টারঅ্যাকশন প্রভাব খুঁজে পেতে আশা করতে পারেন। আফসোস, এই ক্ষেত্রে হয় না। আপনি সহজেই দুটি প্রধান প্রভাব এবং একটি তাত্পর্যপূর্ণ মিথস্ক্রিয়া প্রভাব খুঁজে পেতে শেষ করতে পারেন (একটি বিক্ষোভ এবং আরও ব্যাখ্যা জন্য ল্যান্ডশিয়ার, ভ্যান ডেন উইটেনবোয়ার এবং ম্যাসেন (2006), সামাজিক বিজ্ঞান গবেষণা 35, 274-294) দেখুন। লিনিয়ার মডেল ইন্টারঅ্যাকশন প্রভাবগুলি সনাক্ত করার জন্য খুব ভাল উপযুক্ত নয়; যখন তিনি লিনিয়ার মডেলগুলি ব্যবহার করতেন তখন ওহম তার আইন খুঁজে পেতে পারেন নি।

ফলস্বরূপ, রৈখিক মডেলগুলিতে মিথস্ক্রিয়া প্রভাবগুলি ব্যাখ্যা করা শক্ত। আপনার যদি এমন কোনও তত্ত্ব থাকে যা একটি মিথস্ক্রিয়া প্রভাবের পূর্বাভাস দেয় তবে তা তুচ্ছ হলেও আপনাকে অন্তর্ভুক্ত করা উচিত। আপনার তত্ত্বটি যদি এগুলি বাদ দেয় তবে আপনি প্রধান প্রভাবগুলি উপেক্ষা করতে চাইতে পারেন, তবে আপনি সেই কঠিনটি দেখতে পাবেন, কারণ একটি মূল গুণগুলি প্রায়শই একটি সত্যিকারের ডেটা উত্পাদনকারী ব্যবস্থার ক্ষেত্রে পাওয়া যায় যা কেবলমাত্র একটি গুণগত প্রভাব রাখে।

আমার উত্তরটি হ'ল: হ্যাঁ, প্রধান প্রভাবগুলি অন্তর্ভুক্ত না করে কোনও মডেলটিতে দ্বি-মুখী ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা বৈধ হতে পারে। লিনিয়ার মডেলগুলি বিপুল পরিমাণে ডেটা উত্পাদনকারী প্রক্রিয়াগুলির ফলাফলগুলি অনুমান করার জন্য দুর্দান্ত সরঞ্জাম, তবে তাদের সূত্রটি সহজেই ডেটা উত্পন্নকরণের ব্যবস্থার বৈধ বিবরণ হিসাবে ব্যাখ্যা করা যায় না।


4

এটি আমার পক্ষে অত্যন্ত জটিল এবং আমার শেষ প্রকল্পে ঘটেছিল। আমি এটি এইভাবে ব্যাখ্যা করব: আসুন আপনাকে বলতে পারি যে আপনার এবং ভেরিয়েবলগুলি স্বতন্ত্রভাবে উল্লেখযোগ্যভাবে বেরিয়ে এসেছিল এবং ব্যবসায়িক অর্থে আপনি ভেবেছিলেন যে এ এবং বি এর মিথস্ক্রিয়াটি ভাল বলে মনে হচ্ছে। আপনি ইন্টারঅ্যাকশনটি অন্তর্ভুক্ত করেছিলেন যা তাৎপর্যপূর্ণ বলে প্রমাণিত হয়েছিল তবে বি এর তাত্পর্য হারাতে বসেছে। আপনি দুটি ফলাফল দেখিয়ে প্রাথমিকভাবে আপনার মডেলটি ব্যাখ্যা করবেন। ফলাফলগুলি দেখায় যে প্রাথমিকভাবে বি তাৎপর্যপূর্ণ ছিল তবে এ এর ​​আলোকে দেখা গেলে এটি তার চকচকে ক্ষতিগ্রস্ত হয়। সুতরাং বি একটি ভাল পরিবর্তনশীল তবে কেবলমাত্র এ এর ​​বিভিন্ন স্তরের আলোতে দেখা গেলে (যদি এটি শ্রেণিবদ্ধ পরিবর্তনশীল হয়)। এর সিল আর্মির আলোকে দেখা গিয়ে ওবামাকে বলা ভাল নেতা। সুতরাং ওবামা * সিল একটি উল্লেখযোগ্য পরিবর্তনশীল হবে। তবে ওবামাকে যখন একা দেখা যায় ততটা গুরুত্বপূর্ণ হতে পারে না। (ওবামার কোনও অপরাধ নয়, এটি একটি উদাহরণ।)


1
এখানে এটি বিপরীত ধরনের। মিথস্ক্রিয়া (আগ্রহের) কেবল তখনই তাৎপর্যপূর্ণ যখন মূল প্রভাবগুলি মডেলটিতে না থাকে।
গ্লেন

3

এফ = মি * এ, শক্তি ভর বারের ত্বরণের সমান।

এটি F = m + a + ma, বা those পরামিতিগুলির কিছু অন্যান্য রৈখিক সংমিশ্রণ হিসাবে প্রতিনিধিত্ব করা হয় না। প্রকৃতপক্ষে, ভর এবং ত্বরণের মধ্যে কেবল ইন্টারঅ্যাকশন শারীরিকভাবে অর্থবোধ করবে।


2
পরিবর্তনীয়তার জন্য কোনও স্থান নেই এমন একটি অবিচ্ছিন্ন পদার্থবিজ্ঞানের সমীকরণের ক্ষেত্রে যা প্রযোজ্য তা প্রযোজ্য নয় বা পরিবর্তনশীলতার বৈশিষ্ট্যযুক্ত ডেটা মডেলিংয়ের সময় প্রয়োজনীয় সত্য বা নির্ভুল বা উত্পাদনশীল নয়।
রোল্যান্ডো 2

2

প্রধান প্রভাব এবং এর সাথে মিথস্ক্রিয়া।  নীল একটি শর্ত।  অন্য একটি লাল।  তাদের সম্পর্কিত প্রভাব পরপর তিনটি পরিমাপের উপর পরীক্ষা করা হয়।

মূল প্রভাব ছাড়াই দ্বি-মুখী মিথস্ক্রিয়াটি অন্তর্ভুক্ত করা কি কখনও বৈধ?

হ্যাঁ এটি বৈধ এবং এমনকি প্রয়োজনীয় হতে পারে। উদাহরণস্বরূপ যদি ২। আপনি প্রধান প্রভাবের জন্য একটি কারণকে অন্তর্ভুক্ত করবেন (নীল বনাম লাল অবস্থার গড় পার্থক্য) এটি মডেলটিকে আরও খারাপ করে দেবে।

যদি আপনার হাইপোথিসিসটি কেবল ইন্টারঅ্যাকশন সম্পর্কে হয় তবে কী আপনার এখনও প্রধান প্রভাবগুলি অন্তর্ভুক্ত করতে হবে?

আপনার অনুমানটি সত্যিকারের সত্য হতে পারে সেখানে প্রধান প্রভাব রয়েছে। অন্তর্নিহিত প্রক্রিয়াটি সর্বোত্তমভাবে বর্ণনা করার জন্য মডেলটির এটির প্রয়োজন হতে পারে। সুতরাং হ্যাঁ, আপনার সাথে এবং বাইরে চেষ্টা করা উচিত।

দ্রষ্টব্য: আপনাকে "অবিচ্ছিন্ন" স্বতন্ত্র ভেরিয়েবলের জন্য কোডটি কেন্দ্রের প্রয়োজন (উদাহরণে পরিমাপ)। অন্যথায় মডেলের ইন্টারঅ্যাকশন সহগগুলি প্রতিসাম্যভাবে বিতরণ করা হবে না (উদাহরণে প্রথম পরিমাপের জন্য সহগ নেই)।


1

যদি প্রশ্নের ভেরিয়েবলগুলি শ্রেণিবদ্ধ হয়, তবে প্রধান প্রভাবগুলি ছাড়াই ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা কেবলমাত্র মডেলটির পুনঃনির্মাণ এবং আপনার পরামিতিটি কীভাবে অর্জন করতে চাইছেন তার উপর প্যারামিটারাইজেশন চয়ন করা নির্ভর করে। শ্রেণিবদ্ধ ভেরিয়েবলগুলির সাথে অন্যান্য ধারাবাহিক ভেরিয়েবল আকরের সাথে অবিচ্ছিন্ন ভেরিয়েবলের সাথে যোগাযোগ করা সম্পূর্ণ ভিন্ন গল্প। দেখুন: ইউসিএলএর ইনস্টিটিউট ফর ডিজিটাল গবেষণা এবং শিক্ষা থেকে এই প্রশ্নটি দেখুন


1

হ্যাঁ এটি বৈধ হতে পারে, যদিও এটি বিরল। তবে এই ক্ষেত্রে আপনাকে এখনও প্রধান প্রভাবগুলির মডেল করতে হবে যা আপনি পরে পুনরায় প্রকাশ করতে পারবেন।

আসলে, কিছু মডেলগুলিতে কেবল ইন্টারঅ্যাকশন আকর্ষণীয়, যেমন ড্রাগ টেস্টিং / ক্লিনিকাল মডেল। এটি উদাহরণস্বরূপ জেনারেলাইজড সাইকো ফিজিওলজিকাল ইন্টারঅ্যাকশনস (জিপিপিআই) মডেলের ভিত্তি: y = ax + bxh + chযেখানে ভক্সেল x/y/ আগ্রহের অঞ্চল এবং hব্লক / ইভেন্ট ডিজাইন রয়েছে।

এই মডেলটিতে, উভয়ই aএবং পুনরায় চাপ দেওয়া cহবে, কেবল অনুক্রমের bজন্য রাখা হবে (বিটা সহগ)। প্রকৃতপক্ষে, উভয় aএবং cআমাদের ক্ষেত্রে উত্সাহী ক্রিয়াকলাপ প্রতিনিধিত্ব করে, এবং শুধুমাত্র bউত্সাহব্যঞ্জক ক্রিয়াকলাপ, টাস্কের সাথে মিথস্ক্রিয়া দ্বারা যা ব্যাখ্যা করা যায় না তা উপস্থাপন করে।


1

সংক্ষিপ্ত উত্তর: আপনি যদি স্থির প্রভাবগুলিতে মিথস্ক্রিয়াটি অন্তর্ভুক্ত করেন তবে মূল প্রভাবগুলি আপনি নিজের কোডটিতে সুনির্দিষ্টভাবে অন্তর্ভুক্ত করবেন কিনা তা স্বয়ংক্রিয়ভাবে অন্তর্ভুক্ত । একমাত্র পার্থক্য হ'ল আপনার প্যারামিট্রাইজেশন, অর্থাত্, আপনার মডেলের প্যারামিটারগুলি কী বোঝায় (উদাহরণস্বরূপ, তারা কি গ্রুপের অর্থ হয় বা তারা রেফারেন্স স্তর থেকে পৃথক হয়)।

ABA+B+ABAB

YN(ξ,σ2In)XAXBXABξ{XA,XB,XAB}ξ{XAB}{XAB}={XA,XB,XAB}

আমি কেবল দেখেছি যে ডেভিড বিদি একটি খুব অনুরূপ উত্তর দিয়েছেন (ক্ষমা প্রার্থনা), তবে আমি ভেবেছিলাম যে আমি তাদের জন্য এটি ছেড়ে দেব যারা একটি লিনিয়ার বীজগণিতের দৃষ্টিকোণে ভাল সাড়া দেয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.