মাল্টিভারিয়েট রিগ্রেশন এর আগে ইউনিভারিটিভ রিগ্রেশন এর বিন্দু কী?


13

আমি বর্তমানে এমন একটি সমস্যায় কাজ করছি যার মধ্যে আমাদের একটি ছোট ডেটাসেট রয়েছে এবং ফলাফলের কোনও চিকিত্সার কার্যকারিতা প্রভাব সম্পর্কে আগ্রহী।

আমার পরামর্শদাতা আমাকে প্রতিক্রিয়া হিসাবে ফলাফল, তারপরে প্রতিক্রিয়া হিসাবে চিকিত্সা বরাদ্দ হিসাবে প্রতিটি ভবিষ্যদ্বাণী সম্পর্কে অবিচ্ছিন্ন রিগ্রেশন সঞ্চালনের নির্দেশ দিয়েছেন has অর্থাৎ, আমাকে একবারে একটি ভেরিয়েবলের সাথে একটি রিগ্রেশন ফিট করতে এবং ফলাফলগুলির একটি টেবিল তৈরি করতে বলা হচ্ছে। আমি জিজ্ঞাসা করলাম "আমরা এটি করা উচিত কেন?", এবং এর উত্তরটি "আমরা আগ্রহী যার মধ্যে ভবিষ্যদ্বাণীকারীরা চিকিত্সা কার্যভারের সাথে সম্পর্কিত এবং ফলাফলের সাথে জড়িত, কারণ এটি সম্ভবত বিভ্রান্তকারীকে নির্দেশ করবে" এর প্রতিক্রিয়াটির কিছু ছিল। আমার উপদেষ্টা একজন প্রশিক্ষিত পরিসংখ্যানবিদ, ভিন্ন ক্ষেত্রে বিজ্ঞানী নন, তাই আমি তাদের উপর আস্থা রাখতে আগ্রহী।

এটি অর্থবোধ করে, তবে কীভাবে অবিচ্ছিন্ন বিশ্লেষণের ফলাফলটি ব্যবহার করা যায় তা স্পষ্ট নয়। এই ফলাফল থেকে মডেল নির্বাচনের পছন্দগুলি কি অনুমান এবং সংকীর্ণ আত্মবিশ্বাসের বিরতিগুলির উল্লেখযোগ্য পক্ষপাতিত্ব করে না? কেন কেউ এই কাজ করা উচিত? আমি বিভ্রান্ত হয়ে পড়েছি এবং আমার উপদেষ্টা যখন বিষয়টি এনেছিলেন তখন বিষয়টি সম্পর্কে যথেষ্ট অস্বচ্ছ হয়ে উঠছে। কারও কি এই কৌশলটিতে সংস্থান আছে?

(এনবি: আমার পরামর্শদাতা বলেছেন যে আমরা পি-মানগুলি কাট কাট হিসাবে ব্যবহার করছি না, তবে আমরা "সবকিছু" বিবেচনা করতে চাই।)


6
যদি "অবিভাজনিত রিগ্রেশন" দ্বারা আপনার প্রশিক্ষকের মধ্যে একটি স্ক্র্যাটারপ্লট আঁকার অন্তর্ভুক্ত থাকে , তবে এটি অবশ্যই বুদ্ধিমান পরামর্শ। এবং যেহেতু আপনার কোনও ধরণের রিগ্রেশনের বিষয়ে চিন্তা করা কোন ষড়যন্ত্র ছাড়াই পরিচালিত করা উচিত নয়, আপনি কিছু দরকারী তথ্য পাবেন। এগুলি একবারে করুন, আপনি যদি পারেন তবে একটি স্ক্র্যাটারপ্লট ম্যাট্রিক্স দিয়ে এবং তাদের সাথে কিছু দৃust় মসৃণতা দেখান। সুবিধাগুলি সুস্পষ্ট হবে যখন আপনি বিভিন্নভাবে দেখেন যে আপনার পরিবর্তনশীল রৈখিক সম্পর্কের প্রদর্শন থেকে বিদায় নিতে পারে।
whuber

1
যদি প্রতিক্রিয়া ডেটা বাইনারি হয়, এবং আমরা লগইট লিঙ্কের সাথে কোনও গ্ল্যাম ব্যবহার করছি? আপনার ব্যাখ্যা অবশ্যই রৈখিক মামলার জন্য স্পষ্ট করছে, এবং এখন আমি এটি সম্পর্কে চিন্তা করি, বিক্ষিপ্ত প্লটের ব্যবহার প্রাকৃতিক হবে
মার্সেল

5
আমি উদ্বিগ্ন ছিলাম যে আপনি :-) জিজ্ঞাসা করতে পারেন। আসলে, একটি ভাল মসৃণ এখনও দুর্দান্ত অন্তর্দৃষ্টি প্রদান করতে পারে। এটি প্রতিক্রিয়াটিকে ঝাঁকুনিতে সহায়তা করে যাতে আপনি এর বিতরণ করতে পারেন। এই জাতীয় প্লটের উদাহরণ এখানে: stats.stackexchange.com/a/14501/919 । আমি stats.stackexchange.com/a/138660/919 এ অন্য একটি সমাধান চিত্রিত করেছি
হোবার

3
মাল্টিভেরিয়েবল রিগ্রেশন টেকনিকের আগে এই অবিচ্ছিন্ন রিগ্রেশনটিকে হোসমার এবং লেমেশোর বই "অ্যাপ্লাইড লজিস্টিক রিগ্রেশন"
গ্রেট 38

7
সাবধান - একটি পরিবর্তনশীল একটি অবাঞ্ছিত রিগ্রেশন কোনও সম্পর্ক না দেখায়, তবুও বহু সম্পর্কের ক্ষেত্রে গুরুত্বপূর্ণ হতে পারে।
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


3

আপনার বিশ্লেষণের কার্যকরী প্রসঙ্গটি আপনার প্রশ্নের মূল যোগ্যতা। পূর্বাভাসে, হোসমার এবং লেমেনশো প্রস্তাবিত "উদ্দেশ্যমূলক নির্বাচন পদ্ধতি" এর চেতনায় একাধিক সংযোজন পূর্বে অবিচ্ছিন্ন রিগ্রেশনগুলি পরিচালনা করার একটি লক্ষ্য রয়েছে। আপনার ক্ষেত্রে, যেখানে আপনি একটি কার্যকারণ মডেল তৈরি করছেন, একাধিক রিগ্রেশন চালানোর আগে অবিচ্ছিন্ন অঞ্চলগুলি চালনার সম্পূর্ণ ভিন্ন লক্ষ্য রয়েছে। আমার উত্তরোত্তর প্রসারিত করুন।

আপনার এবং আপনার প্রশিক্ষকের অবশ্যই একটি নির্দিষ্ট কার্যকারণ গ্রাফের কথা মনে রাখা উচিত। কার্যকারণ গ্রাফের টেস্টযোগ্য অন্তর্ভুক্ত থাকে। আপনার মিশনটি আপনার যে ডেটাসেটটি রয়েছে তা দিয়ে শুরু করা এবং কার্যকারণীয় মডেলটির কারণ হিসাবে এটি তৈরি করেছে back অবিচ্ছিন্ন চাপগুলি তিনি পরামর্শ দিয়েছিলেন যে আপনি সম্ভবত চালনা করেন যা আপনার মনে রাখা কার্যকারণ গ্রাফের প্রভাবগুলি পরীক্ষা করার প্রক্রিয়াটির প্রথম ধাপটি গঠন করে। মনে করুন যে আপনি বিশ্বাস করেন যে আপনার ডেটা নীচের গ্রাফটিতে চিত্রিত কার্যকারণ মডেল দ্বারা উত্পন্ন হয়েছিল। ধরুন আপনি E এর উপর D এর কার্যকারিতা সম্পর্কে আগ্রহী below নীচের গ্রাফটি পরীক্ষামূলকভাবে প্রভাব ফেলতে পারে, যেমন:

  • ই সম্ভবত ডি নির্ভরশীল
  • E এবং A সম্ভবত নির্ভরশীল
  • ই এবং সি সম্ভবত নির্ভরশীল
  • ই এবং বি সম্ভবত নির্ভরশীল
  • ই এবং এন সম্ভবত স্বাধীন

এখানে চিত্র বর্ণনা লিখুন

আমি উল্লেখ করেছি যে কার্যকারণ অনুসন্ধান প্রক্রিয়ায় এটি কেবল প্রথম পদক্ষেপ কারণ আপনি একবারে একাধিক রিগ্রেশন চালানো, বিভিন্ন ভেরিয়েবলের কন্ডিশনিং এবং পরীক্ষা নিরীক্ষার ফলাফলটি গ্রাফের সংশ্লেষের সাথে সামঞ্জস্যপূর্ণ কিনা তা পরীক্ষা করে নিলে আসল মজা শুরু হয়। উদাহরণস্বরূপ, উপরের গ্রাফটি সুপারিশ করে যে একবার আপনি ডি তে শর্ত সাপেক্ষে E এবং A অবশ্যই স্বতন্ত্র হতে হবে অন্য কথায়, আপনি যদি ডি এবং এ তে E পুনরায় চাপান এবং এটি দেখতে পাওয়া যায় যে A এর সহগটি শূন্যের সমান নয়, আপনি সিদ্ধান্তে পৌঁছবেন যে ই ডি এর উপর আপনার শর্তের পরে, এ এর ​​উপর নির্ভর করে এবং এর ফলে কার্যকারণ গ্রাফটি অবশ্যই ভুল হতে পারে। এমনকি এটি আপনার কার্যকারণ গ্রাফটি কীভাবে পরিবর্তন করতে পারে সে সম্পর্কে আপনাকে ইঙ্গিতও দেবে, কারণ এই নিগ্রহের ফলাফলটি সুপারিশ করে যে A এবং E এর মধ্যে এমন একটি পথ থাকতে হবে যা ডি দ্বারা বিভক্ত নয় must


1

আমি উত্তর দেওয়ার চেষ্টা করার আগে আমি সেই ধরণের ডেটা নির্দেশ করতে চাই এবং এর বিতরণ আপনি মূল্যায়ন / পুনরায় / শ্রেণিবদ্ধকরণের উপায়কে প্রভাবিত করতে পারে।

এছাড়াও আপনি তাকান করতে চাইবেন এখানে পদ্ধতি আপনার উপদেষ্টা আপনি ব্যবহার করতে চান তাদের জন্য।

কিছুটা ব্যাকগ্রাউন্ড। মডেল নির্বাচনের সরঞ্জামটি ব্যবহার করার সম্ভাবনা থাকা সত্ত্বেও, ভবিষ্যদ্বাণীকারীকে কেন ব্যবহার করা হয়েছিল বা ফেলে রাখা হয়েছিল তা এখনও আপনাকে বলতে সক্ষম হতে হবে। এই সরঞ্জামগুলি একটি কালো বাক্স হতে পারে। আপনার ডেটা সম্পূর্ণরূপে বোঝা উচিত এবং নির্দিষ্ট কোন ভবিষ্যদ্বাণী কেন বেছে নেওয়া হয়েছিল তা জানাতে সক্ষম হবেন। (বিশেষত, আমি একটি থিসিস / মাস্টার্স প্রকল্পের জন্য অনুমান করছি।)

উদাহরণস্বরূপ, বাড়ি এবং বয়স মূল্য দেখুন। বাড়ির দাম সাধারণত বয়সের সাথে সাথে হ্রাস পায়। অতএব আপনি যখন আপনার ডেটাতে একটি উচ্চ মূল্যের সাথে কোনও পুরানো বাড়ি দেখেন তখন এটি কোনও বহিরাগতকে অপসারণ করার মতো মনে হয় তবে এটি কেস নয়।

হিসাবে (এনবি: আমার উপদেষ্টা বলেছেন যে আমরা পি-মানগুলি একটি কাট অফ হিসাবে ব্যবহার করছি না, তবে আমরা "সবকিছু" বিবেচনা করতে চাই।) পি-মানগুলি সব কিছু নয় এবং সমস্ত কিছু শেষ করে তবে তারা সহায়ক হতে পারে । রিক্যাল অ্যালগরিদম / প্রোগ্রামগুলি সীমাবদ্ধ এবং পুরো ছবিটি দেখতে পারে না।

কেন আপনি প্রতিটি ভবিষ্যদ্বাণী / চিকিত্সা কার্যভারের প্রতি রিগ্রেশনকে অবিচ্ছিন্ন করতে পারেন।

এটি মৌলিক মাল্টিভারিয়েট মডেলটিতে অন্তর্ভুক্ত করার জন্য ভবিষ্যদ্বাণীকারীদের নির্বাচন করতে সহায়তা করতে পারে। সেই মৌলিক মডেলটি থেকে আপনি তখন দেখতে পাবেন যে সেই ভবিষ্যদ্বাণীকারীরা তাৎপর্যপূর্ণ এবং সেগুলি অবধি থাকা উচিত বা পার্সোনমিয়াস মডেল পাওয়ার লক্ষ্যে সেগুলি সরিয়ে নেওয়া উচিত।

অথবা আপনার পক্ষে ডেটা সম্পর্কে আরও ভাল ধারণা পাওয়া সম্ভব।


1
আমি এবং আমার স্ত্রী একটি পুরানো বাড়ি কিনেছিলাম তবে historicতিহাসিক বাড়িটি কিনতে পারি না, সুতরাং আপনার উদাহরণটির একটি সহজ পাল্টা উদাহরণ রয়েছে।
নিক কক্স

সত্য। আমি আসলে বাড়ির দাম সম্পর্কে কথা বলতে চাইছিলাম। বাড়ির দামগুলি সাধারণত বয়সের সাথে কীভাবে হ্রাস পায়। অতএব যখন আপনি একটি উচ্চ মূল্যের সাথে কোনও পুরানো বাড়ি দেখেন যা এটি অপসারণের মতো দেখায়। আমি যে পয়েন্ট সম্পাদনা করব। ধন্যবাদ.
অ্যাপোক্রিফোন

0

আমি মনে করি আপনার তত্ত্বাবধায়ক আপনাকে কোনও ভেরিয়েবল ডেটাতে তারতম্যের একটি উল্লেখযোগ্য ভগ্নাংশ ব্যাখ্যা করতে পারে কিনা তা সনাক্ত করার উদ্দেশ্যে ডেটাটির প্রথম বিশ্লেষণ করতে বলছে।

একবার আপনি এই সিদ্ধান্তে পৌঁছলেন যে কোনও ভেরিয়েবলের কিছু পরিবর্তনশীলতার ব্যাখ্যা দিতে পারলে আপনি কীভাবে তারা একত্রিত হয়ে কাজ করেন, যদি তারা কলিনিয়ার হয়, বা একে অপরের মধ্যে পারস্পরিক সম্পর্কযুক্ত ইত্যাদি মূল্যায়ন করতে পারেন তবে খাঁটি অনুসন্ধানের পর্যায়ে একটি বহুবিধ বিশ্লেষণ করার জন্য প্রথম মূল্যায়ন আরও শক্ত করে তুলতে পারে, কারণ প্রতিটি ভেরিয়েবল আপনি অন্যের প্রভাব সরিয়ে ফেলবেন। ভেরিয়েবলগুলির মধ্যে যে কোনও তারতম্যের ব্যাখ্যা দিতে পারে কিনা তা নির্ধারণ করা কঠিন হতে পারে।


0

এটি ডেটা বোঝার জন্য একটি পদ্ধতির হতে পারে, তবে অভিজ্ঞতা দেখায় যে আপনি যখন সমস্ত ভবিষ্যদ্বাণীকে একত্রিত করে এবং প্রত্যেকে প্রত্যেকে একে অপরের মাধ্যমে ভবিষ্যদ্বাণী করেন তখন ভবিষ্যদ্বাণীগুলি পৃথক হয়। এটি কেবলমাত্র আমরা ডেটার ভবিষ্যদ্বাণীকে বুঝতে পারি এবং বুঝতে পারি যে ভবিষ্যতের পদক্ষেপের জন্য কী করা দরকার।
আমি অনেকবার দেখেছি যখন সমস্ত ভেরিয়েবলের সাথে পি-ভ্যালু বলে যে কিছু ভেরিয়েবলগুলি তাত্পর্যপূর্ণ নয় তবে একা non অ-তাত্পর্যপূর্ণ ভেরিয়েবলগুলির সাথে তারা যথেষ্ট পরিমাণে তাত্পর্যপূর্ণ ছিল। এটি মিশ্র প্রভাবের কারণে: এটি আপনার তত্ত্বাবধায়ক ভুল নয়, তবে ডেটা বোঝার জন্য আমাদের এটি করতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.