একাধিক রিগ্রেশন করার সময় প্রেডিকটার ভেরিয়েবলগুলি কখন রূপান্তর করা যায়?


10

আমি বর্তমানে স্নাতক স্তরে আমার প্রথম প্রয়োগিত লিনিয়ার রিগ্রেশন ক্লাস নিচ্ছি, এবং একাধিক লিনিয়ার রিগ্রেশন প্রেডিক্টর ভেরিয়েবল ট্রান্সফর্মেশনগুলির সাথে লড়াই করছি। আমি যে পাঠ্যটি ব্যবহার করছি, কুটনার এট এবং "ফলিত লিনিয়ার স্ট্যাটিস্টিকাল মডেলস" মনে হচ্ছে এমন প্রশ্নটি পড়ে যাবেনা বলে মনে হচ্ছে। (একাধিক পূর্বাভাসককে রুপান্তর করার জন্য একটি বক্স-কক্স পদ্ধতি রয়েছে তা বোঝানো বাদে)।

যখন কোনও প্রতিক্রিয়ার ভেরিয়েবল এবং একাধিক পূর্বাভাসক ভেরিয়েবলের মুখোমুখি হয়, তখন প্রতিটি ভবিষ্যদ্বাণীকের পরিবর্তনশীল সাথে কোন শর্ত পূরণ করার চেষ্টা করে? আমি বুঝতে পারি আমরা শেষ পর্যন্ত ত্রুটি বৈকল্পের স্থায়িত্ব এবং সাধারণত বিতরণ করা ত্রুটিগুলি খুঁজছি (কমপক্ষে আমি এখনও অবধি যে কৌশলগুলি শিখিয়েছি তার মধ্যে।) আমার অনেক অনুশীলন ফিরে এসেছিল, যেখানে সমাধানটি ছিল, উদাহরণ হিসাবে y ~ x1 + (1/x2) + log(x3), যেখানে এক বা একাধিক ভবিষ্যদ্বাণী রূপান্তরিত হয়েছিল।

আমি সাধারণ লিনিয়ার রিগ্রেশন অনুসারে যুক্তিটি বুঝতে পেরেছিলাম, যেহেতু y and x1 এবং সম্পর্কিত ডায়াগোনস্টিকগুলি (অবশিষ্টাংশের কিউ প্লট, বনাম, y x1) আমাদের অনুমানগুলি আরও ভাল ফিট করুন।

অনেক ভবিষ্যদ্বাণীকের উপস্থিতিতে ভবিষ্যদ্বাণীকে কখন রূপান্তর করা যায় তা বোঝার জন্য কোনও ভাল জায়গা আছে?

তুমাকে অগ্রিম ধন্যবাদ. ঔজ্বল্যহীন

উত্তর:


3

আমি আপনার প্রশ্নটি গ্রহণ করি: আপনি যখন কীভাবে শনাক্ত করতে পারেন যে রূপান্তরগুলি যথাযথভাবে তৈরি করা হয় তখন যৌক্তিক শর্তগুলি কী তার চেয়ে বেশি থাকে । এক্সপ্লোরেশন, বিশেষত গ্রাফিকাল ডেটা এক্সপ্লোরেশন সহ ডেটা বিশ্লেষণ করে বেন্ডেন্ড করতে এটি সর্বদা দুর্দান্ত nice (বিভিন্ন পরীক্ষা নেওয়া যেতে পারে, তবে আমি এখানে গ্রাফিকাল ইডিএতে ফোকাস করব))

প্রতিটি ভেরিয়েবলের অবিচ্ছিন্ন বিতরণের প্রাথমিক পর্যালোচনার জন্য কার্নেল ডেনসিটি প্লট হিস্টোগ্রামের চেয়ে ভাল। একাধিক ভেরিয়েবলের সাহায্যে স্ক্র্যাপরপ্লট ম্যাট্রিক্স কার্যকর হতে পারে। শালীনতা সর্বদা শুরুতে পরামর্শ দেওয়া হয়। এই সম্পর্কগুলি প্রায় লিনিয়ার কিনা তা আপনাকে দ্রুত এবং মলিন চেহারা দেবে। জন ফক্সের গাড়ি প্যাকেজ কার্যকরভাবে এগুলিকে একত্রিত করে:

library(car)
scatterplot.matrix(data)

কলাম হিসাবে আপনার ভেরিয়েবল আছে তা নিশ্চিত হন। আপনার যদি অনেকগুলি ভেরিয়েবল থাকে তবে পৃথক প্লটগুলি ছোট হতে পারে। প্লট উইন্ডোটি সর্বাধিক করুন এবং স্ক্রেটারপ্লটগুলি আপনি পৃথকভাবে পরীক্ষা করতে চান এমন প্লটগুলি বেছে নিতে এবং তার পরে একক প্লট তৈরি করতে যথেষ্ট বড় হওয়া উচিত। যেমন,

windows()
plot(density(X[,3]))
rug(x[,3])
windows()
plot(x[,3], y)
lines(lowess(y~X[,3]))

একাধিক রিগ্রেশন মডেল ফিট করার পরে, আপনার সরল লিনিয়ার রিগ্রেশন যেমন ঠিক তেমনি আপনার ডেটাও প্লট করে পরীক্ষা করা উচিত। অবশিষ্টাংশের জন্য কিউকিউ প্লটগুলি যেমন প্রয়োজন তেমন প্রয়োজনীয়, এবং আপনি পূর্বের মতো একই পদ্ধতি অনুসরণ করে আপনার ভবিষ্যদ্বাণীদের বিরুদ্ধে আপনার অবশিষ্টাংশগুলির একটি স্ক্যাটারপ্ল্লট ম্যাট্রিক্স করতে পারেন।

windows()
qq.plot(model$residuals)
windows()
scatterplot.matrix(cbind(model$residuals,X))

যদি কোনও সন্দেহজনক মনে হয় তবে স্বতন্ত্রভাবে এটি প্লট করুন এবং abline(h=0)ভিজ্যুয়াল গাইড হিসাবে যুক্ত করুন । আপনার যদি কোনও মিথস্ক্রিয়া থাকে, আপনি একটি এক্স [, 1] * এক্স [, 2] ভেরিয়েবল তৈরি করতে এবং এর বিপরীতে অবশিষ্টগুলি পরীক্ষা করতে পারেন। অনুরূপভাবে, আপনি বনাম এক্স [, 3] ^ 2, ইত্যাদির অবশিষ্টাংশের একটি স্ক্র্যাপপ্লট তৈরি করতে পারেন। আপনার পছন্দসই বনাম এক্স এর চেয়ে অন্যান্য ধরণের প্লট একইভাবে করা যেতে পারে। মনে রাখবেন যে এগুলি সমস্ত এক্স এক্স মাত্রা উপেক্ষা করছে যা প্লট করা হচ্ছে না। যদি আপনার ডেটা গোষ্ঠীভুক্ত হয় (যেমন একটি পরীক্ষা থেকে), আপনি প্রান্তিক প্লটের পরিবর্তে / এর পরিবর্তে আংশিক প্লট তৈরি করতে পারেন।

আশা করি এইটি কাজ করবে.


2
আমি আরও প্রত্যক্ষ পদ্ধতির উত্সাহিত করব: ভবিষ্যদ্বাণীকারীদের প্রভাবগুলির মডেল করতে রিগ্রেশন স্প্লাইসগুলি ব্যবহার করুন যাতে (1) রৈখিকতা ধরে না নেওয়া এবং (2) একসাথে সমস্ত রূপান্তর অনুমান করা। এটি চতুর্ভুজীয় প্রতিরোধের অনুরূপ - সমস্ত ভবিষ্যদ্বাণীকারীদের জন্য একটি বর্গক্ষেত্র যুক্ত করে। সীমাবদ্ধ কিউবিক স্প্লাইজের সাহায্যে উদাহরণস্বরূপ, প্রতিটি ভবিষ্যদ্বাণীকে রৈখিকভাবে পরিচালনা করতে না জানা জন্য একজন মডেলটিতে এক বা একাধিক ননলাইনার ভিত্তিক ফাংশন যুক্ত করে।
ফ্র্যাঙ্ক হ্যারেল

@ ফ্র্যাঙ্ক আমি প্রায়শই সীমাবদ্ধ কিউবিক স্প্লাইন পছন্দ করি। একমাত্র নেতিবাচক ব্যাখ্যার মধ্যে একটি যা সামান্য কৌশল এবং প্রায়শই আমার ক্লায়েন্টদের বন্ধ করে দেয়। বহুবর্ষীয় শব্দ যুক্ত করা (কেন্দ্রীকরণের পরে) আরও ব্যাখ্যামূলক বলে মনে হয়
পিটার ফ্লুম

ইনপুটটির জন্য আপনাকে সকলকে ধন্যবাদ, আমি এটির প্রশংসা করি। আমি মনে করি আপনি বর্তমানে আমাকে অনেক বেশি ক্রেডিট দিচ্ছেন। আমার প্রশ্নটি আসলে / কখন কোনও রূপান্তর কার্যকর হয় তা জানতে পৃথক ভবিষ্যদ্বাণীকারীদের কী সন্ধান করতে হবে তা কেন্দ্র করে is উদাহরণস্বরূপ, যদি আমার 3 প্রেডিক্টরগুলির সাথে কঠোরভাবে অ্যাডিটিভ মডেল থাকে তবে আমি কীভাবে একটি উপযুক্ত রূপান্তর নির্ধারণ করব? একাধিক ভবিষ্যদ্বাণীকারীদের ক্ষেত্রে, আমরা সাধারণত সরল রৈখিক প্রতিরোধের জন্য একই নীতিগুলির জন্য চেষ্টা করি? (যেমন অনুকূল অবশিষ্টাংশ বনাম। পূর্বাভাসের প্লট এবং অবশিষ্টাংশের কিউপিপ্লট)।
ম্যাট

1
পিটার- রিগ্রেশন স্প্লাইন্ডগুলি চতুর্ভুজগুলির চেয়ে বেশি জটিল নয়। বয়স ^ 2 যেভাবেই মডেলটিতে রয়েছে তখন বয়সের সহগকে কীভাবে ব্যাখ্যা করতে হয় কে জানে? এবং আমি দেখছি না যেখানে কেন্দ্রীকরণ সাহায্য করে। আমি গ্রাফিকগুলির সাথে স্প্লিন ফিটগুলির ব্যাখ্যা করি যা আমার সহযোগীরা পছন্দ করে। ম্যাট একটি রূপান্তর প্রায় সবসময় প্রয়োজন। অরৈখিক প্রভাবগুলি ফিট করার জন্য পর্যাপ্ত পরামিতিগুলি অনুমান করার জন্য এটি নমুনার আকারের পর্যাপ্ততার প্রশ্ন। রিগ্রেশন স্প্লাইজগুলি রূপান্তরগুলির সরাসরি অনুমান করে এবং "ডেটা দেখায়" এর জন্য দণ্ডিত উপযুক্ত আত্মবিশ্বাসের অন্তরগুলিকে নিয়ে যায়। অবশিষ্টাংশ একটি পরোক্ষ পদ্ধতির জড়িত।
ফ্রাঙ্ক হ্যারেল

দুঃখিত, এখনও পোস্টিং এর ঝুলন্ত এখানে। ক্ষমা করে দেও. আমার শেষ মন্তব্যের ব্যাখ্যা দেওয়ার জন্য: আমি একটি পাঠ্যটিতে সাম্প্রতিক উদাহরণটি দিয়েছি যার ফলস্বরূপ মডেল y ~ x1 + লগ (এক্স 2) ছিল এবং রূপান্তর সম্পর্কে একমাত্র নোটটি ছিল "এটি প্রতীয়মান হয়েছিল যে লোগারিথমিক রূপান্তরের জন্য x2 ভালভাবে উপযোগী ছিল । " আমি যখন রূপান্তরগুলি প্রযোজ্য তখন আমার ধারণাটি উন্নত করার চেষ্টা করছি। কেবলমাত্র y ~ x_i প্লটগুলি দেখার জন্য এবং একক পূর্বাভাসকারী ক্ষেত্রে আমরা যেমন এগিয়ে যাচ্ছি তা কি যথেষ্ট? আমি আর কি বিবেচনা করা উচিত?
ম্যাট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.