আরে একাধিক রিগ্রেশনের জন্য পরিবর্তনশীল রূপান্তরকরণ


26

আমি একাধিক রিগ্রেশন সম্পাদন করার চেষ্টা করছি R। তবে, আমার নির্ভরশীল ভেরিয়েবলের নিম্নলিখিত প্লট রয়েছে:

ডিভি

এখানে আমার সমস্ত ভেরিয়েবল ( WARএকটি নির্ভরশীল ভেরিয়েবল) সহ একটি স্ক্র্যাপরপ্লট ম্যাট্রিক্স রয়েছে :

SPLOM

আমি জানি যে এই ভেরিয়েবলের (এবং সম্ভবত স্বতন্ত্র ভেরিয়েবল?) এর জন্য আমার একটি রূপান্তর করা দরকার তবে সঠিক রূপান্তরটির জন্য আমি নিশ্চিত নই। কেউ আমাকে সঠিক পথ নির্দেশ করতে পারবেন? আমি স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে সম্পর্ক সম্পর্কে কোনও অতিরিক্ত তথ্য সরবরাহ করতে পেরে খুশি।

আমার রিগ্রেশন থেকে ডায়াগনস্টিক গ্রাফিকগুলি নীচে দেখুন:

ডায়াগনস্টিক প্লট

সম্পাদনা

ইয়ে-জনসন রূপান্তরগুলি ব্যবহার করে নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলগুলিকে রূপান্তর করার পরে, ডায়াগনস্টিক প্লটগুলি এর মতো দেখতে:

রূপান্তর করার পরে

আমি যদি লগ-লিঙ্ক সহ একটি জিএলএম ব্যবহার করি তবে ডায়াগনস্টিক গ্রাফিক্সটি হ'ল:

লগ-লিঙ্ক সহ জিএলএম


3
হাই @ zglaa1 এবং স্বাগতম। আপনি কেন ভাবছেন যে আপনাকে ভেরিয়েবলগুলি রূপান্তর করতে হবে? প্রথম পদক্ষেপটি হ'ল মূল বৈচিত্র্যগুলির সাথে রিগ্রেশনটি ফিট করা এবং তারপরে ফিটের (অবশিষ্টগুলি ইত্যাদি) দিকে নজর দেওয়া। অবশিষ্টগুলি প্রায় সাধারণভাবে বিতরণ করা উচিত, ভেরিয়েবলগুলি নয়। সম্ভবত আপনি এই পোস্ট আকর্ষণীয় পাবেন।
COOLSerdash

লিঙ্ক এবং পরামর্শ উভয়ের জন্য আপনাকে ধন্যবাদ। আমি আমার রিগ্রেশন চালিয়েছি এবং আমি জানি যে নিম্নলিখিত প্লটের উপর ভিত্তি করে ভেরিয়েবলগুলি রুপান্তরিত করা দরকার: i.imgur.com / rbmu14M.jpg আমি অব্যবস্থাপনায় নিরপেক্ষতা এবং ধ্রুবক পরিবর্তনশীলতার অভাব দেখতে পাচ্ছি। এছাড়াও, এগুলি স্বাভাবিক নয়।
zgall1

@COOLSerdash আমি লিঙ্কটি একবার দেখেছি। পরিসংখ্যানগুলিতে আমার একটি বেসিক ব্যাকগ্রাউন্ড রয়েছে তাই আমি আলোচনাটি বুঝতে পারি। তবে, আমার সমস্যাটি হ'ল আমি যে কৌশলগুলি শিখেছি সেগুলি প্রয়োগ করার ক্ষেত্রে আমার সীমিত অভিজ্ঞতা রয়েছে তাই আমার প্রয়োজনীয় ডেটাগুলি (এক্সেল বা আর তে হয়) প্রকৃতপক্ষে প্রয়োজনীয় রূপান্তরগুলি সম্পাদন করার জন্য আমার কী করতে হবে তা নির্ধারণের জন্য আমি সংগ্রাম করতে চাই।
zgall1

গ্রাফিকের জন্য ধন্যবাদ। আপনি এই কথাটি একেবারেই ঠিক বলেছেন যে এই ফিটটি সাবঅপটিমাল। আপনি দয়া করে ডিগ্রি এবং আইভিতে রিগ্রেশনে একটি স্ক্র্যাটারপ্লট ম্যাট্রিক্স তৈরি করতে পারেন? এই কাজ করা যেতে পারে Rআদেশের সঙ্গে pairs(my.data, lower.panel = panel.smooth)যেখানে my.dataআপনার ডেটা সেটটি হবে।
COOLSerdash

2
lmboxcox(my.lm.model)MASSλ

উত্তর:


30

জন ফক্সের অ্যাপ অ্যান্ড আর্ট টু অ্যাপ্লিকেশনড রিগ্রেশন হ'ল প্রয়োগযুক্ত রিগ্রেশন মডেলিংয়ের সাথে একটি দুর্দান্ত রিসোর্স Rcarএই উত্তরে আমি যে প্যাকেজটি ব্যবহার করছি তা হ'ল সংযুক্ত প্যাকেজ। বইটিতে অতিরিক্ত অধ্যায় সহ ওয়েবসাইটও রয়েছে।


প্রতিক্রিয়ার রূপান্তরকরণ (ওরফে নির্ভরশীল পরিবর্তনশীল, ফলাফল)

RlmboxCoxcarλfamily="yjPower"

boxCox(my.regression.model, family="yjPower", plotit = TRUE)

এটি নিম্নলিখিতটির মতো একটি প্লট তৈরি করে:

বক্স-কক্স ল্যাম্বডপ্ল্লট

λλ

আপনার নির্ভরশীল ভেরিয়েবলটি এখনই রূপান্তর করতে, প্যাকেজ yjPowerথেকে ফাংশনটি ব্যবহার করুন car:

depvar.transformed <- yjPower(my.dependent.variable, lambda)

lambdaλboxCox

গুরুত্বপূর্ণ: নির্ভরশীল ভেরিয়েবলটিকে কেবল লগ-রূপান্তরিত করার পরিবর্তে আপনার লগ-লিঙ্কের সাথে একটি জিএলএম ফিট করার বিষয়টি বিবেচনা করা উচিত। এখানে কিছু তথ্য উল্লেখ করা হয়েছে যা আরও তথ্য সরবরাহ করে: প্রথম , দ্বিতীয় , তৃতীয় । এটি করতে R, ব্যবহার করুন glm:

glm.mod <- glm(y~x1+x2, family=gaussian(link="log"))

যেখানে yআপনার নির্ভরশীল পরিবর্তনশীল এবং x1, x2ইত্যাদি আপনার স্বাধীন ভেরিয়েবল আছে।


ভবিষ্যদ্বাণীকারীদের রূপান্তর

রূপান্তরের কঠোরভাবে ইতিবাচক ভবিষ্যতবক্তা নির্ভরশীল পরিবর্তনশীল রূপান্তরের পর সর্বোচ্চ সম্ভাবনা দ্বারা নির্ণয় করা যায়। এটি করতে, প্যাকেজটি boxTidwellথেকে ফাংশনটি ব্যবহার করুন car(মূল কাগজটির জন্য এখানে দেখুন )। যে মত এটি ব্যবহার করুন: boxTidwell(y~x1+x2, other.x=~x3+x4)। এখানে গুরুত্বপূর্ণ বিষয়টি হ'ল বিকল্পটি other.xরিগ্রেশনের শর্তাদি নির্দেশ করে যা রূপান্তরিত হবে না । এটি আপনার সমস্ত শ্রেণিবদ্ধ ভেরিয়েবল হবে। ফাংশনটি নিম্নলিখিত ফর্মের একটি আউটপুট উত্পাদন করে:

boxTidwell(prestige ~ income + education, other.x=~ type + poly(women, 2), data=Prestige)

          Score Statistic   p-value MLE of lambda
income          -4.482406 0.0000074    -0.3476283
education        0.216991 0.8282154     1.2538274

incomeλincomeআয়এনW=1/আয়

স্বাধীন ভেরিয়েবলের রূপান্তর সম্পর্কে সাইটে আরও একটি আকর্ষণীয় পোস্ট হ'ল এটি


রূপান্তরগুলির অসুবিধাগুলি

লগ-রুপান্তরিত নির্ভরশীল এবং / অথবা স্বতন্ত্র ভেরিয়েবলগুলি থাকতে পারে 1/Yλλ


ননলাইনার সম্পর্কের মডেলিং

অরৈখিক সম্পর্কের মাপসই করার জন্য দুটি বেশ নমনীয় পদ্ধতি হ'ল ভগ্নাংশের বহুভুজ এবং স্প্লাইচগুলিপ্রথম , দ্বিতীয় এবং তৃতীয় : এই তিনটি কাগজপত্র দুটি পদ্ধতিরই খুব ভাল পরিচয় দেয় । ভগ্নাংশ বহুপদী এবং সম্পর্কে একটি সম্পূর্ণ বইও রয়েছেRR প্যাকেজmfp কার্যকরী ভগ্ন polynomials মাল্টিভেরিয়েবল। এই উপস্থাপনাটি ভগ্নাংশের বহুবচন সম্পর্কিত তথ্যমূলক হতে পারে। স্প্লাইজে ফিট করার জন্য, আপনি প্যাকেজ বা ফাংশনগুলি থেকে ফাংশন gam(সাধারণীকরণযোগ্য মডেলগুলি, একটি দুর্দান্ত পরিচিতির জন্য এখানে দেখুন R) ব্যবহার করতে পারেনmgcvns(প্রাকৃতিক কিউবিক স্প্লাইন) এবং bs(কিউবিক বি-স্প্লিনস) প্যাকেজ থেকে splines( এই ফাংশনগুলির ব্যবহারের উদাহরণের জন্য এখানে দেখুন )। ফাংশনটি gamব্যবহার করে আপনি কোন ভবিষ্যদ্বাণীকে স্প্লাইন ব্যবহার করে ফিট করতে চান তা নির্দিষ্ট করে বলতে পারেন s():

my.gam <- gam(y~s(x1) + x2, family=gaussian())

এখানে, একটি সাধারণ লিনিয়ার রিগ্রেশন হিসাবে x1একটি স্প্লাইন এবং x2রৈখিক ব্যবহার করে লাগানো হবে । ভিতরে gamআপনি বিতরণ পরিবার এবং লিঙ্ক ফাংশন হিসাবে হিসাবে নির্দিষ্ট করতে পারেন glm। সুতরাং একটি লগ-লিঙ্ক ফাংশন সঙ্গে একটি মডেল মাপসই, আপনি বিকল্প নির্দিষ্ট করতে পারেন family=gaussian(link="log")মধ্যে gamহিসাবে glm

সাইট থেকে এই পোস্টে একবার দেখুন ।


1
ভাল ব্যাখ্যা। আমি জানি না যে স্পষ্টতই বাক্স-কক্স হ'ল একটি রূপান্তর চয়ন করার সবচেয়ে সাধারণ পদ্ধতি। যদি আপনি লগগুলি যে কোনও উপায়ে বেছে নেন এমন লোকদের গণনা করেন তবে আমার নিজের বন্য অনুমান এটি একটি সংখ্যালঘু পদ্ধতি। এই পিক পয়েন্টটি প্রাকৃতিকভাবে অন্য কোনও কিছুকে প্রভাবিত করে না।
নিক কক্স

@ নিককক্স ধন্যবাদ (আপনার উত্তরের জন্য +1, বিটিডাব্লু)। বক্স-কক্স সবচেয়ে সাধারণ পদ্ধতি যে বিবৃতিটি জন ফক্সের বই থেকে এসেছে। বিবৃতিটি বিচার করার মতো পর্যাপ্ত অভিজ্ঞতা না পাওয়ায় আমি এটিকে সামান্য মূল্য হিসাবে নিয়েছি। আমি বিবৃতি সরিয়ে ফেলব।
COOLSerdash

বিস্তারিত ব্যাখ্যার জন্য আপনাকে অনেক ধন্যবাদ। আমি এখন চেষ্টা করব এবং এটি আমার ডেটাতে প্রয়োগ করব।
zgall1

@COOLSerdash আপনার বিশদ ওয়াকথ্রু ব্যবহার করে, আমি আমার নির্ভরশীল এবং তারপরে স্বতন্ত্র ভেরিয়েবলগুলিতে বক্স কক্স রূপান্তরটি প্রয়োগ করেছি এবং আমার ডায়াগনস্টিক ভেরিয়েবলগুলির নিম্নলিখিত প্লট পেয়েছি - i.imgur.com/eO01djl.jpg স্পষ্টতই, একটি উন্নতি হয়েছে তবে এখনও মনে হচ্ছে অবিচ্ছিন্ন পরিবর্তনশীলতা এবং পক্ষপাতহীনতার সমস্যা হতে পারে এবং স্বাভাবিকতার সাথে অবশ্যই একটি সমস্যা আছে। আমি এখান থেকে কোথায় যেতে পারি?
zgall1

1
@ zgall1 আপনার মতামতের জন্য ধন্যবাদ, আমি এটি প্রশংসা করি এইচএম, হ্যাঁ, রূপান্তরগুলি খুব বেশি সাহায্য করেছে বলে মনে হয় না :)। এই মুহুর্তে, আমি সম্ভাব্যভাবে mgcvপ্যাকেজ এবং এবং সাথে সাধারণীকরণযোগ্য মডেলগুলি (জিএএম) ব্যবহার করে ভবিষ্যদ্বাণীকারীদের স্প্লাইনগুলি ব্যবহার করার চেষ্টা করব gam। যদি এটি সাহায্য না করে, আমি আমার বুদ্ধিমানের শেষে ভীত। এখানে এমন লোক আছেন যারা আমার চেয়ে অনেক বেশি অভিজ্ঞ এবং সম্ভবত তারা আপনাকে আরও পরামর্শ দিতে পারে। বেসবল নিয়েও আমি জ্ঞানবান নই। হতে পারে আরও একটি লজিকাল মডেল রয়েছে যা এই ডেটাগুলি দিয়ে বোঝায়।
COOLSerdash

8

আপনার প্রতিক্রিয়ার প্রকৃতি (ফলাফল, নির্ভরশীল) পরিবর্তনশীল সম্পর্কে আপনার আরও আমাদের বলা উচিত। আপনার প্রথম চক্রান্ত থেকে এটি শূন্যের কাছাকাছি এবং কিছু নেতিবাচকর সাথে অনেক মানকে দৃ strongly়তার সাথে ইতিবাচকভাবে আঁকা। সেখান থেকে এটি সম্ভব, তবে অনিবার্য নয়, সেই রূপান্তরটি আপনাকে সহায়তা করবে, তবে সবচেয়ে গুরুত্বপূর্ণ প্রশ্নটি রূপান্তরটি আপনার ডেটাটিকে একটি লিনিয়ার সম্পর্কের আরও কাছাকাছি করে তুলবে কিনা।

নোট করুন যে প্রতিক্রিয়ার জন্য নেতিবাচক মানগুলি সরাসরি লোগারিদমিক রূপান্তরকে বাতিল করে, তবে লগ (প্রতিক্রিয়া + ধ্রুবক) নয়, এবং লগারিদমিক লিঙ্ক সহ সাধারণীকরণীয় রৈখিক মডেল নয়।

এই সাইটে লগ (প্রতিক্রিয়া + ধ্রুবক) নিয়ে আলোচনার অনেকগুলি উত্তর রয়েছে যা পরিসংখ্যানিক ব্যক্তিকে বিভক্ত করে: কিছু লোক এটিকে অ্যাড-হক এবং এর সাথে কাজ করা কঠিন বলে অপছন্দ করে, আবার কেউ কেউ এটিকে বৈধ ডিভাইস হিসাবে বিবেচনা করে।

লগ লিঙ্ক সহ একটি জিএলএম এখনও সম্ভব।

বিকল্পভাবে, এটি হতে পারে যে আপনার মডেল কোনও প্রকারের মিশ্র প্রক্রিয়া প্রতিবিম্বিত করে, সেক্ষেত্রে ডেটা উত্পন্নকরণের প্রক্রিয়াটিকে আরও ঘনিষ্ঠভাবে প্রতিফলিত করে এমন একটি কাস্টমাইজড মডেলটি ভাল ধারণা হবে।

(পরে)

প্রায় 100 থেকে -2 অবধি মানগুলির ওপিতে একটি নির্ভরশীল পরিবর্তনশীল ওয়ার রয়েছে। শূন্য বা নেতিবাচক মানগুলির লগারিদম নেওয়ার ক্ষেত্রে সমস্যাগুলি কাটাতে ওপি শূন্য এবং নেতিবাচক 0.000001 এর প্রবণতা প্রস্তাব করে। এখন একটি লগারিদমিক স্কেলে (বেস 10) সেগুলি মানগুলি 2 (100 বা তাই) থেকে শুরু করে -6 (0.000001) এর মধ্যে থাকে। লগারিদমিক স্কেলগুলিতে ফেইজড পয়েন্টগুলির সংখ্যালঘু এখন বিশাল বহিরাগতদের সংখ্যালঘু। এটি দেখার জন্য অন্য কিছুর বিপরীতে লগ_10 (ফ্যাদিত ওয়ার) প্লট করুন।


উপরে পোস্ট করা স্ক্যাটারপ্ল্লট থেকে আপনি যেমন বলতে সক্ষম হবেন, আমি বেসবলের পরিসংখ্যান ডেটা সেট ব্যবহার করছি। স্বাধীন পরিবর্তনশীল, ওয়ার, মূলত কোনও লিগ স্তরে খেলোয়াড়ের কেরিয়ারের জন্য অবদানের মূল্যের একটি মূলত পরিমাপ। স্বতন্ত্র ভেরিয়েবল, অ্যাডজেএসএলজি, এসওপ্যাক্ট এবং বিবিপ্যাক্ট হ'ল লিগের পরিসংখ্যান যা সাধারণত লিগের পর্যায়ে সাফল্যের পূর্বাভাস বলে মনে করা হয়। বয়স পরিবর্তনশীল হ'ল বয়সটি যেখানে প্লেয়ার গৌণ লিগের পরিসংখ্যান তৈরি করে। ডামি ভেরিয়েবলগুলি সংখ্যালঘু লীগ স্তরের যেখানে পরিসংখ্যান তৈরি হয়েছিল তা নির্দেশ করতে ব্যবহৃত হয়।
zgall1

নেতিবাচক স্বতন্ত্র ভেরিয়েবল (ওয়ার) ইস্যু সম্পর্কিত, যে কারণে কিছুটা জটিল, কারণ রূপান্তর প্রক্রিয়াটিকে আরও সহজ করে তোলে তাদের জিরো হিসাবে পুনরায় কোড করা যুক্তিসঙ্গত। এই ডেটাসেটের কাঠামোর মধ্যে এটি ন্যায়সঙ্গত পদ্ধতি। আপনি যদি আমাকে আরও বিশদে যেতে চান (সতর্কতা - বেসবল জারগন প্রয়োজন), আমি তা করতে পেরে খুশি।
zgall1

1
দেখে মনে হচ্ছে ওয়ার ওয়ার আপনার নির্ভরশীল পরিবর্তনশীল। আপনি এই দৃশ্যে অন্য কোথাও বিতর্কিত, আমার বক্তব্য প্রমাণের জন্য সরবরাহ করেন যে দুটি শব্দটি প্রায়শই বিভ্রান্ত হয়। আমার পরামর্শটি হ'ল জিরোগুলিতে নেতিবাচক মানগুলি পুনরুদ্ধার করা নয় (ডেটা ম্যালট্রেটস) তবে লগ লিঙ্কের সাথে একটি জিএলএম ব্যবহার করা। দয়া করে আমার পাশের বেসবল মিনিটয়েতে শূন্যের আগ্রহ বা জ্ঞান অনুমান করুন।
নিক কক্স

আপনি সঠিক যে ওয়ারটি আমার নির্ভরশীল পরিবর্তনশীল। আমি লগ লিঙ্ক সহ একটি জিএলএম সন্ধান করব। পরামর্শের জন্য ধন্যবাদ.
zgall1

1
ক্যারিয়ারের ওয়ার কীভাবে গণনা করা হয় তা জানতে সহায়ক হতে পারে (ওরফে ডেটা তৈরির প্রক্রিয়াটি বোঝে) understand
এফাইন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.