বক্স কক্স রিগ্রেশনের জন্য রূপান্তর করে


9

আমি মাত্র একটি ভবিষ্যদ্বাণী (বলুন (x, y)) সহ কিছু ডেটারে রৈখিক মডেল ফিট করার চেষ্টা করছি। ডেটা এমন যে এক্স এর ছোট মানগুলির জন্য, y মানগুলি একটি সরলরেখাকে একটি শক্ত আঁট দেয়, তবে এক্স মানগুলি বাড়ার সাথে সাথে y মানগুলি আরও উদ্বায়ী হয়। এই জাতীয় ডেটার উদাহরণ (আর কোড)

y = c(3.2,3.4,3.5,3.8,4.2,5.5,4.5,6.8,7.4,5.9)
x = seq(1,10,1)

আমি জানতে আগ্রহী যে এখানে কোনও পাওয়ার ট্রান্সফর্ম আছে (সম্ভবত বক্স কক্স?) ​​যা আমাকে নীচে দেখানো হিসাবে কেবল লিনিয়ার ফিটের চেয়ে ডেটার জন্য আরও ভাল ফিট করতে দেয়।

fit = lm(y ~ x)

আমি এটি বুঝতে পেরেছি, বক্স কক্সের মতো রূপান্তরের উদ্দেশ্যটি আরও ভাল ফিট করা নয়, মডেলের অনুমানগুলি পূরণ করা। এটি আরও ভাল ফিট, আরও খারাপ ফিট বা খুব বেশি পরিবর্তন নাও পেতে পারে তবে এটি এমন একটি ফিট হবে যা অনুমানগুলি লঙ্ঘন করে না।
পিটার ফ্লুম

একটি অ-রৈখিক রূপান্তর একটি লিনিয়ার সম্পর্ককে ননলাইন করে তুলবে (যদিও কখনও কখনও আপনি এক্সকেও রূপান্তর করতে পারেন এবং এটি ঠিক করতে পারেন)। তবে রূপান্তরটি একটি বাঁকানো সোজাও করতে পারে এবং একই সাথে ভিন্ন ভিন্নতা হ্রাস করতে পারে (যদিও এটি একই রূপান্তর দিয়ে উভয় ক্ষেত্রেই করা সবসময় সম্ভব নয়)। সেই ডেটার জন্য একটি লগ-ট্রান্সফর্ম কিছুটা সহায়তা করে।
গ্লেন_বি -রিনস্টেট মনিকা

4
দুটি চরম এবং মধ্যম (পঞ্চম) মান ব্যবহার করে Y, stats.stackexchange.com/questions/35711/… এ দেখানো পদ্ধতিটি লগারিদমকে বোঝায় (প্যারামিটার 0 সহ বক্স-কক্স রূপান্তর) সম্পর্কের লিনিয়ারাইজিংয়ের জন্য উপযুক্ত হবে । প্রথম, ষষ্ঠ এবং শেষ মানগুলি ব্যবহার করে পারস্পরিক (পরামিতি -1) ভাল হবে। এটি 0 এবং -1 এর মধ্যে প্রায় কোনও প্যারামিটার কাজ করতে পরামর্শ দেয়। পরিসীমাটি কোনও সংখ্যার কম ডাটা দেওয়া কোনও আশ্চর্য নয়। কোনও একঘেয়েমিক পুনঃপ্রকাশ এই ডেটার জন্য প্রকরণকে স্থিতিশীল করবে না।
হোয়বার

উত্তর:


6

আপনার আর এর সাথে এমএএসএস প্যাকেজটি ইতিমধ্যে ইনস্টল হয়েছে, এতে boxcox()আপনি ব্যবহার করতে পারেন এমন ফাংশন রয়েছে : ডেটা পড়ার পরে, করুন:

library(MASS)
boxcox(y ~ x)

তারপরে এই উত্পন্ন গ্রাফটি দেখুন, যা বক্সকক্স রূপান্তর প্যারামিটারের জন্য গ্রাফিকভাবে 95% আত্মবিশ্বাসের ব্যবধান দেখায়। তবে এটি করার জন্য আপনার কাছে সত্যিকারের পর্যাপ্ত ডেটা নেই (এন = 10), ফলস্বরূপ আত্মবিশ্বাসের ব্যবধানটি প্রায় -2 থেকে সর্বাধিক সম্ভাবনার প্রাক্কলন (2 আগে লগ-ট্রান্সফর্ম) সহ প্রায় 2-এ চলে যায়! যদি আপনার আসল ডেটাতে আরও পর্যবেক্ষণ থাকে তবে আপনার এটি চেষ্টা করা উচিত।

অন্যরা যেমন বলেছে, এই রূপান্তরটি সত্যই বৈকল্পিকগুলি স্থিতিশীল করার চেষ্টা করছে। এটি তত্ত্ব থেকে সত্যই প্রকট নয়, এটি যা করে তা হ'ল একটি সাধারণ-বিতরণ ভিত্তিক সম্ভাবনা ফাংশনকে সর্বাধিক করার চেষ্টা করা, যা ধ্রুবক বৈকল্পিকতা ধরে নেয়। কেউ ভাবতে পারেন যে স্বাভাবিক-ভিত্তিক সম্ভাবনা সর্বাধিকীকরণ করা অবশিষ্টাংশের বন্টনকে স্বাভাবিক করার চেষ্টা করবে, তবে বাস্তবে বৈকল্পিকতা স্থিতিশীল করে সম্ভাবনা সর্বাধিকতর করার মূল অবদান আসে comes এটি সম্ভবত এত বিস্ময়কর নয় যে প্রদত্ত সম্ভাবনাটি আমরা সর্বাধিক বাড়িয়ে তুলি ধীরে ধীরে পরিবর্তনের স্বাভাবিক বন্টন পরিবারের উপর ভিত্তি করে!

আমি এক্সএলিস্পস্টেটে একবার স্লাইডার-ভিত্তিক ডেমো লিখেছিলাম, যা এটি স্পষ্টভাবে প্রমাণ করেছে!


3

যখন আপনার একটি রৈখিক সম্পর্ক থাকে তবে অসম বৈকল্পিকগুলি তখন আপনার সমান বৈকল্পিকের সাথে রৈখিক সম্পর্ক পেতে সাধারণত x এবং y উভয়কেই রূপান্তর করতে হবে (অথবা কেবল অপরিবর্তিত ভেরিয়েবলগুলির উপরে ওজনযুক্ত সর্বনিম্ন স্কোয়ার রিগ্রেশন ব্যবহার করতে পারেন)।

সম্ভাব্য রূপান্তরগুলির পরামর্শ দেওয়ার জন্য AVAS পদ্ধতিটি ব্যবহার করা যেতে পারে।


ডেটা একবার দেখুন: Y একঘেয়ে জন্য ট্রেন্ডস এক্স থেকে 1 প্রতি 5, তারপরে পরিকল্পিতভাবে অনেকটা দোলায় এক্স মধ্যে 5 এবং 10। এটি বোঝাচ্ছে যে কোনও ক্রমাগত একঘেয়েমি পুনরায় প্রকাশের নয়Yবৈকল্পিকগুলি স্থিতিশীল করতে সফল হবে। আপনার ওজনযুক্ত সর্বনিম্ন স্কোয়ারের পরামর্শটি এই সীমাবদ্ধতার আলোকে আশাব্যঞ্জক দেখায়, তবে কীভাবে ওজন নির্বাচন করা উচিত?
শুক্রবার

@ ভুবার সাথে সম্মত হন
ব্রোকলি

1
আমি এই নির্দিষ্ট ডেটাসেটের জন্য @ হুবুহু এর সাথে একমত, আমি কেবল ধরে নিয়েছি যে এই ডেটাটি চিত্রিত করার জন্য দ্রুত তৈরি করা হয়েছিল (এবং তাই মানুষের এলোমেলোতা / বাস্তবতার অভাব দেখায়)। আমার প্রতিক্রিয়া হ'ল অসম বৈকল্পিকের সাধারণ ক্ষেত্রে সাধারণ পরামর্শ।
গ্রেগ তুষারপাত

এক্সের সাথে ভেরিয়েন্সটি বাড়তে দেওয়া, glmপোইসন লিঙ্ক ফাংশন সহ কোনও কাঠামো কি এটি কেটে দেবে?
রোমান Luštrik

3
@ রোমানলুয়েট্রিক, একটি পইসন রিগ্রেশন বিবেচনা করার মতো বিষয়, তবে পছন্দটি তথ্য হিসাবে নয়, বিজ্ঞানের ভিত্তিতে করা উচিত। উপরের ডেটাতে অ-পূর্ণসংখ্যা রয়েছেYসুতরাং, পোইসন রিগ্রেশনটি বোঝার জন্য অ-পূর্ণসংখ্যার জন্য কিছু ধরণের ওজন বা পর্যবেক্ষণ উইন্ডো থাকা দরকার। প্রতিক্রিয়াশীল ভেরিয়েবল গণনা উপস্থাপন করে এবং ডেটার পিছনে বিজ্ঞান পয়সন বিতরণের সাথে সামঞ্জস্যপূর্ণ হলেই এটি বিবেচনা করা উচিত।
গ্রেগ তুষার

1

ভাল, আর আপনি এই চেষ্টা করতে পারেন:

library(MASS)
boxcox(y~x)
plot(1/y^2~x) # since the profile likelihood has a maximum near 2

এখানে চিত্র বর্ণনা লিখুন

তবে এটি 'ডেটার সাথে আরও ভাল ফিট' বলতে আপনি কী বোঝাতে চেয়েছেন তা নির্ভর করে


-2

ঠিক আছে যদি x এর জন্য আপনার সমস্ত ডেটা নেতিবাচক হয় তবে আপনি বক্স কক্স রূপান্তরটি ব্যবহার করতে পারেন ... রূপান্তরটির প্যারামিটার ল্যাম্বদার আদর্শ মানটি অনুমান করার জন্য আপনি মাতলাব ব্যবহার করতে পারেন ... http://www.mathworks.in/ সাহায্যের / ফাইনান্সে / boxcox.html


1
"আদর্শ" এখানে অর্থ প্রশ্নে জিজ্ঞাসা করা ছাড়া অন্য কিছু something প্রশ্নটি বৈকল্পিকগুলি স্থিতিশীল করার চেষ্টা করে, যেখানে মতলব সমাধান এটিকে যথাসম্ভব সাধারণভাবে বিতরণের কাছাকাছি করার চেষ্টা করে।
শুক্রবার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.