সম্পর্ক লিনিয়ার বা অ-রৈখিক কিনা তা পরিসংখ্যানগত পরীক্ষা


9

আমার কাছে নিম্নে ডেটা সেট করার একটি উদাহরণ রয়েছে:

Volume <- seq(1,20,0.1)
var1 <- 100 
x2 <- 1000000
x3 <- 30

x4 = sqrt(x2/pi)
H = x3 - Volume
r = (x4*H)/(H + Volume)

Power = (var1*x2)/(100*(pi*Volume/3)*(x4*x4 + x4*r + r*r))

Power <- jitter(Power, factor = 1, amount = 0.1)
plot(Volume,Power)

এখানে চিত্র বর্ণনা লিখুন

চিত্র থেকে, এটি প্রস্তাবিত হতে পারে যে 'ভলিউম' এবং 'পাওয়ার' এর একটি নির্দিষ্ট পরিসরের মধ্যে সম্পর্ক লিনিয়ার, তারপরে যখন 'ভলিউম' তুলনামূলকভাবে ছোট হয়ে যায় তখন সম্পর্কটি অ-রৈখিক হয়ে যায়। এটি চিত্রিত করার জন্য কোনও পরিসংখ্যান পরীক্ষা আছে?

ওপির প্রতিক্রিয়াগুলিতে প্রদর্শিত কয়েকটি প্রস্তাবনার প্রতি শ্রদ্ধা সহ:

এখানে দেখানো উদাহরণটি কেবল একটি উদাহরণ, আমি যে ডেটাসেটটি পেয়েছি তা এখানে নোসিয়ার হলেও দেখা সম্পর্কের সাথে সাদৃশ্যপূর্ণ। আমি এখনও অবধি যে বিশ্লেষণ পরিচালনা করেছি তা দেখায় যে আমি যখন একটি নির্দিষ্ট তরলের ভলিউম বিশ্লেষণ করি যখন কম ভলিউম থাকে তখন সিগন্যালের শক্তি তীব্রভাবে বৃদ্ধি পায়। সুতরাং, বলুন যে আমার কেবল পরিবেশ ছিল যেখানে ভলিউম 15 এবং 20 এর মধ্যে ছিল এটি প্রায় লিনিয়ার সম্পর্কের মতো দেখাবে। যাইহোক, পয়েন্টের পরিসীমা বৃদ্ধি করে অর্থাৎ ছোট ভলিউম থাকা, আমরা দেখতে পাচ্ছি যে সম্পর্কটি মোটেই লিনিয়ার নয়। আমি এখন পরিসংখ্যানগতভাবে এটি কীভাবে প্রদর্শন করব সে সম্পর্কে কিছু পরিসংখ্যান সংক্রান্ত পরামর্শ খুঁজছি। আশা করি এটি উপলব্ধিযোগ্য।


5
এখানে বেশ কয়েকটি জিনিস চলছে। প্রথমে অবশ্যই একটি সম্পর্ক লৈখিক দেখায় তবে ভেরিয়েবলের ব্যাপ্তি যথাযথভাবে সীমাবদ্ধ থাকে। দ্বিতীয়ত, heteroscedasticity ছিটান উচ্চ ভলিউম এবং কম ক্ষমতা এ বেশী তুলনায় এটি কম ভলিউম এবং উচ্চ ক্ষমতা রয়েছে: ডেটা প্রায় অরৈখিক সম্পর্ক যেমন বিশিষ্ট একটি বৈশিষ্ট্য হিসেবে রয়েছে। নির্বিশেষে, আপনি কি সঠিকভাবে পরীক্ষা করতে চান? পুরো পরিসীমা জুড়ে সম্পর্কের লিনিয়ারিটি?
whuber

4
বাস্তবিক, আমি heteroscedasticity সম্পর্কে মন্তব্য ফেরত নিতে চায়: চক্রান্ত দেয় চেহারা যেমন, কিন্তু এটা কম ভলিউম এ অপেক্ষাকৃত খাড়া ঢাল দ্বারা সৃষ্ট একটি বিভ্রম আছে। (ক্ষমতার দিক দিয়ে আয়তনের একটি অত্যন্ত ভিন্ন ভিন্ন সম্পর্ক রয়েছে)) একবার আমরা যখন নির্ধারণ করি যে ক্ষমতার প্রকরণটি ভিন্ন ভিন্ন নয় , এটি কিছু প্রকারের বিশ্লেষণের বিধি নিষেধ করে (আমরা ক্ষমতার অরৈখিক রূপান্তর প্রয়োগ করতে চাই না) এবং পরামর্শ দেয় অন্যের পক্ষে (যেমন ননলাইনারের সর্বনিম্ন স্কোয়ার বা সাধারণীকরণীয় রৈখিক মডেল) পক্ষপাতী হওয়া, যখন অলাইনারিটি স্পষ্টভাবে প্রতিষ্ঠিত হয়।
whuber

আমি এখন হাতে সমস্যাটির একটি সংক্ষিপ্ত বিবরণ যুক্ত করেছি। আপনার মন্তব্যগুলির জন্য এখন পর্যন্ত ধন্যবাদ, এগুলি সত্যই প্রশংসিত এবং সমস্যার মধ্য দিয়ে আমাকে ভাবতে সহায়তা করছে।
KatyB

চতুর্ভুজ প্রভাবের জন্য পরীক্ষা করা হচ্ছে না কেন?
অ্যাডামো

2
@ সিমন আমি কোনও পরীক্ষা ব্যবহার করিনি, তবে তবুও আপনি দেখতে পাচ্ছেন যে ভলিউমের বিপরীতে রেশিয়ালগুলির আদর্শ আকারের পরিকল্পনা করে এটি সমকামী। এখানে কিছু নেই Rকোড: plot(s <- by(cbind(Power, Volume), groups <- cut(Volume, 10), function(d) summary(lm(Power ~ Volume, data=d))$sigma), xlab="Volume range", ylab="Residual SD", ylim=c(0, max(s))); abline(h=mean(s), lty=2, col="Blue")। এটি সম্পূর্ণ পরিসীমা জুড়ে একটি অবিচ্ছিন্ন অবশিষ্টাংশ আকার দেখায়।
whuber

উত্তর:


4

এটি মূলত একটি মডেল নির্বাচনের সমস্যা। আমি আপনাকে শারীরিক-কলুষিত মডেলগুলির একটি সেট নির্বাচন করতে উত্সাহিত করি (রৈখিক, তাত্পর্যপূর্ণ, সম্ভবত একটি বিচ্ছিন্ন রৈখিক সম্পর্ক) এবং সেরা নির্বাচন করতে আকাইকে তথ্য মানদণ্ড বা বায়েসিয়ান তথ্য মানদণ্ড ব্যবহার করে - হিটরোসসিস্টাস্টিটি ইস্যুকে মাথায় রেখে @ যেটি নির্দেশ করে points


2

আপনি কি গুগল করার চেষ্টা করেছেন !? এটি করার একটি উপায় হ'ল আপনার মডেলের সাথে উচ্চতর শক্তি বা অন্যান্য অ-রৈখিক শর্তাদি ফিট করে এবং পরীক্ষা করা উচিত যদি তাদের সহগগুলি 0 থেকে উল্লেখযোগ্যভাবে আলাদা হয়।

এখানে কিছু উদাহরণ রয়েছে http://www.albany.edu/~po467/EPI553/all_2006/regression_assumptions.pdf

আপনার ক্ষেত্রে আপনি ভলিউম <5 এর জন্য অ-রৈখিকতা এবং ভলিউম> 5 এর জন্য লিনিয়ারিটি পরীক্ষা করার জন্য আপনার ডেটা সেটটিকে দুটি বিভাগে বিভক্ত করতে পারেন।

আপনার অন্যান্য সমস্যাটি হ'ল আপনার ডেটা হিটারোস্কেস্টেস্টিক, যা রিগ্রেশন ডেটার জন্য স্বাভাবিকতা অনুমানকে লঙ্ঘন করে। প্রদত্ত লিঙ্কটি এর জন্য পরীক্ষার উদাহরণও দেয়।


লিঙ্কটি নষ্ট হয়ে গেছে।
যতীন

2

আমি আপনার সমস্ত ডেটাতে একটি মডেল ফিট করার জন্য ননলাইনার রিগ্রেশন ব্যবহার করার পরামর্শ দিচ্ছি। একটি স্বেচ্ছাসেবী ভলিউম বাছাই এবং একটি মডেল যে তুলনায় কম ভলিউম এবং আরও একটি মডেল বৃহত্তর ভলিউম ফিট করে কি লাভ? 5 টি তীক্ষ্ণ প্রান্তিক হিসাবে ব্যবহারের জন্য চিত্রটির চেয়েও বেশি কারণ আছে? আপনি কি সত্যই বিশ্বাস করেন যে কোনও নির্দিষ্ট ভলিউম প্রান্তিকের পরে, আদর্শ বক্ররেখা লিনিয়ার? ভলিউম বৃদ্ধি পাওয়ার সাথে সাথে এটি অনুভূমিকের কাছে যাওয়ার আরও বেশি সম্ভাবনা নেই, তবে কখনও কখনও লিনিয়ার হয় না?

অবশ্যই, আপনি কোন বৈজ্ঞানিক প্রশ্নের উত্তর দেওয়ার চেষ্টা করছেন এবং সিস্টেম সম্পর্কে আপনার পূর্ববর্তী জ্ঞানের উপর বিশ্লেষণ সরঞ্জাম নির্বাচন করা নির্ভর করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.