ডেটাতে একটি ক্ষতিকারক মডেল ফিট করা


21

আমার দুটি ভেরিয়েবল রয়েছে, উভয়ই "সংখ্যার" ক্লাস থেকে:

> head(y)
[1] 0.4651804 0.6185849 0.3766175 0.5489810 0.3695258 0.4002567

> head(x)
[1] 59.32820 68.46436 80.76974 132.90824 216.75995 153.25551

আমি তাদের চক্রান্ত করেছি, এবং এখন আমি ডেটাতে একটি ঘনিষ্ঠ মডেল ফিট করতে চাই (এবং এটি প্লটটিতে যুক্ত করব) তবে আমি আরে ডেটা মাল্টিভারিয়েটেটিংয়ের জন্য ফিটিং মডেলগুলির কোনও তথ্য খুঁজে পাই না! শুধুমাত্র তথ্য অবিচ্ছিন্ন করতে, কেউ সাহায্য করতে পারে? আমি জানি না কোথা থেকে শুরু করব ... ধন্যবাদ!


6
এটি কিছুটা বিভ্রান্তিকর। আপনি বলছেন যে আপনার দুটি "স্বতন্ত্র" ভেরিয়েবল রয়েছে (আমি "প্রিডেক্টর" পছন্দ করি তবে এটি গুরুত্বপূর্ণ নয়)। আপনার কি কোনও "নির্ভরশীল" / "প্রতিক্রিয়া" ভেরিয়েবল আছে? যদি এগুলি উভয়ই প্রতিক্রিয়াশীল ভেরিয়েবল হয় তবে আমি কোনও প্যারামেট্রিক, দ্বিবিড়ীয় সম্ভাব্যতা বিতরণ (ডিস্ট্রিবিউশনটির প্যারামিটারগুলি নির্ভর করে বা তার পূর্বে ভবিষ্যদ্বাণী ভেরিয়েবলগুলি) বা 2D কার্নেলের ঘনত্বের অনুমানের ফিটিংয়ের কল্পনা করতে পারি। সম্ভবত আপনি প্রসঙ্গটি আরও কিছুটা ব্যাখ্যা করতে পারেন। (পিএস যে কেউ প্রশ্ন উত্সাহিত করছে তার অবশ্যই অর্থটি অবশ্যই জানতে হবে ... যে কেউ
চিমাইতে আগ্রহী

যাই হোক না কেন, আপনি এই জাতীয় প্রশ্নের জন্য আরও ভাল ক্রসওলটিয়েটেড.কম এ যেতে চাইবেন । বা গুগল নামে একটি অস্পষ্ট ওয়েবসাইটের কাছে। এটি মাল্টিয়ারিয়েট ডেটাতে ফিটিং মডেলগুলির তথ্য খুঁজে পেয়েছিল। বেশ অনেকটা (4 মিলিয়ন দুই লক্ষ ত্রিশ হাজার হুবুহু হতে হবে)
জরিস মেজ

আমি বিংয়ের পরামর্শ দিচ্ছি - এটি সর্বোপরি সিদ্ধান্ত ইঞ্জিন, অনুসন্ধান ইঞ্জিনগুলি এত বিংশ শতাব্দীর ... কেবল ইয়াহু এবং জিভকে জিজ্ঞাসা করুন, তারা আজ কতটা অপ্রাসঙ্গিক?!?!
চেজ

@ বেন বলকার - সহায়তার জন্য ধন্যবাদ, আমি স্বাধীনকে বের করে নিয়েছি, কারণ এটি সঠিক ছিল না। আমার কাছে যা রয়েছে তা অবস্থানের মধ্যে দূরত্ব (x) এবং অবস্থানের মধ্যে বৃষ্টিপাতের সম্পর্ক (y)

নোট করুন যে আপনি যদি এই ডেটাগুলিতে পরিসংখ্যানগত সূচনা করতে চান তবে আপনাকে বিশেষ পদ্ধতিগুলি ব্যবহার করতে হবে, কারণ দূরত্বগুলি যদি কোনও সাধারণ স্থানে গণনা করা হত তবে সেগুলি স্বতন্ত্র নয় - যেমন "ম্যান্টেল টেস্ট"
বেন বলকার

উত্তর:


20

আপনি কী জিজ্ঞাসা করছেন তা আমি পুরোপুরি নিশ্চিত নই, কারণ আপনার লিঙ্গো বন্ধ রয়েছে। তবে ধরে নিচ্ছি যে আপনার ভেরিয়েবলগুলি একে অপরের থেকে স্বতন্ত্র নয় (যদি সেগুলি হয় তবে তারা এটির সন্ধানের কোনও সম্পর্ক নয়) আমি এটি ব্যবহার করে দেখব। যদি xআপনার স্বতন্ত্র (বা ভবিষ্যদ্বাণীকারী) পরিবর্তনশীল হয় এবং yআপনার নির্ভরশীল (বা প্রতিক্রিয়া) পরিবর্তনশীল হয়, তবে এটি কাজ করা উচিত।

# generate data
beta <- 0.05
n <- 100
temp <- data.frame(y = exp(beta * seq(n)) + rnorm(n), x = seq(n))

# plot data
plot(temp$x, temp$y)

# fit non-linear model
mod <- nls(y ~ exp(a + b * x), data = temp, start = list(a = 0, b = 0))

# add fitted curve
lines(temp$x, predict(mod, list(x = temp$x)))

আপনার উত্তরের জন্য ধন্যবাদ, আমি "স্বতন্ত্র" শব্দটি বের করে এনেছি, যেমন আপনি উল্লেখ করেছেন, এটির কোনও মানে হয় না। আমার ডেটার জন্য আপনার কোড ব্যবহার করে আমি মডেলটি ফিট করতে পারি তবে ফলাফলটি কেবলমাত্র একটির পরিবর্তে গ্রাফের কয়েক ডজন লাইন। কোন ধারণা কেন?

@ এসবিজি - না, দুঃখিত, এর কারণ সম্পর্কে আমি ভাবতে পারি না। না nls()একটি মডেল মাপসই করা হবে?
রিচার্ড হেরন

আমি তাই মনে করি, আমি পেয়েছি: ননলাইনারি রিগ্রেশন মডেল মডেল: y ~ exp (a + b * x) ডেটা: ডিএফ ab -0.535834 -0.002024 অবশিষ্টাংশের বর্গাকার: 18.62 সংখ্যার পুনরাবৃত্তির সংখ্যা: 6 গৃহীত রূপান্তর সহনশীলতা: 8.08 e-06

3
@ এসবিজি আপনার xপরিবর্তনশীল বাছাই করার চেষ্টা করুন :lines(sort(temp$x),predict(mod, list(x=sort(temp$x)))
বেন বলকার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.