লিনিয়ার বনাম ননলাইনার রিগ্রেশন


13

আমার কাছে এবং এর মানগুলির একটি সেট রয়েছে যা তাত্ত্বিকভাবে তাত্পর্যপূর্ণভাবে সম্পর্কিত:yxy

y=axb

গুণফলগুলি পাওয়ার একটি উপায় হ'ল উভয় পক্ষের প্রাকৃতিক লোগারিদম প্রয়োগ করা এবং একটি রৈখিক মডেল লাগানো:

> fit <- lm(log(y)~log(x))
> a <- exp(fit$coefficients[1])
> b <- fit$coefficients[2]

এটি পাওয়ার আরেকটি উপায় হ'ল একটি অলৈনিক রেগ্রেশন ব্যবহার করা, যা শুরু মানগুলির একটি তাত্ত্বিক সেট দেয়:

> fit <- nls(y~a*x^b, start=c(a=50, b=1.3))

আমার পরীক্ষাগুলি যদি আমি দ্বিতীয় অ্যালগরিদম প্রয়োগ করি তবে আরও ভাল এবং আরও তত্ত্ব সম্পর্কিত ফলাফল দেখায়। তবে আমি প্রতিটি পদ্ধতির পরিসংখ্যানগত অর্থ এবং এর প্রভাবগুলি জানতে চাই।

এর মধ্যে কোনটি ভাল?


3
অনুরূপ প্রশ্নের সাথে যোগাযোগ করে এই পোস্টে দয়া করে দেখুন । এই কাগজটিও আগ্রহী হতে পারে।
COOLSerdash

5
"সূচকীয়" সাধারণত এর উপর ভিত্তি করে কিছু বোঝায় exp(): আপনার এখানে যা রয়েছে তাকে সাধারণভাবে পাওয়ার ফাংশন, পাওয়ার আইন বা স্কেলিং আইন বলা হয়। অন্যান্য নাম নিঃসন্দেহে বিদ্যমান। হাইপোথিসিস টেস্টিং অর্থে পাওয়ারের সাথে কোনও সংযোগ নেই।
নিক কক্স

উত্তর:


16

"বেটার" আপনার মডেলের একটি ফাংশন।

আপনার বিভ্রান্তির কারণের অংশটি হ'ল আপনি কেবল নিজের মডেলের অর্ধেকটি লিখেছেন।

আপনি যখন বলবেন , আসলে এটি সত্য নয়। আপনার পর্যবেক্ষণ করা মানগুলি সমান নয় ; তাদের একটি ত্রুটি উপাদান রয়েছে। y a x by=axbyaxb

উদাহরণস্বরূপ, আপনি যে দুটি মডেল উল্লেখ করেছেন (কোনও উপায় দ্বারা কেবলমাত্র সম্ভাব্য মডেল নয়) ত্রুটি সম্পর্কে সম্পূর্ণ ভিন্ন ধারণা তৈরি করে।

আপনি সম্ভবত কাছাকাছি কিছু বোঝাতে চাইছেন ।E(Y|X=x)=axb

তবে তারপরে কোনও প্রদেয় এ প্রত্যাশা থেকে দূরে এর প্রকরণ সম্পর্কে আমরা কী বলব ? এটা গুরুত্বপূর্ণ!এক্সYx

  • আপনি যখন অরৈখিক সর্বনিম্ন স্কোয়ারের মডেলটি ফিট করেন, আপনি বলছেন যে ত্রুটিগুলি সংযোজনীয় এবং ত্রুটির মানক বিচ্যুতি ডেটা জুড়ে স্থির থাকে:

    yiN(axib,σ2)

    বা সমতুল্য

    var ( e i ) = σ 2yi=axib+ei , সহvar(ei)=σ2

  • বিপরীতে যখন আপনি লগগুলি গ্রহণ করেন এবং লিনিয়ার মডেলটি ফিট করেন, আপনি ত্রুটিটি লগ স্কেলে এবং ডেটা জুড়ে ধ্রুবক হিসাবে (লগ স্কেলে) সংযোজিত বলছেন। এর অর্থ হ'ল পর্যবেক্ষণের স্কেলে, ত্রুটি শব্দটি গুণক এবং তাই প্রত্যাশিত মানগুলি বড় হলে ত্রুটিগুলি বড় হয়:

    yilogN(loga+blogxi,σ2)

    বা সমতুল্য

    η ilogN ( 0 , σ 2 )yi=axibηi ,ηilogN(0,σ2)

    (দ্রষ্টব্য যে 1 নয় If যদি ছোট হয় তবে আপনাকে এই প্রভাবের জন্য অনুমতি দেওয়া দরকার)σ 2E(η)σ2

(স্বাভাবিকতা / লগন্যাল বিতরণগুলি ধরে না রেখে আপনি কমপক্ষে স্কোয়ারগুলি করতে পারেন, তবে আলোচিত কেন্দ্রীয় সমস্যাটি এখনও প্রযোজ্য ... এবং আপনি যদি স্বাভাবিকতার কাছাকাছি না হন তবে আপনাকে সম্ভবত অন্য কোনও ত্রুটির মডেল বিবেচনা করা উচিত)

তাই কোনটি সর্বোত্তম তা নির্ভর করে কোন ধরণের ত্রুটি মডেল আপনার পরিস্থিতি বর্ণনা করে।

[আপনি ডাটা যে সামনে দেখা হয় নি কোন ধরণের সঙ্গে কিছু অনুসন্ধানমূলক বিশ্লেষণ করছেন, তাহলে আপনি এই ধরণের প্রশ্নগুলির বিবেচনা চাই "অাপনার ডেটা দেখতে কেমন? (অর্থাত বিরুদ্ধে ষড়যন্ত্র ? অবশিষ্টাংশ বিরুদ্ধে দেখতে কেমন ? "। অন্যদিকে এগুলির মতো চলকগুলি যদি অস্বাভাবিক না হয় তবে আপনার ইতিমধ্যে তাদের সাধারণ আচরণ সম্পর্কে তথ্য থাকা উচিত]]xyxx


9

আপনি যখন কোনও মডেল ফিট করেন, আপনি ধরে নিচ্ছেন যে অবশিষ্টাংশের সেট (ওয়াইয়ের পর্যবেক্ষণকৃত এবং পূর্বাভাসিত মানের মধ্যে পার্থক্য) কোনও গাউসীয় বিতরণ অনুসরণ করে। যদি সেই ধারণাটি আপনার কাঁচা ডেটা (ননলাইনার রিগ্রেশন) এর সাথে সত্য হয় তবে লগ-রূপান্তরিত মানগুলির (লিনিয়ার রিগ্রেশন) এবং এটির বিপরীতেও সত্য হবে না।

কোন মডেল "ভাল"? এক যেখানে মডেলটির অনুমানগুলি ডেটার সাথে সবচেয়ে বেশি মিলছে match

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.