দুটি লিনিয়ার রিগ্রেশন মডেল দেওয়া, কোন মডেল আরও ভাল অভিনয় করতে পারে?


14

আমি আমার কলেজে একটি মেশিন লার্নিং কোর্স নিয়েছি। কোয়েসের একটিতে এই প্রশ্নটি করা হয়েছিল।

মডেল 1:

y=θx+ϵ
মডেল 2:
y=θx+θ2x+ϵ

উপরের কোন মডেল ডেটা আরও ভাল ফিট করতে পারে? (ধরুন লিনিয়ার রিগ্রেশন ব্যবহার করে ডেটা মডেল করা যায়)

সঠিক উত্তর (অধ্যাপকের মতে) হ'ল উভয় মডেলই সমানভাবে পারফর্ম করবে। তবে আমি বিশ্বাস করি যে প্রথম মডেলটি আরও ভাল ফিট হবে।

এই আমার উত্তর পিছনে কারণ। দ্বিতীয় মডেল, যা αx+ϵ , α=θ+θ2 আবারও লেখা যেতে পারে প্রথম মডেলের মতো হবে না। α প্রকৃতপক্ষে একটি প্যারাবোলা, এবং তাই এর সর্বনিম্ন মান হয় ( 0.25 এই ক্ষেত্রে 0.25 )। এখন এই কারণে, পরিসীমা θ প্রথম মডেল পরিসীমা চেয়ে বেশী α দ্বিতীয় মডেল। অতএব যদি ডেটা এমন হয় যে সেরা ফিটের সাথে একটি opeাল ছিল 0.25 , দ্বিতীয় মডেল প্রথমটির তুলনায় খুব খারাপভাবে পারফর্ম করবে। তবে ক্ষেত্রে সবচেয়ে উপযুক্ত ফিটের opeাল বেশি ছিল , উভয় মডেলই সমানভাবে ভাল পারফর্ম করবে।0.25

তাহলে প্রথমটি কি ভাল, না উভয়ই ঠিক এক?


3
আমার মনে হচ্ছে তুমি সঠিক. আবশ্যক করার একটি প্যারামিটার ব্যক্ত করা যায় এমন হতে যেমন θ + + θ 2 (কিছু জন্য θ ) প্রকৃতপক্ষে কি একটি বাধ্যতা জোরদার করে α এর সম্ভব। এর অর্থ হ'ল দ্বিতীয় মডেলটি প্রথমটির চেয়ে কম সম্পর্ক প্রকাশ করতে পারে , কারণ এটি এখন মূলত একটি বাছাই করা অপ্টিমাইজেশনের সমস্যা। আপনার যুক্তি আমার কাছে দৃ solid় মনে হয়। αθ+θ2θα
ম্যাথু ড্র্যারি

@ ম্যাথেজড্রুরি আমি ঠিক বুঝতে পেরেছিলাম যে আমি কোথায় ভুল করেছি, নীচের উত্তরটি দেখুন (এবং মন্তব্য করুন)
কুশ

3
আমি আপনার মন্তব্য দেখতে, কিন্তু যে কিছু প্রশংসনীয় গুরুতর জিমন্যাস্টিকস অনুমান করা হয় জটিল মান গ্রহণ করা হবে। আপনার অধ্যাপকের সাথে এই বিষয়ে কথা বলার জন্য আমি অবশ্যই অফিসের কিছু সময় উপস্থিত থাকব। আপনি যেভাবেই এটি থেকে একটি ভাল আলোচনা পাবেন। θ
ম্যাথু ড্রি

1
-0.25 কোথা থেকে এসেছে তা আমার কাছে পরিষ্কার নয়। আপনি কি স্পষ্ট করতে পারেন?
ম্যাড জ্যাক

1
আমি কিভাবে আপনার অধ্যাপক দুই দফা ডেটা সেটটি প্রতিটি মডেল মাপসই করা হবে করতে আগ্রহী হবে । মডেল 1 এবং θ = - 1 হইয়া নির্ভুল, কিন্তু কিভাবে গুলি / তিনি অনুমান করবে θ মডেল 2 একটি নিখুঁত হইয়া প্রাপ্ত কিভাবে? {(1,1),(2,2)}θ=1θ
হোবার

উত্তর:


9

: মডেল 2 হিসেবে লেখা যেতে পারে এই মাত্র hyperparameters জন্য বিভিন্ন নোটেশন (সঙ্গে মডেল 1 অনুরূপ মনে হয়, θ , β )। যাইহোক, মডেল 1 আমরা লিখতে পারি θ = ( এক্স

y=(θ+θ2)x+ϵ=βx+ϵ.
θ,β
θ^=(XX)1Xy.

কিন্তু যেহেতু মডেল 2 আমরা যে আছে তারপর হিসাবে আপনি প্রকৃতপক্ষে উল্লিখিত পরিসীমা β অন্তর্গত উচিত [ - 0.25 , + + ] জন্য θ আর । যা এই 2 টি মডেলের মধ্যে পার্থক্য দেখাবে।

β=θ+θ2,
β^[0.25,+]θR

এভাবে মডেল 2 আপনার মডেলকে 1. অসদৃশ আপনার সহগ হিসাব constraining এই আরো স্পষ্ট করার জন্য, এটা উল্লেখ করা উচিত যে মডেল বর্গক্ষেত্র হ্রাস ফাংশন কমানোর মাধ্যমে প্রাপ্ত হয় θ = ARG মিনিট θ আর ( Y - এক্স θ )θ^ তবে মডেল 2 অনুমান মাধ্যমে প্রাপ্ত হয় β =ARG মিনিট β - 0.25 (Y-এক্সβ)

θ^=argminθR  (yXθ)(yXθ)=(XX)1Xy.
যা অন্য কোনও ফলাফলের দিকে নিয়ে যেতে পারে।
β^=argminβ0.25  (yXβ)(yXβ)

1
θθ+θ2θ

@ কুশ দয়া করে আমার সম্পাদিত প্রতিক্রিয়া পরীক্ষা করুন যা আপনার উদ্বেগকেও প্রশ্রয় দেয়
উইস

1

নিশ্চিত না যে আমি আপনার যুক্তি বুঝতে পেরেছি। যদি আপনি গ্রহণ করেন:

y=αx+ϵ
y=θx+ϵ

αθαθR2θα=θ+θ2


5
θ(,)α(0.25,)x
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.