এই প্রশ্নটি আকর্ষণীয় ইনফোফার কারণ এটি অপ্টিমাইজেশন তত্ত্ব, অপ্টিমাইজেশন পদ্ধতি এবং পরিসংখ্যানগত পদ্ধতিগুলির মধ্যে কিছু সংযোগ প্রকাশ করে যা পরিসংখ্যানগুলির যে কোনও সক্ষম ব্যবহারকারীর বুঝতে হবে। যদিও এই সংযোগগুলি সহজ এবং সহজেই শিখেছে তবে সেগুলি সূক্ষ্ম এবং প্রায়শই উপেক্ষা করা হয়।
অন্যান্য প্রত্যুত্তরের মন্তব্য থেকে কিছু ধারণা সংক্ষিপ্ত করতে, আমি এখানে উল্লেখ করতে চাই যে "লিনিয়ার রিগ্রেশন" অ-অনন্য সমাধান তৈরি করতে পারে - কেবল তাত্ত্বিকভাবে নয়, বাস্তবে নয়।
সনাক্তকরণের অভাব
প্রথমটি যখন মডেলটি সনাক্তযোগ্য নয়। এটি এক উত্তল তৈরি করে তবে কঠোরভাবে উত্তল উদ্দেশ্যমূলক ফাংশন তৈরি করে না যার একাধিক সমাধান রয়েছে।
উদাহরণস্বরূপ, ডেটা ) এর জন্য এবং বিপরীতে (এক ইন্টারসেপ্ট সহ) । একটি সমাধান হ'ল । অন্যটি হ'ল । একাধিক সমাধান থাকতে হবে তা দেখতে, তিনটি বাস্তব পরামিতি এবং ফর্মটিতে একটি ত্রুটি শব্দ term দিয়ে মডেলটিকে প্যারামিটারাইজ করুনএক্স Y ( এক্স , Y , z- র ) ( 1 , - 1 , 0 ) , ( 2 , - 2 , - 1 ) , ( 3 , - 3 , - 2 ) z- র = 1 + + Y z- র = 1 - এক্স ( λ , μ , ν ) εz- রএক্সY( x , y), জেড)( 1 , - 1 , 0 ) , ( 2 , - 2 , - 1 ) , ( 3 , - 3 , - 2 )z- র^= 1 + yz- র^= 1 - এক্স( λ , μ , ν))ε
z- র= 1 + μ + ( λ + ν) ν- 1 ) এক্স + ( λ - ν)) y+ + Ε ।
অবশিষ্টাংশের বর্গের যোগফলকে সরল করে
এসএসআর = 3 μ2+ 24 μ ν+ 56 ν2।
(এটি বাস্তবে উত্থাপিত অবজেক্টিভ ফাংশনগুলির একটি সীমাবদ্ধ ঘটনা, যেমন কোনও এম-এসিমেটরের অভিজ্ঞতামূলক হেসিয়ান কি অনির্দিষ্টকালীন হতে পারে? যেখানে আপনি বিশদ বিশ্লেষণগুলি পড়তে পারেন এবং ফাংশনের প্লটগুলি দেখতে পারেন।)
কারণ স্কোয়ারের সহগগুলি ( এবং ) ধনাত্মক এবং নির্ধারক ধনাত্মক, এটি in এ একটি ইতিবাচক-অর্ধ-চতুর্ভূজ চতুর্ভুজ আকার) । হলে এটি হ্রাস করা হয় , তবে যে কোনও মান থাকতে পারে। যেহেতু অবজেক্টিভ ফাংশন নির্ভর করে না , তেমনি এর গ্রেডিয়েন্ট (বা অন্য কোনও ডেরাইভেটিভস )ও করে না। অতএব, কোনও গ্রেডিয়েন্ট বংশোদ্ভূত অ্যালগরিদম - যদি এটি দিকের কিছু স্বেচ্ছাসেবী পরিবর্তন না করে সমাধানের মানটি শুরু মান হিসাবে যাই হোক না কেন সেট করে ।56 3 × 56 - ( 24 / 2 ) 2 = 24 ( μ , ν , λ ) μ = ν = 0 λ SSR λ λ3563 × 56 - ( 24 / 2 )2= 24( μ , ν), λ )μ = ν= 0λSSRλλ
গ্রেডিয়েন্ট বংশদ্ভুত ব্যবহার না করা হলেও, সমাধানটি বিভিন্ন হতে পারে। ইন R
হিসাবে:, উদাহরণস্বরূপ, দুটি সহজ, সমতুল্য এই মডেল নির্দিষ্ট করার উপায় আছে z ~ x + y
বা z ~ y + x
। প্রথমটি দেয় তবে দ্বিতীয়টি । z- র =1+ +Yz- র^= 1 - এক্সz- র^= 1 + y
> x <- 1:3
> y <- -x
> z <- y+1
> lm(z ~ x + y)
Coefficients:
(Intercept) x y
1 -1 NA
> lm(z ~ y + x)
Coefficients:
(Intercept) y x
1 1 NA
( NA
মানগুলি শূন্য হিসাবে ব্যাখ্যা করা উচিত, তবে এক সতর্কতার সাথে যে একাধিক সমাধান বিদ্যমান The সতর্কবার্তাটি সম্ভব হয়েছিল কারণ R
এর সমাধান পদ্ধতির থেকে পৃথক পৃথক বিশ্লেষণের কারণে সম্পন্ন হয়েছিল A গ্রেডিয়েন্ট বংশোদ্ভূত পদ্ধতি সম্ভবত একাধিক সমাধানের সম্ভাবনা সনাক্ত করতে পারে না, যদিও একজন ভাল আপনাকে কিছুটা অনিশ্চয়তা সম্পর্কে সতর্ক করবে যে এটি সর্বোত্তম সময়ে এসেছিল))
প্যারামিটার সীমাবদ্ধতা
কঠোর উত্তলতা একটি অনন্য বৈশ্বিক সর্বোত্তম গ্যারান্টি দেয়, প্রদত্ত প্যারামিটারগুলির ডোমেন উত্তল হয়। প্যারামিটার বিধিনিষেধগুলি নন-উত্তল ডোমেন তৈরি করতে পারে, একাধিক বিশ্বব্যাপী সমাধানের দিকে নিয়ে যায়।
একটি খুব সাধারণ উদাহরণ উপাত্তের জন্য "গড়" অনুমান করার সমস্যা দ্বারা সরবরাহ করা হয় সীমাবদ্ধতার সাপেক্ষে । এই মডেলগুলির এমন একটি পরিস্থিতি যা নিয়মিতকরণ পদ্ধতির বিপরীতে যেমন রিজ রিগ্রেশন, লাসো বা ইলাস্টিক নেট: এটি একটি জোর দিয়ে চলেছে যে কোনও মডেল প্যারামিটার খুব ছোট না হয়। (এই জাতীয় প্যারামিটার সীমাবদ্ধতায় রিগ্রেশন সমস্যাগুলি কীভাবে সমাধান করা যায় তা জিজ্ঞাসা করে যে তারা বাস্তবে উত্থাপিত হয় তা বিভিন্ন প্রশ্ন জিজ্ঞাসা করে)- 1 , 1 | μ | ≥ 1 / 2μ- 1 , 1| μ | ≥1 / 2
এই উদাহরণে দুটি স্বল্প-বর্গ সমাধান রয়েছে, উভয়ই সমানভাবে ভাল। এগুলি সীমাবদ্ধ করে সীমাবদ্ধ করে পাওয়া যায় । দুটি সমাধান আছে । একাধিক সমাধান দেখা দিতে পারে কারণ প্যারামিটার সীমাবদ্ধতা ডোমেনটিকে domain ননকনভেক্স করে তোলে :| μ | ≥ 1 / 2 μ = ± 1 / 2 μ ∈ ( - ∞ , - 1 / 2 ] ∪ [ 1 / 2 , ∞ )( 1 - μ )2+ ( - 1 - μ )2| μ | ≥1 / 2μ = ± 1 / 2μ ∈ ( - ∞ , - 1 / 2 ] ∪ [ 1 / 2 , ∞ )
প্যারাবোলা একটি (কঠোরভাবে) উত্তল ক্রিয়াকলাপের গ্রাফ। ঘন লাল অংশটি এর ডোমেনের মধ্যে সীমাবদ্ধ অংশ : এটির দুটি সর্বনিম্ন পয়েন্ট রয়েছে , যেখানে যোগফল । বাকী প্যারাবোলা (বিন্দু দেখানো) সীমাবদ্ধতা দ্বারা মুছে ফেলা হয়, যার ফলে বিবেচনা থেকে এটির অনন্য ন্যূনতম অপসারণ হয়।μ = ± 1 / 2 5 / 2μμ = ± 1 / 25 / 2
একটি গ্রেডিয়েন্ট বংশোদ্ভূত পদ্ধতি, যদি না এটি বড় লাফালাফি নিতে ইচ্ছুক থাকে তবে সম্ভবত "অনন্য" সমাধানটি পাওয়া যাবে ইতিবাচক মান দিয়ে শুরু করার সময় এবং অন্যথায় এটি "অনন্য" সমাধান খুঁজে পেতে পারে যখন একটি নেতিবাচক মান দিয়ে শুরু করা হয়।μ = - 1 / 2μ = 1 / 2μ = - 1 / 2
বৃহত্তর ডেটাসেট এবং উচ্চ মাত্রায় (যা আরও বেশি রিগ্রেশন পরামিতি ফিট করতে পারে) একই পরিস্থিতি দেখা দিতে পারে।