উপরের উত্তরটি দেখে আমি কিছুটা বিভ্রান্ত হয়ে পড়েছিলাম, তাই এটিকে অন্য শট দেব। আমি মনে করি প্রশ্নটি আসলে 'ধ্রুপদী' লিনিয়ার রিগ্রেশন সম্পর্কে নয় তবে সেই নির্দিষ্ট উত্সের স্টাইল সম্পর্কে। শাস্ত্রীয় প্রতিরোধের অংশে:
তবে, নিজে থেকেই লিনিয়ারিটি অনুমান আমাদের মডেলের কোনও কাঠামো রাখে না
এটা একেবারে সঠিক। আপনি বলেছেন যে, পাশাপাশি রৈখিক সম্পর্ক হত্যা থেকে সম্পূর্ণ স্বতন্ত্র কিছু যোগ হতে পারে এক্স যাতে আমরা একেবারেই কোনও মডেল গনা করতে পারবে না।εএক্স
গ্রিন কি ম্লান হয়ে যাচ্ছে? তিনি কি আসলে লিখেছিলেন: ই( y)| এক্স) = এক্সβ
আমি প্রথম প্রশ্নের উত্তর দিতে চাই না তবে আমাকে আপনার রৈলিক প্রতিরোধের জন্য প্রয়োজনীয় অনুমানগুলি সংক্ষিপ্ত করতে দাও:
যাক আসুন জেনে নিই আপনি মান্য (আপনি দেওয়া হয়) ডেটা পয়েন্ট এবং Y আমি ∈ আর জন্য আমি = 1 , । । । , এন । আপনাকে ধরে নিতে হবে যে আপনি যে ডেটা ( x i , y i ) পর্যবেক্ষণ করেছেন সেগুলি স্বাধীনভাবে, অভিন্নরূপে বিতরণ করা এলোমেলো ভেরিয়েবলগুলি ( X i , Y i ) থেকে আসে ...এক্সআমি। আরঘYআমি। আরআমি = 1 , । । । , এন( এক্সআমি, yআমি)( এক্সআমি, Yআমি)
বিদ্যমান একটি নির্দিষ্ট (স্বাধীন ) β ∈ আর ঘ যেমন যে ওয়াই আমি = β এক্স আমি + + ε আমি সবার জন্য আমি এবং র্যান্ডম ভেরিয়েবল ε আমি যে এই ধরনের হয়আমিβ। আরঘওয়াইআমি= βএক্সআমি+ + εআমিআমিεআমি
ভাল এবং IID হয় ε আমি হিসাবে বিতরণ করা হয় এন ( 0 , σ ) ( σ স্বাধীন হতে হবে আমি পাশাপাশি)εআমিεআমিএন( 0) , σ))σআমি
জন্য এবং ওয়াই = ( ওয়াই 1 , । । । , ওয়াই এন ) ভেরিয়েবল এক্স , ওয়াই একটি সাধারণ ঘনত্ব, অর্থাত্ একক দৈব চলক আছে ( এক্স , ওয়াই ) টি ঘনত্ব এফ এক্স , ওয়াইএক্স= ( এক্স1, । । । , এক্সএন)ওয়াই= ( ওয়াই1, । । । , Yএন)এক্স, Y(এক্স,Y)চএক্স, Y
এখন আপনি সাধারণ পথ এবং গণনা চালিয়ে যেতে পারেন
চওয়াই| এক্স( y)| x)= চওয়াই, এক্স( y),x)/fX(x)=(12πd−−−√)nexp(−∑ni=1(yi−βxi)22σ)
যাতে মেশিন লার্নিং (ত্রুটি ফাংশনগুলির নূন্যতমকরণ) এবং সম্ভাব্যতা তত্ত্বের (সম্ভাবনার সর্বাধিকীকরণ) মধ্যে সাধারণ 'দ্বৈততা' দ্বারা আপনি সর্বাধিক এ β−logfY|X(y|x)β যা আসলে, আপনি স্বাভাবিক "RMSE" জিনিস দেয়।
এখন যেমনটি বলা হয়েছে: আপনি যে বইয়ের উদ্ধৃতি দিচ্ছেন তার লেখক যদি এই বিষয়টি তৈরি করতে চান (আপনি যদি বেসিক সেটআপের ক্ষেত্রে 'সেরাতম সম্ভব' রিগ্রেশন লাইনটি গণনা করতে চান তবে আপনাকে যা করতে হবে) তবে হ্যাঁ, তাকে অবশ্যই এর আদর্শের উপর এই ধারণাটি তৈরি করুন ϵ বইয়ে কোথাও।
এখন বিভিন্ন সম্ভাবনা রয়েছে:
তিনি এই ধারনাটি বইটিতে লিখেন না। তারপরে এটি বইটিতে একটি ত্রুটি।
তিনি মত 'যখনই আমি লিখি একটি' বৈশ্বিক 'মন্তব্য আকারে তা লিপিবদ্ধ করে না তারপর ε IID স্বাভাবিকভাবে গড় শূন্য দিয়ে বিতরণ করা হয় অন্যথায় বিবৃত যদি না'। তবে আইএমএইচও এটি খারাপ স্টাইল কারণ এটি ঠিক আপনার এখনই মনে হচ্ছে এমন বিভ্রান্তির কারণ। এই কারণেই আমি অনুমানগুলি প্রতিটি উপপাদ্যে কিছু সংক্ষিপ্ত আকারে লেখার প্রবণতা রাখি । তবেই প্রতিটি বিল্ডিং ব্লককে তার নিজস্বভাবে পরিষ্কারভাবে দেখা যাবে।+ϵϵ
- আপনি যে অংশটি উদ্ধৃত করছেন সেটিকে তিনি নিবিড়ভাবে লিখেছেন এবং আপনি / আমরা কেবল এটি লক্ষ্য করি নি (এছাড়াও একটি সম্ভাবনা :-))
তবে, কঠোর গাণিতিক দিক থেকেও, সাধারণ ত্রুটি হ'ল প্রমিত কিছু (সর্বোচ্চ এনট্রপির সাথে বিতরণ [একবারে ভেরিয়েন্সটি স্থির হয়ে যায়], তাই শক্তিশালী মডেল তৈরি করা হয়) যাতে কিছু লেখক এই অনুমানটি এড়াতে চান তবে তবুও ব্যবহার করুন । সাধারণভাবে, আপনি একেবারে সঠিক: তারা "ভুল উপায়ে" গণিত ব্যবহার করছেন। যখনই তারা ঘনত্বের জন্য সমীকরণ নিয়ে আসতে চায় যেমন উপরে বর্ণিত হয়েছে তখন তাদের জানা দরকার ϵ বেশ ভাল, অন্যথায় আপনার কেবলমাত্র প্রতিটি সংবেদনশীল সমীকরণ যা আপনি লেখার চেষ্টা করছেন তার চারপাশে এটির বৈশিষ্ট্যগুলি রয়েছে।fY|Xϵ