কেএনএন এবং লিনিয়ার রিগ্রেশনকে সরাসরি তুলনা করা বেশ কঠিন কারণ এগুলি খুব আলাদা জিনিস, তবে আমি মনে করি এখানে মূল বিষয়টি হল "মডেলিং " এবং " সম্পর্কে অনুমান করা" এর মধ্যে পার্থক্য ।চ( এক্স )চ( এক্স )
লিনিয়ার রিগ্রেশন করার সময়, একটি বিশেষত মডেল করে , প্রায়শই এর লাইনের মধ্যে এমন কিছু যেখানে একটি গাউসিয়ান শব্দ শব্দ। আপনি এটি ব্যবহার করতে পারেন যে সর্বাধিক সম্ভাবনার মডেলটি ন্যূনতম যোগফলের স্কোয়ার ত্রুটির মডেলের সমতুল্য।চ( এক্স )চ( x ) = w x + ϵε
অন্যদিকে, কেএনএন, যেমনটি আপনার দ্বিতীয় পয়েন্টের পরামর্শ অনুসারে, ধরে নেওয়া হয়েছে যে আপনি স্থানীয়ভাবে ধ্রুবক ফাংশন দ্বারা সেই ফাংশনটি আনুমানিক করতে পারেন - পুরো ডিস্ট্রিবিউশনটির বিশেষভাবে মডেলিং না করে সিএসের মধ্যে কিছু দূরত্ব পরিমাপ ।এক্স
অন্য কথায়, রৈখিক রিগ্রেশনের প্রায়ই মূল্য একটি ভাল ধারণা হবে জন্য কিছু অদেখা শুধু মান থেকে , যেহেতু kNN কিছু অন্যান্য তথ্য (যেমন ট প্রতিবেশীদের) প্রয়োজন হবে প্রায় ভবিষ্যৎবাণী করার কারণ মান , এবং শুধুমাত্র নিজেই মান, কোন তথ্য দিতে হবে না সেখানে কোন মডেল ।চ( এক্স )এক্সএক্সচ( এক্স )এক্সচ( এক্স )
সম্পাদনা করুন: এই পরিষ্কারভাবে পুনরায় প্রকাশ করতে নীচে পুনরাবৃত্তি করুন (মন্তব্য দেখুন)
এটি স্পষ্ট যে লিনিয়ার রিগ্রেশন এবং নিকটতম প্রতিবেশী উভয় পদ্ধতিই নতুন জন্য এর পূর্বাভাস দেওয়ার লক্ষ্য । এখন দুটি পন্থা আছে। লিনিয়ার রিগ্রেশন ধরেই ধরে নেওয়া যায় যে ডেটা একটি সরলরেখায় পড়েছে (প্লাস বিয়োগ কিছু শব্দ) এবং তাই y এর মান রেখার opeালু সমান হয় । অন্য কথায়, লিনিয়ার এক্সপ্রেশন তথ্যকে একটি সরলরেখা হিসাবে মডেল করে।Y= চ( এক্স )এক্সচ( এক্স )
এখন নিকটবর্তী প্রতিবেশী পদ্ধতিগুলি ডেটা কেমন দেখাচ্ছে (ডেটা মডেল করে না) সে বিষয়ে চিন্তা করে না, অর্থাত এটি লাইন, প্যারাবোলা, একটি চেনাশোনা, ইত্যাদি সেগুলি বিবেচনা করে না, যা এগুলি ধরে নিয়েছে, তা কি এবং একই হবে, যদি এবং একই হয়। মনে রাখবেন যে এই ধারণাটি আমি উপরে উল্লিখিত সমস্তগুলি সহ মোটামুটি কোনও মডেলের জন্য সত্য। তবে, একটি এনএন পদ্ধতি কীভাবে এর সাথে সাথে সম্পর্কিত (এটি কোনও লাইন, প্যারোবোলাসহ, ইত্যাদি) এর সাথে সম্পর্কিত তা বলতে পারে না , কারণ এটির এই সম্পর্কের কোনও মডেল নেই, এটি কেবল ধরে নিয়েছে যে এটি দ্বারা প্রায় অনুমান করা যায় কাছাকাছি পয়েন্ট মধ্যে সন্ধান।চ(এক্স1)চ(এক্স2)এক্স1এক্স2চ( এক্স )এক্স