বিরক্তি এবং রিগ্রেশন মধ্যে প্রধান পার্থক্য হ'ল তারা সমাধান করা সমস্যার সংজ্ঞা।
প্রদত্ত ডাটা পয়েন্টগুলি, আপনি যখন বিভক্ত করবেন তখন আপনি এমন একটি ফাংশন সন্ধান করবেন যা কিছু পূর্বনির্ধারিত ফর্মের যে নির্দিষ্ট বিন্দুতে মানগুলি ঠিক আছে। এর অর্থ প্রদত্ত জোড়া ( x i , y i ) আপনি কিছু পূর্বনির্ধারিত ফর্মের F সন্ধান করছেন যা F ( x i ) = y i কে সন্তুষ্ট করে । আমি মনে করি সবচেয়ে বেশি যে এফ বহুপদী, স্প্লাইন (কম ডিগ্রী অন্তর দেওয়া বিন্দুর মধ্যে polynomials) হতে নির্বাচিত করা হয়।এন( এক্সআমি, yআমি)এফএফ( এক্সআমি) = yআমিএফ
আপনি যখন রিগ্রেশন করেন, আপনি এমন একটি ফাংশন সন্ধান করেন যা কিছুটা ব্যয় হ্রাস করে, সাধারণত ত্রুটির স্কোয়ারের যোগফল। আপনার প্রদত্ত পয়েন্টগুলিতে সঠিক মানগুলির জন্য ফাংশনটির প্রয়োজন নেই, আপনি কেবল একটি ভাল এপ্রোক্সিমেশন চান। সাধারণভাবে, আপনার প্রাপ্ত ফাংশন কোনও ডাটা পয়েন্টের জন্য F ( x i ) = y i কে সন্তুষ্ট করতে পারে না , তবে ব্যয় কার্যকারিতা, যেমন ∑ n i = 1 ( F ( x i ) - y i ) 2এফএফ( এক্সআমি) = yআমিΣএনi = 1( চ( এক্সআমি) - yআমি)2 সম্ভবতমতম সম্ভব হবে প্রদত্ত ফর্মের সমস্ত কার্যাদি।
স্টক মার্কেটের দামগুলি হ'ল আপনি কেন ইন্টারপোল্টের পরিবর্তে কেবলমাত্র এপ্রোকমিক্স করতে চাইতে পারেন তার একটি ভাল উদাহরণ। আপনি কিছু সাম্প্রতিক সময়ের ইউনিটগুলিতে দাম নিতে পারেন এবং পরের ইউনিট সময়ে দামের কিছুটা ভবিষ্যদ্বাণী পেতে এগুলিকে বিভক্ত করার চেষ্টা করতে পারেন। এটি বরং একটি খারাপ ধারণা, কারণ দামের মধ্যে সম্পর্কগুলি একটি বহুবর্ষের মাধ্যমে সঠিকভাবে প্রকাশ করা যেতে পারে তা ভাবার কোনও কারণ নেই। তবে লিনিয়ার রিগ্রেশন কৌতুকটি করতে পারে, যেহেতু দামগুলি কিছুটা "opeাল" থাকতে পারে এবং একটি লিনিয়ার ফাংশন কমপক্ষে স্থানীয়ভাবে একটি ভাল aproximation হতে পারে (ইঙ্গিত: এটি এত সহজ নয়, তবে এই ক্ষেত্রে অন্তঃসারণের তুলনায় রিগ্রেশন অবশ্যই স্পষ্টতই ভাল ধারণা )।ট