বিরক্তি ধারণা সঙ্গে কীভাবে বিরতি সম্পর্কিত?


17

সংক্ষেপে ব্যাখ্যা কর অন্তরঙ্গকরণ বলতে কী বোঝায় itএটি রিগ্রেশন ধারণার সাথে কীভাবে সম্পর্কিত?

ইন্টারপোলেশন হ'ল একটি টেবিলের রেখার মধ্যে পড়া এবং প্রাথমিক গণিতে শব্দটি সাধারণত সেই ফাংশনের প্রদত্ত বা টেবুলার মানগুলির একটি সেট থেকে কোনও ফাংশনের মধ্যবর্তী মানগুলি গণনার প্রক্রিয়া বোঝায়।

আমি দ্বিতীয় প্রশ্নের উত্তর দিতে পারি না। সাহায্য করুন


4
রিগ্রেশনটি X (স্বতন্ত্র ভেরিয়েবল) প্রদত্ত ওয়াই (নির্ভরশীল ভেরিয়েবল) এর প্রত্যাশিত মানটি বর্ণনা করার জন্য একটি ফাংশন সনাক্তকরণের লক্ষ্য । ইন্টারপোলেশন X এর প্রদত্ত মানগুলিতে Y এর মান পূর্বাভাস দেওয়ার জন্য রিগ্রেশন ব্যবহার করে । পার্থক্যটি সূক্ষ্ম তবে এমন মডেলগুলির সামনে প্রকাশিত হয় যেখানে ওয়াইয়ের সাথে সম্পর্কিত হয়, কারণ তখন পূর্বাভাসিত মানগুলি সাধারণত তাদের রিগ্রেশন মান থেকে পৃথক হয়। রিগ্রেশন বা ভবিষ্যদ্বাণী উভয়ই গাণিতিক টেবিলগুলিতে সরাসরি ইন্টারপোলটিংয়ের ক্ষেত্রে প্রযোজ্য না, যা সাধারণত কোনও র্যান্ডম ত্রুটি নেই বলে ধরে নেওয়া হয়, তবে তাদের অ্যালগোরিদমগুলি এখনও ব্যবহার করা যেতে পারে। YXYXY
ঝাঁকুনি

2
এটি কি কোনও শ্রেণির জন্য কাজ?
গ্লেন_বি -রিনস্টেট মনিকা

উত্তর:


23

বিরক্তি এবং রিগ্রেশন মধ্যে প্রধান পার্থক্য হ'ল তারা সমাধান করা সমস্যার সংজ্ঞা।

প্রদত্ত ডাটা পয়েন্টগুলি, আপনি যখন বিভক্ত করবেন তখন আপনি এমন একটি ফাংশন সন্ধান করবেন যা কিছু পূর্বনির্ধারিত ফর্মের যে নির্দিষ্ট বিন্দুতে মানগুলি ঠিক আছে। এর অর্থ প্রদত্ত জোড়া ( x i , y i ) আপনি কিছু পূর্বনির্ধারিত ফর্মের F সন্ধান করছেন যা F ( x i ) = y i কে সন্তুষ্ট করে । আমি মনে করি সবচেয়ে বেশি যে এফ বহুপদী, স্প্লাইন (কম ডিগ্রী অন্তর দেওয়া বিন্দুর মধ্যে polynomials) হতে নির্বাচিত করা হয়।এন(এক্সআমি,Yআমি)এফএফ(এক্সআমি)=Yআমিএফ

আপনি যখন রিগ্রেশন করেন, আপনি এমন একটি ফাংশন সন্ধান করেন যা কিছুটা ব্যয় হ্রাস করে, সাধারণত ত্রুটির স্কোয়ারের যোগফল। আপনার প্রদত্ত পয়েন্টগুলিতে সঠিক মানগুলির জন্য ফাংশনটির প্রয়োজন নেই, আপনি কেবল একটি ভাল এপ্রোক্সিমেশন চান। সাধারণভাবে, আপনার প্রাপ্ত ফাংশন কোনও ডাটা পয়েন্টের জন্য F ( x i ) = y i কে সন্তুষ্ট করতে পারে না , তবে ব্যয় কার্যকারিতা, যেমন n i = 1 ( F ( x i ) - y i ) 2এফএফ(এক্সআমি)=YআমিΣআমি=1এন(এফ(এক্সআমি)-Yআমি)2 সম্ভবতমতম সম্ভব হবে প্রদত্ত ফর্মের সমস্ত কার্যাদি।

স্টক মার্কেটের দামগুলি হ'ল আপনি কেন ইন্টারপোল্টের পরিবর্তে কেবলমাত্র এপ্রোকমিক্স করতে চাইতে পারেন তার একটি ভাল উদাহরণ। আপনি কিছু সাম্প্রতিক সময়ের ইউনিটগুলিতে দাম নিতে পারেন এবং পরের ইউনিট সময়ে দামের কিছুটা ভবিষ্যদ্বাণী পেতে এগুলিকে বিভক্ত করার চেষ্টা করতে পারেন। এটি বরং একটি খারাপ ধারণা, কারণ দামের মধ্যে সম্পর্কগুলি একটি বহুবর্ষের মাধ্যমে সঠিকভাবে প্রকাশ করা যেতে পারে তা ভাবার কোনও কারণ নেই। তবে লিনিয়ার রিগ্রেশন কৌতুকটি করতে পারে, যেহেতু দামগুলি কিছুটা "opeাল" থাকতে পারে এবং একটি লিনিয়ার ফাংশন কমপক্ষে স্থানীয়ভাবে একটি ভাল aproximation হতে পারে (ইঙ্গিত: এটি এত সহজ নয়, তবে এই ক্ষেত্রে অন্তঃসারণের তুলনায় রিগ্রেশন অবশ্যই স্পষ্টতই ভাল ধারণা )।


চমৎকার উত্তর. আমি যুক্ত করব যে রিগ্রেশন সহ, এর পিছনে একটি পরিসংখ্যানগত মডেল রয়েছে যা কিছু বিতরণের ক্ষেত্রে এবং এক্স এর মধ্যকার সম্পর্ককে সংজ্ঞায়িত করে , যেখানে আমরা অনুমান করি যে এটির গড় (বা মধ্যম, বা কোয়ান্টাইলগুলি ইত্যাদি বিভিন্ন স্বাদে), যেমন পরিসংখ্যান .stackexchange.com / প্রশ্নগুলি / 173660 /…YX
টিম

আপনি যে উদাহরণটি বর্ণনা করেছেন তা কি দ্রবণের চেয়ে এক্সট্রা পোলেশন হবে না?
দ্বি_শিক্ষক

6

পূর্ববর্তী দুটি উত্তর লিনিয়ার ইন্টারপোলেশন এবং লিনিয়ার রিগ্রেশন (বা এমনকি সাধারণ অন্তরঙ্গকরণ এবং বহুপদী রিগ্রেশন) এর মধ্যে সম্পর্ককে ব্যাখ্যা করেছে। তবে একটি গুরুত্বপূর্ণ সংযোগটি হ'ল একবার আপনি যদি কোনও রিগ্রেশন মডেল ফিট করেন তবে আপনি এটি প্রদত্ত ডেটা পয়েন্টগুলির মধ্যে বিভক্ত করতে ব্যবহার করতে পারেন।


সুতরাং আমি যখন প্রতিক্রিয়া জানাই, বলুন, লিঙ্গের বিপরীতে উচ্চতা আমি অর্ধ-পুরুষ, অর্ধ-মহিলার প্রত্যাশিত উচ্চতার সন্ধান করতে বিরক্ত করতে পারি! এই কল্পিত উদাহরণটি এই প্রতিক্রিয়াটির মূল ত্রুটি তুলে ধরে, যা এমন ধারণা যে একটি রিগ্রেশন মডেলটিতে সমস্ত রেজিস্ট্রারদের অবশ্যই একটানা পরিবর্তনশীল হতে হবে।
whuber


4

আশা করি এটি একটি সাধারণ উদাহরণ এবং ভিজ্যুয়ালাইজেশনের পরিবর্তে দ্রুত আসবে।

ধরুন আপনার নিম্নলিখিত ডেটা রয়েছে:

X  Y
1  6
10 15
20 25
30 35
40 45
50 55

এক্স এর প্রতিক্রিয়া হিসাবে আমরা Y মডেলটিতে রিগ্রেশন ব্যবহার করতে পারি R আর ব্যবহার করে: lm(y ~ x)

ফলাফলগুলি 5 এর একটি বিরতি এবং x এর 1 সহগ হয় Which যার অর্থ একটি স্বেচ্ছাসেবী Y নির্ধারিত এক্সের জন্য X + 5 হিসাবে গণনা করা যেতে পারে a ছবি হিসাবে, আপনি এইভাবে দেখতে পারেন:

enter image description here

খেয়াল করুন কীভাবে আপনি যদি X অক্ষে যান, এর পাশের যে কোনও জায়গায়, এবং লাগানো রেখার উপরে একটি লাইন আঁকেন, এবং তারপরে Y অক্ষের উপর একটি লাইন আঁকেন, আপনি একটি মান পেতে পারেন, আমি কোনও মান বিন্দু সরবরাহ করেছি কি না ওয়াই। অন্তর্নিহিত সম্পর্কের অনুমান করে কোনও ডেটা নেই এমন অঞ্চলগুলিতে রিগ্রেশনটি মসৃণ করছে।


2

বেসিক পার্থক্য খ / ডব্লু অন্তরঙ্গকরণ এবং রিগ্রেশন নিম্নরূপ: অন্তরঙ্গকরণ: ধরুন এন পয়েন্ট রয়েছে (উদাহরণস্বরূপ: 10 ডেটা পয়েন্ট), দ্বিখণ্ডনে আমরা সমস্ত ডাটা পয়েন্টগুলির মধ্য দিয়ে বক্ররেখা মাপসই করব (যেমন এখানে 10 ডাটা পয়েন্ট) দিয়ে বহুবর্ষের ডিগ্রি (নং তথ্য পয়েন্ট -1; যেমন এটি এখানে 9) reg সমস্ত জায়গায় ডেগ্রিটি রেখাঙ্কন হিসাবে নয়, কেবল বাঁক ফিটিংয়ের জন্য তাদের একটি সেট প্রয়োজন points

সাধারণত ইন্টারপোলেশন এবং রিগ্রেশনটির ক্রম হবে (1,2 বা 3) অর্ডার 3 এর বেশি হলে আরও বেশি দোলকটি বক্ররেখাতে দেখা যাবে।


2
এর দ্বারা বোঝা যায় যে বিভাজন বহুবর্ষের উপর ভিত্তি করে তৈরি করা হয়েছে, তবে আরও বেশ কয়েকটি পদ্ধতি রয়েছে যেমন ঘন স্প্লাইন, টুকরোজ কিউবিক হার্মাইট, নিকটতম প্রতিবেশী ইত্যাদি
নিক কক্স

@ নিক যদিও আপনি সঠিক, এটি কৌতূহলজনক যে আপনি যে নামটি বাস্তবে নাম লেখেন সেগুলি বহুবর্ষের উপর ভিত্তি করে! সম্ভবত সবচেয়ে সহজ, সর্বাধিক পরিচিত অ-বহু-বহির্ভুত ইন্টারপোলটরটি হ'ল বিপরীত-দূরত্বের ওজন (IDW)।
whuber

@ ভুবার সম্মত; যদি বহুবর্ষগুলি সীমাবদ্ধতার সাথে প্রয়োগ করা যায়, তবে বেশিরভাগ পদ্ধতিগুলি যোগ্যতা অর্জন করে, যেমন নিকটতম প্রতিবেশী = টুকরোচক ধ্রুবক ইত্যাদি
নিক কক্স

2

রিগ্রেশন হ'ল সেরা ফিটের লাইনটি খুঁজে পাওয়ার প্রক্রিয়া [1]। ইন্টারপোলেশন হ'ল অন্যটির মান থেকে একটি ভেরিয়েবলের মূল্য নির্ধারণের জন্য সেরা ফিটের লাইনটি ব্যবহার করার প্রক্রিয়া, আপনি যে মানটি ব্যবহার করছেন তা আপনার ডেটার সীমার মধ্যে থাকে provided যদি এটি সীমার বাইরে থাকে তবে আপনি এক্সট্রোপোলেশন [1] ব্যবহার করবেন।

[1] http://mathhelpforum.com/advanced-applied-math/182558-interpolation-vs-regression.html


2
এই উত্তরটি এক্সটার্পোলেশন থেকে ইন্টারপোলেশনকে আলাদা করে না। আপনি কি এগুলি একই জিনিস বজায় রাখছেন? বিটিডাব্লু, গণিত ফোরামগুলি (এবং পাঠ্যপুস্তক এবং কাগজপত্রগুলি এমনকি) সাধারণত পরিসংখ্যান সম্পর্কিত বিষয়গুলির তথ্যের উত্স নয়, কারণ তারা সংকীর্ণ গাণিতিক অর্থগুলির দিকে মনোনিবেশ করার প্রবণতা রয়েছে - যা খাঁটি গাণিতিক অ্যাপ্লিকেশনগুলিতে সঠিক এবং দরকারী - তবে সম্ভবত এটি আরও বিস্তৃতভাবে প্রয়োগ করতে পারে না ।
whuber

1

ইন্টারপোলেশন বা স্প্লাইন ফিটিংয়ের সাথে আমরা যা পাই তা হ'ল বৃহত আকারের একটি সংখ্যক ডেটা (ইন্টারপোল্টেড বেট ওয়েইন প্রতিটি জোড়া মূল ডেটা) থাকে, যা প্লট করা হলে একটি মসৃণ বক্ররের প্রভাব তৈরি করে। প্রকৃতপক্ষে, প্রতিটি জোড়ার মূল ডেটার মধ্যে একটি পৃথক বহুবিন্যাস লাগানো থাকে, সুতরাং বিচ্ছিন্নতার পরে পুরো বক্ররেখাটি একটি টুকরাকী অবিচ্ছিন্ন বক্ররেখা হয়, যেখানে প্রতিটি টুকরা একটি পৃথক বহুবচন গঠিত হয়।

যদি কেউ আসল সংখ্যাসূচক তথ্যগুলির প্যারাম্যাট্রিক উপস্থাপনের সন্ধান করে তবে অবশ্যই রিগ্রেশন করা উচিত। আপনি স্প্লাইনে একটি উচ্চ ডিগ্রি বহুবচন ফিট করার চেষ্টা করতে পারেন। যাইহোক, উপস্থাপনা একটি আনুমানিক হতে চলেছে। আপনি আনুমানিকতা কতটা সঠিক তা পরীক্ষা করতে পারেন।


এটি নিক কক্সের মন্তব্য পড়ার এখনও সুযোগ পান নি বলে মনে হয় , যা দেখায় যে সমস্ত ইন্টারপোলটার (স্থানীয়) বহুভুজ নয়।
whuber

0

রিগ্রেশন এবং ইন্টারপোলেশন উভয়ই অন্য ভেরিয়েবলের (এক্স) প্রদত্ত মানের জন্য একটি ভেরিয়েবলের মান (পূর্বাভাস) পূর্বাভাস দেওয়ার জন্য ব্যবহৃত হয়। রিগ্রেশন-এ আমরা স্বতন্ত্র ভেরিয়েবলের (X) প্রদত্ত মানের জন্য নির্ভরশীল ভেরিয়েবলের কোনও মান (এক্স) পূর্বাভাস দিতে পারি যদিও তা ট্যাবুলেটেড মানগুলির সীমার বাইরে হয় is তবে ইন্টারপোলেশন এর ক্ষেত্রে আমরা কেবল নির্ভরশীল ভেরিয়েবলের মানগুলির পূর্বাভাস দিতে পারি (Y) স্বাধীন ভেরিয়েবল (এক্স) এর মানের জন্য যা X এর প্রদত্ত মানের সীমার মধ্যে থাকে


0

ইন্টারপোলেশন হ'ল x- a এবং x = b এর মধ্যে একাধিক পয়েন্ট বহনকারী বহুভুজের সাথে একাধিক পয়েন্ট ফিট করার প্রক্রিয়া। রেগেশন প্রযুক্তির চেয়ে ভাল নির্ভুলতার সাথে ডোমেন x = [a, b] এ y এর আনুমানিক মান (বা অনুপস্থিত মান) খুঁজে পেতে ইন্টারপোলেশন ব্যবহার করা যেতে পারে।

অন্যদিকে, রিগ্রেশন হ'ল ন্যূনতম স্কোয়ার ত্রুটির সাথে পয়েন্টগুলি কাছাকাছি বা তার কাছাকাছি যাওয়ার সময় একটি বক্ররেখাতে কয়েকটি পয়েন্ট সংযুক্ত করার প্রক্রিয়া। রিগ্রেশন এক্স ডোমেনে x = [a, b] ডোমে y এর মান আনুমানিক হিসাবে নির্ধারণ করতে পারে তবে x = (- অনন্ত, ক) এবং x = (এর মধ্যে ডোমেনের y এর মানগুলির জন্য ইন্টারপোলেশনের চেয়ে রিগ্রেশন আরও ভাল পূর্বাভাস সরবরাহ করে ( খ, + অনন্ত)।

সংক্ষিপ্তসার হিসাবে, দ্বিখণ্ডক একটি ज्ञিত এক্স পরিসরের ডোমেনের মধ্যে y এর মানকে আরও ভাল নির্ভুলতা প্রদান করে যখন রিগ্রেশনটি নীচের ডোমেনে এবং এক্স এর পরিচিত পরিসীমা ছাড়িয়ে y এর আরও ভাল পূর্বাভাস সরবরাহ করে।


3
এটি বহুবৃত্তীয় ব্যবহৃত হয় এমন বিভাজনের সংজ্ঞা নয়। অন্যান্য মসৃণ ফাংশন উপযুক্ত হতে পারে।
নিক কক্স

3
আপনার দাবির সাথে অন্যান্য সমস্যা রয়েছে। উদাহরণস্বরূপ, রিগ্রেশন ইন্টারপোলেশনের চেয়ে আরও সঠিক হতে পারে। দুটি পদ্ধতির মধ্যে পরিসংখ্যানগত পার্থক্য আপনার প্রতিনিধিত্বকারী থেকে একেবারে পৃথক: দয়া করে এই থ্রেডের অন্যান্য পোস্টগুলি দেখুন।
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.