আমি কয়েক বছর আগে একবার এটি স্ক্র্যাচ থেকে প্রোগ্রাম করেছি এবং আমার কম্পিউটারে পিস-ভিত্তিক লিনিয়ার রিগ্রেশন করার জন্য আমার একটি মতলব ফাইল রয়েছে। প্রায় 1 থেকে 4 ব্রেকপয়েন্টগুলি প্রায় 20 পরিমাপের পয়েন্ট বা তার জন্য কমপিটেশনালভাবে সম্ভব। 5 বা 7 ব্রেক পয়েন্টগুলি সত্যই খুব বেশি হতে শুরু করে।
খাঁটি গাণিতিক পদ্ধতির হিসাবে আমি দেখতে পাচ্ছি আপনার প্রশ্নের নীচের মন্তব্যে লিঙ্কযুক্ত প্রশ্নে ব্যবহারকারী এমবিকিউ দ্বারা প্রস্তাবিত সমস্ত সম্ভাব্য সংমিশ্রণের চেষ্টা করা।
যেহেতু লাগানো লাইনগুলি সমস্ত ক্রমাগত এবং সংলগ্ন (কোনও ওভারল্যাপ নেই) সংযুক্তিগুলি পাস্কাল ত্রিভুজটি অনুসরণ করবে। যদি লাইন বিভাগগুলি দ্বারা ব্যবহৃত ডেটা পয়েন্টগুলির মধ্যে ওভারল্যাপ থাকে তবে আমি বিশ্বাস করি যে সংযোজকগুলি পরিবর্তে দ্বিতীয় ধরণের স্ট্র্লিং নম্বরগুলি অনুসরণ করবে।
আমার মনের সেরা সমাধানটি লাগানো লাইনগুলির সংমিশ্রণটি বেছে নেওয়া উচিত যা লাগানো লাইনের আর lation 2 পারস্পরিক সম্পর্কের মানগুলির সর্বনিম্ন স্ট্যান্ডার্ড বিচ্যুতি রয়েছে। আমি একটি উদাহরণ দিয়ে ব্যাখ্যা করার চেষ্টা করব। মনে রাখবেন যে ডেটাতে কয়টি ব্রেক পয়েন্ট পাওয়া উচিত তা জিজ্ঞাসা করা "ব্রিটেনের উপকূল কত দিন?" যেমন ফ্রোকাল সম্পর্কে বেনোইট ম্যান্ডেলব্রোটস (একজন গণিতবিদ) এর পেপারে। এবং ব্রেক পয়েন্ট এবং রিগ্রেশন গভীরতার মধ্যে একটি বাণিজ্য বন্ধ রয়েছে।
এখন উদাহরণ হিসাবে।
Yএক্সএক্সY
এক্স12345678910111213141516171819202122232425262728Y123456789109876543212345678910আর2l i n e 11 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0000 , 97090 , 89510 , 77340 , 61340 , 43210 , 25580 , 11390 , 027200 , 00940 , 02220 , 02780 , 02390 , 01360 , 00320 , 00040 , 01180 , 04আর2l i n e 20 , 04000 , 01180 , 00040 , 00310 , 01350 , 02380 , 02770 , 02220 , 0093- 1 , 9780 , 02710 , 11390 , 25580 , 43210 , 61340 , 77330 , 89510 , 97081 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 0001 , 000এস ইউ এম ও এফআর2v a l u e s1 , 04001 , 01181 , 00041 , 00311 , 01351 , 02381 , 02771 , 02221 , 00931 , 0000 , 99801 , 00901 , 02921 , 04551 , 04551 , 02911 , 00900 , 99801 , 0001 , 00941 , 02221 , 02781 , 02391 , 01361 , 00321 , 00041 , 01181 , 04s t a n da r dঘe v i a t i o n o fআর20 , 67880 , 69870 , 70670 , 70480 , 69740 , 69020 , 68740 , 69130 , 70040 , 70710 , 66730 , 55230 , 36590 , 12810 , 12820 , 36590 , 55230 , 66720 , 70710 , 70040 , 69140 , 68740 , 69020 , 69740 , 70480 , 70680 , 69870 , 6788
এই y মানগুলির গ্রাফ রয়েছে:
যা স্পষ্টভাবে দুটি বিরতি পয়েন্ট আছে। যুক্তির স্বার্থে আমরা আর ^ 2 পারস্পরিক সম্পর্কের মান গণনা করব (এক্সেল সেল সূত্রগুলির সাথে (ইউরোপীয় ডট-কমা শৈলী)):
=INDEX(LINEST(B1:$B$1;A1:$A$1;TRUE;TRUE);3;1)
=INDEX(LINEST(B1:$B$28;A1:$A$28;TRUE;TRUE);3;1)
দুটি লাগানো লাইনের সমস্ত অ-ওভারল্যাপিং সংমিশ্রণের জন্য । আর ^ 2 মানের সমস্ত সম্ভাব্য জোড়গুলির গ্রাফ রয়েছে:
প্রশ্নটি হল যে আমাদের আর values 2 মানগুলির কোন জোয়ারটি বেছে নেওয়া উচিত এবং শিরোনামে জিজ্ঞাসা করা আমরা কীভাবে একাধিক ব্রেক পয়েন্টগুলিতে সাধারণীকরণ করব? একটি পছন্দ হ'ল সংমিশ্রণটি বেছে নেওয়া যার জন্য আর-স্কোয়ার পারস্পরিক সম্পর্কের যোগফল সর্বাধিক। এটি প্লট করে আমরা নীচের উপরের নীল বক্ররেখা পেতে:
1 , 0455
পিস অনুযায়ী লিনিয়ার রিগ্রেশন - মতলব - একাধিক ব্রেক পয়েন্ট points