স্বল্প স্কোয়ারের আনুমানিক প্রশ্ন


11

আমি বৈজ্ঞানিক গণনার উপর একটি কোর্স নিচ্ছি, এবং আমরা সবেমাত্র কমপক্ষে স্কোয়ারের কাছাকাছি চলেছি। আমার প্রশ্নটি বিশেষত বহুভুজ ব্যবহার করে প্রায় অনুমান করা সম্পর্কে। আমি বুঝতে পারি যে আপনার কাছে যদি এন + 1 ডেটা পয়েন্ট থাকে তবে আপনি ডিগ্রি এন এর একটি অনন্য বহুভুজ খুঁজে পেতে পারেন যা এই সমস্ত পয়েন্টকে বর্ণনা করে। তবে আমি এটিও দেখতে পারি কেন এটি সর্বদা আদর্শ নয়। এই জাতীয় পদ্ধতির সাথে ডেটা পয়েন্টগুলির মধ্যে আপনি প্রচুর শব্দ পেতে পারেন। আমি মনে করি একটি নিম্ন ডিগ্রি বহুভিত্তিক পাওয়া খুব ভাল যা আপনার ডেটা যথেষ্ট পরিমাণে অনুমান করে।

আমার প্রশ্ন হ'ল: আপনি কোন ডিগ্রি ব্যবহার করতে চলেছেন তা অনুশীলনে কীভাবে সিদ্ধান্ত নেবেন? থাম্ব একটি নিয়ম আছে, বা এটি শুধুমাত্র হাতের সমস্যার উপর নির্ভর করে? কম বা কম ডিগ্রির মধ্যে সিদ্ধান্ত নেওয়ার সময় আমাদের কি বিভিন্ন ট্রেড অফ বিবেচনায় নিতে হবে? নাকি আমি এখানে কিছু ভুল বুঝছি?

আগাম ধন্যবাদ.


2
আমি মনে করি অনুশীলনে লোকেরা স্প্লাইন ইন্টারপোলেশন এন.ইউইকিপিডিয়া.র.উইকি / স্প্পলাইন_ইন্টারপ্লোলেশন এর মতো জিনিস ব্যবহার করে যাতে লো অর্ডার পোলগুলি ব্যবহার করা যায় তবে সামগ্রিক ডোমেনের ক্ষেত্রে তারা একে অপরের সাথে পুরোপুরি ফিট করে। এইভাবে সামগ্রিক বহুবচনীয় অর্ডারের জন্য অনুমান করার দরকার নেই।
নাসের

লিঙ্কের জন্য ধন্যবাদ। আমরা এখনও ছড়িয়ে পড়েছি না, তাই এটি আকর্ষণীয় পড়া।
উদয় প্রমোদ

আপনি কি করতে চান এটি ঠিক কি? আপনি কি পয়েন্টগুলি ফাঁকে ফাঁকে দেওয়ার বা প্রদত্ত ডেটা ফিট করার চেষ্টা করছেন? উদাহরণস্বরূপ, গোলমাল সহ একটি সাধারণ বিতরণযুক্ত ডেটা ইন্টারপোল্ট করা অকেজো। প্রাক্তনের পক্ষে নাসেরের উত্তর ভাল। পরবর্তীকালের জন্য, ফিট ফাংশনটি সম্পূর্ণরূপে হাতের সমস্যার উপর নির্ভর করে এবং অনেক ক্ষেত্রে এটি বহুবর্ষীয় নয়।
হান্টারজিস্ট

উত্তর:


18

ইন্টারপোলেশন এবং কার্ভ ফিটিংয়ের সর্বাধিক গুরুত্বপূর্ণ বিষয়টি হ'ল অর্ডার পলিনোমিয়াল ফিটগুলি কেন একটি সমস্যা হতে পারে তা বোঝা এবং অন্যান্য বিকল্পগুলি কী এবং তারপরে আপনি বুঝতে পারবেন যে তারা কখন / কোনও পছন্দ নয়।

উচ্চ আদেশের বহুবচন নিয়ে কয়েকটি সমস্যা:

  • পলিনোমিয়ালগুলি প্রাকৃতিকভাবে দোলক ক্রিয়াকলাপ। বহুপথের ক্রমটি বাড়ার সাথে সাথে দোলনের সংখ্যা বৃদ্ধি পায় এবং এই দোলগুলি আরও তীব্র হয়ে ওঠে। আমি এখানে সরল করছি, একাধিক এবং কাল্পনিক শিকড়গুলির সম্ভাবনা এটিকে আরও জটিল করে তোলে, তবে বিষয়টি একই is

  • বহুবর্ষগুলি এক্স-এর সাথে +/- অনন্তর হিসাবে বহুত্বীয় ক্রমের সমান হারে +/- অনন্তত্বের দিকে যায়। এটি প্রায়শই পছন্দসই আচরণ নয়।

  • উচ্চ অর্ডার বহুভুজের জন্য বহুগুণীয় সহগের গণনা করা সাধারণত একটি অসুস্থ শর্তযুক্ত সমস্যা। এর অর্থ হ'ল ছোট ত্রুটি (যেমন আপনার কম্পিউটারে গোল করা) উত্তরে বড় পরিবর্তন আনতে পারে। লিনিয়ার সিস্টেমটি সমাধান করতে হবে যা একটি ভ্যান্ডারমনডে ম্যাট্রিক্সের সাথে জড়িত যা সহজেই অসুস্থ অবস্থায় থাকতে পারে।

আমি মনে করি যে সম্ভবত এই ইস্যুটির হৃদয়টি বক্ররেখা ফিটিং এবং ইন্টারপোলেশনের মধ্যে পার্থক্য ।

ইন্টারপোলেশন ব্যবহার করা হয় যখন আপনি বিশ্বাস করেন যে আপনার ডেটাটি খুব নির্ভুল তাই আপনি চান যে আপনার ফাংশনটি ডেটা পয়েন্টগুলির সাথে সঠিকভাবে মেলে। আপনার ডেটা পয়েন্টগুলির মধ্যে যখন মানগুলির প্রয়োজন হয় তখন সাধারণত কোনও মসৃণ ফাংশন ব্যবহার করা ভাল যা ডেটার স্থানীয় প্রবণতার সাথে মেলে। কিউবিক বা হার্মাইট স্প্লাইজগুলি প্রায়শই এই ধরণের সমস্যার জন্য ভাল পছন্দ কারণ তারা অ-স্থানীয় (প্রদত্ত বিন্দু থেকে দূরে ডেটা পয়েন্টগুলির অর্থ) ডেটাতে পরিবর্তন বা ত্রুটিগুলি খুব সংবেদনশীল এবং বহুভুজের চেয়ে কম দোলনীয় হয়। নিম্নলিখিত ডেটা সেট বিবেচনা করুন:

x = 1   2   3   4   5   6   7   8   9  10
y = 1   1 1.1   1   1   1   1   1   1   1

ক্ষেপক
একটি বহুভুজ ফিটের মধ্যে হার্মাইট স্প্লাইনের চেয়ে বিশেষত ডেটা সেটগুলির কিনারার কাছে অনেক বড় দোলনা থাকে।

অন্যদিকে, কমপক্ষে স্কোয়ারের আনুমানিকতা হ'ল একটি বাঁকানো ফিটিংপ্রযুক্তি. আপনার যখন আপনার ডেটার প্রত্যাশিত কার্যকারিতা সম্পর্কে কিছু ধারণা থাকে তখন কার্ভ ফিটিং ব্যবহার করা হয় তবে সমস্ত ডেটা পয়েন্টগুলিতে হুবহু আপনার পাসওয়ার্ডের দরকার হয় না don't এটি সাধারণত যখন ডেটাতে পরিমাপের ত্রুটি বা অন্যান্য ত্রুটি থাকতে পারে বা আপনি যখন ডেটার সাধারণ প্রবণতা বের করতে ইচ্ছুক হন তখন এটি সাধারণ। সর্বনিম্ন বর্গক্ষেত্রের আনুমানিকতা প্রায়শই কোর্সে ফিরিয়ে আনার জন্য বহুভুজ ব্যবহার করে একটি কোর্সে প্রবর্তন করা হয় কারণ এর ফলে এমন একটি রৈখিক ব্যবস্থা আসে যা সম্ভবত আপনি আপনার কোর্সে আগে শিখেছেন এমন কৌশলগুলি ব্যবহার করে সমাধান করার জন্য তুলনামূলকভাবে সহজ। যাইহোক, কমপক্ষে স্কোয়ার কৌশলগুলি কেবল বহুবর্ষীয় ফিটগুলির চেয়ে অনেক বেশি সাধারণ এবং কোনও ডেটা সেটে কোনও পছন্দসই ফাংশনটি ফিট করার জন্য ব্যবহার করা যেতে পারে। উদাহরণস্বরূপ, যদি আপনি আপনার ডেটা সেটে একটি ক্ষতিকারক বৃদ্ধির প্রবণতা আশা করেন,

অবশেষে, আপনার ডেটা ফিট করার জন্য সঠিক ফাংশনটি বেছে নেওয়া যেমন সঠিকভাবে দ্রবীকরণ বা কমপক্ষে স্কোয়ারের গণনা সম্পাদন করা তত গুরুত্বপূর্ণ। এমনকি এটি করা (সতর্ক) এক্সট্রোপোলেশন সম্ভাবনারও অনুমতি দেয়। নিম্নলিখিত পরিস্থিতি বিবেচনা করুন। 2000-20010 থেকে মার্কিন জনগণের জন্য জনসংখ্যার তথ্য (কয়েক মিলিয়ন মানুষের মধ্যে):

Year:  2000   2001   2002   2003   2004   2005   2006   2007   2008   2010
Pop.: 284.97 287.63 290.11 292.81 295.52 298.38 301.23 304.09 306.77 309.35

ক্ষতিকারক লিনিয়ারাইজড ন্যূনতম স্কোয়ারগুলি ব্যবহার করা N(t)=A*exp(B*t)বা 10 তম অর্ডারের বহুবর্ষীয় ইন্টারপোল্যান্ট নিম্নলিখিত ফলাফল দেয়:
জনসংখ্যার প্লট

মার্কিন জনসংখ্যা বৃদ্ধি কিছুটা তাত্পর্যপূর্ণ নয়, তবে আমি আপনাকে আরও উপযুক্ত বিচারকের বিচারক হতে দেব।


1
আমি আপনার মার্কিন জনসংখ্যার গ্রাফটি দিয়ে একটি পয়েন্টটি করব, মেমোরি থেকে ডোমেনে ভাল ফিট হওয়ার অর্থ এই নয় যে এটি ভালভাবে এক্সট্রোপল হবে। সেই আলোকে, আপনার কাছে যে ডেটা রয়েছে সেই অঞ্চলের বাইরে বৃহত বহুবচনীয় ত্রুটিগুলি দেখানো বিভ্রান্তিকর হতে পারে।
ড্যারিল

@ ড্যারিল একমত হয়েছেন, এ কারণেই আমি জোর দিয়েছি যে অতিরিক্ত চলাচল সতর্কতার সাথে করা উচিত এবং সেই ক্ষেত্রে উপযুক্ত ফাংশন নির্বাচন করা অত্যন্ত গুরুত্বপূর্ণ।
ডগ লিপিনস্কি

অন্তর্দৃষ্টিপূর্ণ উত্তরের জন্য ধন্যবাদ @ ডগলিপিনস্কি লিনিয়ারাইজড ন্যূনতম স্কোয়ারগুলির বিপরীতে আপনি কি বলতে চান তার ব্যাখ্যা আপনি দিতে পারেন?
bela83

@ bela83 সঠিকভাবে উত্তর দেওয়া যে কোনও মন্তব্যের জন্য খুব দীর্ঘ। আমি মনে করি এটি জিজ্ঞাসা করতে চাইলে এটি একটি খুব ভাল নতুন প্রশ্ন হবে।
ডগ লিপিনস্কি

@ ডগলিপিনস্কি আমি চেষ্টা করে দেখব!
bela83

2

অত্যন্ত অবৈজ্ঞানিক, তবে থাম্বের একটি ভাল নিয়ম হল 3 য় ডিগ্রি বহুপদী সাধারণত একটি ভাল শুরু, এবং অনুশীলনে আমি কখনও have ষ্ঠ ডিগ্রি একের বেশি ব্যবহার করতে দেখিনি যার ভাল ফল পাওয়া যায়।

"আদর্শ" বহুপদীটি হ'ল সর্বনিম্ন অর্ডার যা আপনার উদ্দেশ্যটির জন্য নিরব ডেটা উপস্থাপন করে।

যদি আপনার ডেটা এটির অনুমতি দেওয়ার জন্য যথেষ্ট ছোট হয় (তবে এটি সাধারণত হয়), আপনি যতক্ষণ না দোলনা দেখা শুরু না করেন ততক্ষণ আপনি কেবল উচ্চতর অর্ডার বহুত্বগুলি দিয়ে ফিট করার চেষ্টা করতে পারেন যা "ওভারফিটিং" এর চিহ্ন হিসাবে দেখা যায়।

একটি বিকল্প একটি স্মুথিং স্প্লাইন হতে পারে , তবে এটি প্রয়োগের উপর নির্ভর করে। স্প্লাইজস এবং স্মুথিং স্প্লাইসগুলি কেবল বিরতি জন্য ভাল। কোলাহলপূর্ণ তথ্যের জন্য আমি মসৃণ স্প্লাইনের তুলনায় বহুবর্ষীয় ফিটগুলিকে প্রাধান্য দিই তবে আমি যে ডেটা দিয়ে কাজ করি তা সাধারণত বহুবচন দ্বারা সান্নিধ্যযুক্ত।


1

বহুবর্ষের সান্নিধ্যের সাথে আমি একটি শালীনভাবে কার্যকর পদ্ধতির ব্যবহার করেছি বিভিন্ন ডিগ্রির জন্য সর্বনিম্ন-স্কোয়ারের বহুভুজন গণনা করা (উদাহরণস্বরূপ, 1 থেকে 10 পর্যন্ত) এবং তারপরে বক্ররেখাটি বেছে নিন মধ্যবর্তী পয়েন্টগুলিতে অর্ধেক পয়েন্টে গড় স্কোয়ার ত্রুটি হ্রাস করে (যখন আপনার ডেটা সেটে এক্স) পয়েন্ট অনুসারে বাছাই করা। এটি অত্যধিক-গুরুতর দোলনগুলির সাথে কার্ভগুলিকে অস্বীকার করতে সহায়তা করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.