স্বতঃসংশোধনের সাথে কী চুক্তি?


13

এর উপস্থাপনের জন্য, আমার বেশ গভীর গাণিতিক পটভূমি রয়েছে তবে আমি কখনই সময় সিরিজ বা পরিসংখ্যানের মডেলিংয়ের সাথে মোকাবিলা করি নি। সুতরাং আপনি আমার সাথে খুব নম্র হতে হবে না :)

আমি বাণিজ্যিক ভবনগুলিতে মডেলিং শক্তি ব্যবহার সম্পর্কে এই কাগজটি পড়ছি, এবং লেখক এই দাবি করেছেন:

[স্বতঃসংশ্লিষ্টতার উপস্থিতি দেখা দেয়] কারণ মডেলটি শক্তি ব্যবহারের সময় সিরিজের ডেটা থেকে তৈরি করা হয়েছে, যা অন্তর্নিহিত স্বতঃসংশ্লিষ্ট। সময় সিরিজের ডেটাগুলির জন্য যে কোনও বিশুদ্ধরূপে নির্বিঘ্ন মডেলটির স্বতঃসংশ্লিষ্টতা থাকবে। [আরও বেশি ফুরিয়ার সহগ] মডেলটিতে অন্তর্ভুক্ত করা থাকলে স্বতঃসংশ্লিষ্টতা হ্রাস করতে দেখা যায়। তবে, বেশিরভাগ ক্ষেত্রে ফুরিয়ার মডেলটিতে কম সিভি থাকে মডেল, অতএব, বাস্তব উদ্দেশ্যে উচ্চতর নির্ভুলতার দাবি না করে এমন ব্যবহারিক উদ্দেশ্যে গ্রহণযোগ্য হতে পারে।

০.) "টাইম সিরিজের ডেটাগুলির জন্য কোনও খাঁটি নির্বিচারক মডেলটির স্বতঃসংশোধন হবে" এর অর্থ কী? আমি অস্পষ্টভাবে বুঝতে পারি এর অর্থ কী - উদাহরণস্বরূপ, যদি আপনার 0 টি স্বতঃসংশোধন থাকে তবে আপনি কীভাবে আপনার সময় সিরিজের পরবর্তী পয়েন্টটি পূর্বাভাসের প্রত্যাশা করবেন? এটি কোনও গাণিতিক যুক্তি নয়, এটি নিশ্চিত হওয়ার কারণ এটি কেন 0 :)

১) আমি এই ছাপে ছিলাম যে অটোক্রেরিলেশনটি মূলত আপনার মডেলটিকে হত্যা করেছে, তবে এটি সম্পর্কে চিন্তাভাবনা করে, কেন এটি হওয়া উচিত তা আমি বুঝতে পারি না। তাহলে স্বতঃসংশ্লিষ্ট কেন একটি খারাপ (বা ভাল) জিনিস?

২) স্বতঃসংশ্লিষ্টতার সাথে মোকাবিলা করার জন্য আমি যে সমাধানটি শুনেছি তা হ'ল সময় ধারাবাহিকের পার্থক্য। লেখকের মন পড়ার চেষ্টা না করে, যদি অবহেলিত স্বতঃসংশোধনের অস্তিত্ব থাকে তবে কেন কেউ আলাদা হবে না ?

৩) অ-তুচ্ছ-স্বতঃসংশ্লিষ্ট কোনও মডেলটিতে কোন সীমাবদ্ধতা রয়েছে? এটি কি কোথাও অনুমান করা (যেমন, সাধারণ লিনিয়ার রিগ্রেশন সহ মডেলিংয়ের সময় সাধারণত বিতরণকৃত অবশিষ্টাংশ)?

যাইহোক, দুঃখিত যদি এগুলি প্রাথমিক প্রশ্ন এবং সাহায্যের জন্য অগ্রিম ধন্যবাদ।

উত্তর:


10
  1. আমি মনে করি লেখক সম্ভবত মডেলের অবশিষ্টাংশ সম্পর্কে কথা বলছেন । আমি আরও তীব্র সহগ যোগ করার বিষয়ে তাঁর বক্তব্যের কারণে এই তর্ক করছি; যদি, আমি বিশ্বাস করি, তিনি একটি ফুরিয়ার মডেল ফিট করছেন, তবে আরও সহগ যোগ করা উচ্চতর সিভি ব্যয়ে অবশিষ্টাংশের স্বতঃসংশ্লিষ্টতা হ্রাস করবে।

    আপনার যদি এটি দৃশ্যমান করতে সমস্যা হয় তবে নিম্নলিখিত উদাহরণটি মনে করুন: ধরুন আপনার নীচের 100 টি পয়েন্টের ডেটা সেট রয়েছে যা সাদা গাউসিয়ান শোরগোলের সাথে একটি দ্বি-সহগামী ফুরিয়ার মডেল থেকে আসে:

    Datapoints

    নিম্নলিখিত গ্রাফটি দুটি ফিট দেখায়: একটি 2 ফুরিয়ার সহগ সঙ্গে সম্পন্ন করা হয়, এবং একটি 200 ফুরিয়ার সহগ সহ সম্পন্ন হয়:

    ফিট

    আপনি দেখতে পাচ্ছেন যে 200 ফুরিয়ার সহগগুলি ডেটাপিন্ট আরও ভাল ফিট করে, যখন 2 সহগ ফিট ('আসল' মডেল) মডেল আরও ভাল ফিট করে। এর দ্বারা বোঝা যায় যে 200 সহগের সাথে মডেলের অবশিষ্টাংশগুলির স্বতঃসংশ্লিষ্টতা অবশ্যই 2 সহগের মডেলের অবশিষ্টাংশের তুলনায় সমস্ত ল্যাগে প্রায় শূন্যের কাছাকাছি থাকবে, কারণ 200 সহগ সহ মডেলটি প্রায় সমস্ত ডেটাপয়েন্টগুলিতে ফিট করে (যেমন, অবশিষ্টাংশগুলি প্রায় সমস্ত শূন্য হত্তয়া)। তবে আপনি কী ভাবেন যে আপনি যদি ছেড়ে যান, বলুন, নমুনাটি থেকে 10 টি ডেটাপয়েন্ট এবং একই মডেলগুলি ফিট করে? 2-গুণমানের মডেলটি আপনাকে নমুনা থেকে বেরিয়ে আরও ভাল ডেটাপয়েন্টগুলি পূর্বাভাস দেবে! সুতরাং, এটি 200-সহগ মডেল হিসাবে প্রকাশিত হিসাবে একটি কম সিভি ত্রুটি উত্পাদন করবে; একে বলা হয় ওভারফিটিং। এই 'ম্যাজিক' এর পেছনের কারণ হ'ল সিভি আসলে যা পরিমাপ করার চেষ্টা করে তা হ'ল ভবিষ্যদ্বাণী ত্রুটি , অর্থাত আপনার মডেলটি আপনার ডেটাসেটে ডেটাপয়েন্টগুলিকে কতটা ভালভাবে ভবিষ্যদ্বাণী করে।

  2. এই প্রসঙ্গে, অবশিষ্টাংশগুলিতে স্বতঃসংশ্লিষ্টতা 'খারাপ', কারণ এর অর্থ আপনি যথেষ্ট পরিমাণে ডেটাপয়েন্টের মধ্যে পারস্পরিক সম্পর্ককে মডেলিং করছেন না। লোকেরা কেন সিরিজটি পার্থক্য করে না তার প্রধান কারণ হ'ল তারা প্রকৃতপক্ষে অন্তর্নিহিত প্রক্রিয়াটিকে যেমন মডেল করতে চান । সময়সীমা বা প্রবণতা থেকে মুক্তি পেতে সাধারণত সময় সিরিজের মধ্যে একটি পার্থক্য রাখে, তবে যদি সেই সময়সীমা বা প্রবণতাটি আসলে আপনি মডেল করার চেষ্টা করছেন তবে তাদের আলাদা করা শেষ রিসর্ট বিকল্প হিসাবে মনে হতে পারে (বা একটি বিকল্পের সাথে অবশিষ্টদের মডেল করার জন্য একটি বিকল্প) আরও জটিল স্টোকাস্টিক প্রক্রিয়া)।
  3. এটি সত্যই আপনি যে অঞ্চলে কাজ করছেন তার উপর নির্ভর করে। এটি ডিটারমিনিস্টিক মডেলের ক্ষেত্রেও সমস্যা হতে পারে। তবে স্বতঃসংশ্লিষ্টতার ফর্মের উপর নির্ভর করে এটি সহজেই দেখা যায় যখন স্বতঃসংশোধন উদয় হয়, যেমন, ঝাঁকুনি শব্দ, এআরএমএ-এর মতো শব্দের কারণে বা যদি এটি একটি অবশিষ্ট অন্তর্নিহিত পর্যায়ক্রমিক উত্স হয় (এই ক্ষেত্রে আপনি সম্ভবত বাড়াতে চান ফুরিয়ার সহগের সংখ্যা)।

আপনার প্রতিক্রিয়াটির জন্য আপনাকে ধন্যবাদ, এবং আপনি যদি রাজি হন তবে আমি একবারে এগুলি চেষ্টা করে হজম করতে চাই। ১.) এর জন্য, আরও বেশি ফুরিয়ার সহগগুলি অন্তর্ভুক্ত করে কেন স্বতঃসংশ্লিষ্টতা হ্রাস করে এবং সিভি বাড়িয়ে তোলে তা বোঝার একটি স্বজ্ঞাত উপায় আছে (আমি ধারণা করি এটি কি অবশিষ্টাংশের সিভি?)
বেনডুন্ডি

1
আমি একটি উদাহরণ যুক্ত করেছি। আশা করি এটা সাহায্য করবে. এবং হ্যাঁ, তিনি অবশিষ্টাংশের সিভিতে উল্লেখ করছেন।
নস্টোর

আহ ঠিক আছে, আমি মনে করি আমি দেখছি। আমি যে বিষয়ে 2 জিজ্ঞাসা করতে যাচ্ছিলাম তার সাথে এই সম্পর্কগুলি কীভাবে এই সম্পর্কটিকে আরও ভালভাবে বোঝার জন্য এই মডেলটিকে (সাধারণভাবে) প্যাচিংয়ের বিষয়ে কীভাবে যেতে পারে? আপনি কি ফুরিয়ার সহগের পারস্পরিক সম্পর্ক মেট্রিক্স সম্পর্কে বাধা যুক্ত করতে পারেন?
বেনডুন্ডি

1
এটি একটি কঠিন কাজ যা আমিও করছি। বিশেষত পর্যায়ক্রমিক ডিটারমিনিস্টিক মডেলগুলির সাথে, কী ধরণের শব্দ শোনার মডেলটি ব্যবহার করা উচিত তা জানা সত্যিই শক্ত হয়ে যায়। বড় সমস্যাটি হ'ল আপনি ফুরিয়ার মডেলের সহগের সংখ্যাটি প্রাক-অগ্রাহ্য জানেন না, সুতরাং এগুলি আপনাকে এলোমেলোভাবে পরিবর্তন করতে হবে rand অল্প সংখ্যক ডেটাপয়েন্টের উপস্থিতিতে, আমি অবশ্যই এটির মডেল করার জন্য অবশ্যই একটি বিপরীতমুখী জাম্প এমসিএমসি যাব। আমি বিভিন্ন শব্দের মডেল চেষ্টা করব এবং তাদের মধ্যে এআইসি / বিআইসি তুলনা করব। বড় ডেটাসেটগুলির জন্য তবে এটি অপরিবর্তনীয়।
নস্টোর

3

কেন এই প্রবণতাগুলি অপসারণ করা জরুরি কেন আমার মাথা পেতে চেষ্টা করার সময় এই কাগজটি ' একনোমেট্রিক্সে স্পিউরিয়াস রিগ্রেশনস ইন সহায়ক ' পেয়েছি helpful মূলত যদি দুটি ভেরিয়েবল ট্রেন্ডিং হয় তবে তারা সহ-পৃথক হবে, যা সমস্যার সমাধান for

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.