কোনও সম্পর্ককে নির্ধারণ করার জন্য 2 অ-স্থিতিশীল সময় সিরিজের তুলনা কীভাবে করবেন?


11

আমার দুটি ডেটা সিরিজ রয়েছে যা সময়ের সাথে সাথে মধ্যযুগীয় বয়সের পরিকল্পনা করে। উভয় সিরিজ সময়ের সাথে সাথে মৃত্যুর বর্ধিত বয়সের চিত্র প্রদর্শন করে তবে একের তুলনায় অন্যটি অনেক কম। আমি নির্ধারণ করতে চাই যে নিম্নের নমুনার মৃত্যুবরণে বয়সের বৃদ্ধিটি ওপরের নমুনার তুলনায় উল্লেখযোগ্যভাবে পৃথক কিনা।

এখানে বছরের পরে অর্ডার করা ডেটা (1972 সাল থেকে 2009 পর্যন্ত অন্তর্ভুক্ত) তিনটি দশমিক স্থানে গোল করা হয়েছে:

Cohort A    70.257  70.424  70.650  70.938  71.207  71.263  71.467  71.763  71.982  72.270  72.617  72.798  72.964  73.397  73.518  73.606  73.905  74.343  74.330  74.565  74.558  74.813  74.773  75.178  75.406  75.708  75.900  76.152  76.312  76.558  76.796  77.057  77.125  77.328  77.431  77.656  77.884  77.983
Cohort B    5.139   8.261   6.094   12.353  11.974  11.364  12.639  11.667  14.286  12.794  12.250  14.079  17.917  16.250  17.321  18.182  17.500  20.000  18.824  21.522  21.500  21.167  21.818  22.895  23.214  24.167  26.250  24.375  27.143  24.500  23.676  25.179  24.861  26.875  27.143  27.045  28.500  29.318

উভয় সিরিজ অ-স্থির- আমি কীভাবে দয়া করে দুটি তুলনা করতে পারি? আমি স্টাটা ব্যবহার করছি। কোন পরামর্শ কৃতজ্ঞচিত্তে গ্রহন করা হবে।

ডেটা প্লট


আপনি যদি আপনার ডেটা, ম্যাটকে একটি লিঙ্ক সরবরাহ করেন তবে সেই তথ্যগুলি অন্তর্ভুক্ত করার জন্য আমরা আপনার প্রশ্নটি সম্পাদনা করতে পারি।
whuber

আমার দুর্দশার প্রতি আপনার আগ্রহের জন্য অনেক ধন্যবাদ - ডেটাতে লিঙ্ক যুক্ত করা হয়েছে। যে কোনও সাহায্যের প্রশংসা করা হবে
ম্যাট

@ ম্যাট: আপনার ডেটাটির দিকে তাকিয়ে দেখে মনে হচ্ছে এগুলি উভয়ই wardর্ধ্বমুখী প্রবণতা। সুতরাং আপনি কি মূলত এই অনুমানের প্রতি আগ্রহী হন যে এক জনগোষ্ঠী অন্যের চেয়ে দ্রুত বাড়ছে?
অ্যান্ড্রু

হ্যাঁ অ্যান্ড্রু - উপরের দলটি সাধারণ জনসংখ্যা, অন্যদিকে মৃত্যুর দরিদ্র বয়সের সহকারীটি একই অবস্থায় মারা যাওয়ার একটি দল। নাল হাইপোথিসিসটি হ'ল যদি তারা নিবিড়ভাবে সম্পর্কযুক্ত হন তবে বেঁচে থাকার যে কোনও উন্নতি সাধারন কারণগুলির কারণে হয় (এবং বলা অবস্থার উন্নত যত্ন নেই)।
ম্যাট হারলি

বৃদ্ধিগুলি, যদিও পরিমাপ করা হয়, এটি এত স্পষ্টতই আলাদা যে কোনও আনুষ্ঠানিক পরীক্ষা করার প্রয়োজন হয় না। (আপনি পি-মান পাবেন10-10অথবা আপনি ঝালগুলি কীভাবে নির্ধারণ করেন এবং তুলনা করেন তা নির্বিশেষে আপনি যতই প্রকারের মডেল করেন তা নির্বিশেষে গুরুত্বপূর্ণ) মজার বিষয় হ'ল 2001 এর কোহোর্ট বি-তে হঠাৎ ধাক্কা; এই পরিবর্তনটি - ছয় বছরের অগ্রগতির তাত্ক্ষণিক ক্ষতির সমতুল্য - পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ।
হোবার

উত্তর:


14

এটি একটি সাধারণ পরিস্থিতি; আসুন এটি রাখা। কীটি গুরুত্বপূর্ণ তা সম্পর্কে ফোকাস করা কী:

  • তথ্য একটি দরকারী বিবরণ প্রাপ্ত।

  • এই বিবরণ থেকে পৃথক বিচ্যুতি মূল্যায়ন।

  • ব্যাখ্যায় সম্ভাবনার সম্ভাব্য ভূমিকা ও প্রভাব মূল্যায়ন করা।

  • মেধা অখণ্ডতা এবং স্বচ্ছতা বজায় রাখা।

এখনও অনেক পছন্দ আছে এবং বিশ্লেষণের অনেক ধরণের বৈধ এবং কার্যকর হবে। আসুন এখানে একটি পদ্ধতির চিত্রিত করুন যা এই মূল নীতিগুলির সাথে তার আনুগত্যের জন্য সুপারিশ করা যেতে পারে।

অখণ্ডতা বজায় রাখতে, আসুন ডেটাগুলি অর্ধভাগে বিভক্ত করুন: 1972 থেকে 1990 পর্যন্ত পর্যবেক্ষণগুলি এবং 1991 সাল থেকে 2009 সাল পর্যন্ত (প্রতিটি ক্ষেত্রে 19 বছর) পর্যবেক্ষণগুলি। আমরা প্রথমার্ধে মডেলগুলি ফিট করব এবং তারপরে দ্বিতীয়ার্ধে প্রজেক্ট করার জন্য ফিটগুলি কতটা ভাল কাজ করে তা দেখুন। এটি দ্বিতীয়ার্ধের মধ্যে ঘটেছিল এমন উল্লেখযোগ্য পরিবর্তনগুলি সনাক্ত করার অতিরিক্ত সুবিধা রয়েছে।

একটি দরকারী বিবরণ পেতে, আমাদের (ক) পরিবর্তনগুলি পরিমাপ করার একটি উপায় খুঁজে বের করতে হবে এবং (খ) এই পরিবর্তনগুলির জন্য উপযুক্ততম সম্ভাব্য মডেলটি ফিট করতে হবে, এটি মূল্যায়ন করতে হবে এবং সহজ মডেলগুলি থেকে বিচ্যুতি সামঞ্জস্য করার জন্য আরও জটিল জটিলগুলি পুনরুদ্ধার করতে হবে।

(ক) আপনার অনেক পছন্দ আছে: আপনি কাঁচা ডেটা দেখতে পারেন; আপনি তাদের বার্ষিক পার্থক্য তাকান করতে পারেন; আপনি লগারিদমগুলির সাথে এটি করতে পারেন (আপেক্ষিক পরিবর্তনগুলি মূল্যায়ন করতে); আপনি হারিয়ে যাওয়া বছরের জীবন বা আপেক্ষিক আয়ু (আরএলই) মূল্যায়ন করতে পারেন; বা অন্য অনেক জিনিস। কিছুটা চিন্তাভাবনা করার পরে, আমি আরএলই বিবেচনা করার সিদ্ধান্ত নিয়েছি, কোহোর্ট বি-তে তুলনামূলকভাবে কোহোর্ট বি এর আয়ু অনুপাত হিসাবে সংজ্ঞায়িত হয়েছে সৌভাগ্যক্রমে, গ্রাফগুলি দেখায়, কোহর্ট এ-এর আয়ু নিয়মিতভাবে বাড়ছে সময়ের সাথে সাথে ফ্যাশন, যাতে আরএলই-তে বেশিরভাগ এলোমেলো চেহারার তারতম্য কোহোর্ট বি-র পরিবর্তনের কারণে ঘটে

(খ) শুরু করার সবচেয়ে সহজতম মডেলটি একটি লিনিয়ার প্রবণতা। আসুন দেখুন এটি কতটা ভাল কাজ করে।

চিত্র 1

এই প্লটের গা blue় নীল পয়েন্টগুলি হ'ল ফিটিংয়ের জন্য রাখা ডেটা; হালকা সোনার পয়েন্টগুলি পরবর্তী ডেটা, ফিটের জন্য ব্যবহৃত হয় না। কালো লাইনটি .009 / বছরের slালু সহ উপযুক্ত। ড্যাশযুক্ত রেখাগুলি পৃথক ভবিষ্যতের মানগুলির জন্য পূর্বাভাস অন্তর v

সামগ্রিকভাবে, ফিটটি দেখতে দুর্দান্ত দেখাচ্ছে: অবশিষ্টাংশগুলির পরীক্ষা (নীচে দেখুন) সময়ের সাথে সাথে তাদের আকারগুলিতে কোনও গুরুত্বপূর্ণ পরিবর্তন দেখা যায় না (ডেটা পিরিয়ড 1972-1990 সময়কালে)। (কিছুটা ইঙ্গিত পাওয়া যায় যে তারা যখন প্রারম্ভিক আয়ু কম ছিল তখন তাদের প্রারম্ভিক আকারে বড় হতে থাকে। সিরিয়াল সম্পর্কের (ইতিবাচক কয়েকটি রান এবং নেতিবাচক অবশিষ্টাংশের রান দ্বারা প্রদর্শিত), তবে স্পষ্টতই এটি গুরুত্বহীন। কোনও আউটলিয়ার নেই, যা পূর্বাভাস ব্যান্ডের বাইরে পয়েন্টগুলি দ্বারা নির্দেশিত হবে।

একটি আশ্চর্যের বিষয় হ'ল 2001 সালে মানগুলি হঠাৎ করে নীচের ভবিষ্যদ্বাণী ব্যান্ডের কাছে পড়ে এবং সেখানেই থাকে: হঠাৎ হঠাৎ বড় কিছু ঘটেছিল এবং অবিচল থাকে।

এখানে অবশিষ্টাংশগুলি রয়েছে, যা পূর্বে উল্লিখিত বিবরণ থেকে বিচ্যুতি

চিত্র ২

যেহেতু আমরা অবশিষ্টগুলি 0 টির সাথে তুলনা করতে চাই, উল্লম্ব লাইনগুলি ভিজ্যুয়াল সহায়তা হিসাবে শূন্য স্তরে টানা হয়। আবার, নীল পয়েন্টগুলি ফিটগুলির জন্য ব্যবহৃত ডেটা দেখায়। হালকা স্বর্ণগুলি হ'ল 2000 সালের পরে নিম্ন ভবিষ্যদ্বাণী সীমাটির নিকটবর্তী হওয়া ডেটাগুলির অবশিষ্টাংশ।

এই চিত্র থেকে আমরা অনুমান করতে পারি যে 2000-2001 পরিবর্তনের প্রভাব প্রায় -0.07 ছিল । এটি কোহোর্ট বি এর মধ্যে পুরো জীবনকালের আকস্মিকভাবে 0.07 (7%) ড্রপ প্রতিফলিত করে that ড্রপের পরে, অবশিষ্টাংশের অনুভূমিক প্যাটার্নটি দেখায় যে পূর্ববর্তী প্রবণতা অব্যাহত ছিল, তবে নতুন নিম্ন স্তরে। বিশ্লেষণের এই অংশটি অনুসন্ধানমূলক হিসাবে বিবেচনা করা উচিত : এটি নির্দিষ্টভাবে পরিকল্পনা করা হয়নি, তবে বহির্ভূত তথ্যগুলির মধ্যে একটি আশ্চর্যজনক তুলনা (1991-2009) এবং বাকী ডেটার সাথে ফিট করার কারণে এটি এসেছে।

অন্য একটি জিনিস - এমনকি মাত্র 19 প্রাথমিক বছরের ডেটা ব্যবহার করে, opeালের মানক ত্রুটিটি ছোট: এটি কেবল .0009, .009 এর আনুমানিক মানের দশমাংশের। স্বাধীনতার 17 ডিগ্রি সহ 10 টি সম্পর্কিত টি-পরিসংখ্যান অত্যন্ত তাত্পর্যপূর্ণ (পি-মান এর চেয়ে কম)10-7); যে, আমরা আত্মবিশ্বাসী হতে পারি প্রবণতা সুযোগ কারণে নয়। এটি বিশ্লেষণে সুযোগের ভূমিকা সম্পর্কে আমাদের মূল্যায়নের একটি অংশ। অন্যান্য অংশগুলি অবশিষ্টাংশগুলির পরীক্ষা are

এই তথ্যগুলিতে আরও জটিল মডেলের ফিট করার কোনও কারণ নেই বলে মনে হয়, সময়ের সাথে সাথে আরএলইতে আসল প্রবণতা আছে কিনা তা অনুমান করার উদ্দেশ্যে নয়: একটি রয়েছে। আমরা আমাদের অনুমানকে আরও পরিমার্জন করতে 2001-এর পূর্বের মানগুলিতে এবং 2000-পরবর্তী মানগুলিতে ডেটা বিভক্ত করতে পারিপ্রবণতাগুলির মধ্যে, তবে অনুমানের পরীক্ষাগুলি করা সম্পূর্ণরূপে সত্য হবে না। পি-মানগুলি কৃত্রিমভাবে কম হবে, কারণ বিভাজন পরীক্ষা আগে থেকেই পরিকল্পনা করা হয়নি। তবে অনুসন্ধানের অনুশীলন হিসাবে এ জাতীয় অনুমান ঠিক আছে। আপনার ডেটা থেকে আপনি যা পারেন তা শিখুন! অতিমাত্রায় নিজেকে (যাতে আপনি প্রায় অর্ধ ডজন প্যারামিটার বা তার বেশি ব্যবহার করেন বা স্বয়ংক্রিয় ফিটিং কৌশলগুলি ব্যবহার করেন তবে প্রায় ঘটবে তা নিশ্চিত) বা ডেটা স্নুপিং: আনুষ্ঠানিক নিশ্চিতকরণ এবং অনানুষ্ঠানিকতার মধ্যে পার্থক্য সম্পর্কে সতর্ক থাকুন (তবে তবে মূল্যবান) ডেটা এক্সপ্লোরেশন।

সংক্ষেপে বলা যাক:

  • আয়ুষ্কালের উপযুক্ত পরিমাপ (আরএলই) বাছাই করে, অর্ধেক তথ্য রেখে, একটি সাধারণ মডেল ফিটিং করে, এবং সেই মডেলটিকে অবশিষ্ট তথ্যের বিপরীতে পরীক্ষা করে আমরা দৃ confidence় আত্মবিশ্বাসের সাথে প্রতিষ্ঠা করেছি যে : একটি ধারাবাহিক প্রবণতা ছিল; এটি দীর্ঘ সময় ধরে লিনিয়ারের কাছাকাছি ছিল; এবং 2001 সালে আরএলইতে হঠাৎ অবিরাম অবিরাম ড্রপ হয়েছিল।

  • আমাদের মডেল লক্ষণীয়ভাবে পার্সামোনিয়াস : প্রাথমিক তথ্য সঠিকভাবে বর্ণনা করার জন্য এটি কেবল দুটি সংখ্যার (একটি interাল এবং আটকানো) প্রয়োজন। এই বিবরণ থেকে একটি সুস্পষ্ট কিন্তু অপ্রত্যাশিত প্রস্থান বর্ণনা করতে এটি একটি তৃতীয় (বিরতির তারিখ, 2001) প্রয়োজন। এই থ্রি-প্যারামিটার বর্ণনার সাথে সম্পর্কিত কোনও আউটলিয়ার নেই। সিরিয়াল পারস্পরিক সম্পর্ক (সাধারণত সময়-সিরিজের কৌশলগুলির ফোকাস) চিহ্নিত করে, পৃথক পৃথক বিচ্যুতিগুলি (অবশিষ্টাংশগুলি) প্রদর্শিত বা আরও জটিল ফিটগুলি উপস্থাপনের মাধ্যমে (যেমন একটি চতুর্ভুজ সময় উপাদান যুক্ত করার মাধ্যমে) মডেলটি যথেষ্ট পরিমাণে উন্নতি করতে যাচ্ছে না বা সময়ের সাথে সাথে আকারগুলির আকারগুলিতে মডেলিংয়ের পরিবর্তন)।

  • প্রবণতা প্রতি বছর 0.009 আরএলই হয়েছে । এর অর্থ হ'ল প্রতিটি অতিক্রান্ত বছরটির সাথে, কোহোর্ট বি এর মধ্যে আয়ুর পরিপূর্ণতা একটি সম্পূর্ণ প্রত্যাশিত স্বাভাবিক জীবনকালকে 0.009 (প্রায় 1%) যুক্ত করেছে। সমীক্ষা চলাকালীন (৩) বছর), যা পুরো আজীবন উন্নতির এক তৃতীয়াংশ 37 37 * 0.009 = 0.34 = এক তৃতীয়াংশ হবে। 2001-এর বিপর্যয় 1972 থেকে ২০০৯ সাল পর্যন্ত পুরো আয়কালের প্রায় 0.28 এ লাভ হ্রাস করে (যদিও সেই সময়ের মধ্যে সামগ্রিক আয়ু 10% বৃদ্ধি পেয়েছিল)।

  • যদিও এই মডেলটি উন্নত করা যেতে পারে, সম্ভবত এটির জন্য আরও পরামিতিগুলির প্রয়োজন হবে এবং উন্নতিটি দুর্দান্ত হওয়ার সম্ভাবনা নেই (অবশিষ্টাংশের সত্যায়নের কাছাকাছি এলোমেলো আচরণ হিসাবে)। সামগ্রিকভাবে, অতএব, আমাদের এত কম বিশ্লেষণমূলক কাজের জন্য ডেটা যেমন একটি কমপ্যাক্ট, দরকারী, সহজ বিবরণে পৌঁছানোর বিষয়বস্তু হওয়া উচিত


: চিহ্নিত এক সময়ের ডালগুলি বুদ্ধিমানের পূর্বাভাসে কোনও ভূমিকা
রাখবে না

2

আমার মনে হয় যে আমার মতো নন-টাইম সিরিজের ব্যক্তির পক্ষে হুবুহু উত্তরটি সোজা এবং সহজ একটি। আমি আমার উপর ভিত্তি করে। আমার উত্তরটি আর স্ট্যাটায় নয় কারণ স্ট্যাটা আমি ভাল করে জানি না।

আমি অবাক হই যে প্রশ্নটি আসলে আমাদের দুটি বছরের মধ্যে (তুলনামূলক তুলনায়) বছরের বৃদ্ধিের পরম বছর একই কিনা তা দেখতে আমাদের জিজ্ঞাসা করছে? আমি মনে করি এটি গুরুত্বপূর্ণ এবং নীচে এটি চিত্রিত করুন। নিম্নলিখিত খেলনা উদাহরণ বিবেচনা করুন:

a <- 21:40
b <- 41:60
x <- 1:20
plot(y = a, x = x, ylim = c(0, 60))
points(y = b, x = x, pch = 2)

এখানে চিত্র বর্ণনা লিখুন

এখানে আমাদের ২ জন সহকর্মী রয়েছে যার প্রত্যেকটিরই প্রতি বছর স্থায়ীভাবে এক বছর বৃদ্ধি হয় মধ্যম বেঁচে থাকার জন্য। সুতরাং প্রতি বছর এই উদাহরণে উভয় দল একই পরম পরিমাণে বৃদ্ধি পায়, তবে আরএলই নিম্নলিখিতটি দেয়:

rle <-  a / b
plot(rle)

এখানে চিত্র বর্ণনা লিখুন

স্পষ্টতই একটি wardর্ধ্বমুখী প্রবণতা রয়েছে, এবং অনুমানটি পরীক্ষা করার জন্য p মান 0 রেখার গ্রেডিয়েন্টটি 2.2e-16 হয়। লাগানো সোজা লাইন (আসুন উপেক্ষা করুন যে এই লাইনটি বাঁকা দেখাচ্ছে) এর গ্রেডিয়েন্টটি 0.008 রয়েছে। সুতরাং যদিও উভয় দলের এক বছরে একই পরম বৃদ্ধি পেয়েছে, আরএলই-র একটি anর্ধ্বমুখী opeাল রয়েছে।

সুতরাং আপনি যখন নিরঙ্কুশ বৃদ্ধিগুলি সন্ধান করতে চান আপনি যদি আরএলই ব্যবহার করেন তবে আপনি অনুপযুক্তভাবে নাল অনুমানটিকে প্রত্যাখ্যান করবেন।

সরবরাহ করা ডেটা ব্যবহার করে, আমরা যে সহকারীর সাথে পাচ্ছি তার মধ্যে পরম পার্থক্য গণনা: এখানে চিত্র বর্ণনা লিখুন

যা সূচিত করে যে মিডিয়ান বেঁচে থাকার মধ্যকার পরম পার্থক্য ধীরে ধীরে হ্রাস পাচ্ছে (অর্থাত্ দরিদ্র বেঁচে থাকার সহযাত্রী ধীরে ধীরে আরও ভাল বেঁচে থাকার সাথে কোহরের নিকটবর্তী হচ্ছে)।


: অ্যান্ড্রু আপনার গ্রাফের শেষে অবশিষ্ট দুটি ক্লাস্টার নোট করুন। এটি আপনার বিশ্লেষণে একটি সম্ভাব্য ঘাটতি প্রস্তাব করে। দুর্ভাগ্যক্রমে এমনকি দক্ষ গণিতবিদরা যারা দক্ষ পরিসংখ্যানবিদও হন কখনও কখনও সময় সিরিজের লোক হন না। আমি যা পরামর্শ দিয়েছি তা হ'ল সময় সিরিজের বিশ্লেষণের মানক অপারেটিং পদ্ধতি।
আইরিশস্ট্যাট

@ অ্যান্ড্রু চমৎকার প্রতিক্রিয়া আমি upvated, আমি আপনার যোগ্যতা বিশ্বাস করি!
আদম

1
: অ্যাডাম আপনার সুন্দর কথার জন্য ধন্যবাদ। আপনি নোট করবেন যে আমি কেবল টাইম সিরিজের সমস্যা / প্রশ্ন নিয়েই মতামত জানাই যেখানে আমি গত 40 বছর ধরে এই ক্ষেত্রে বিশেষায়িত হয়েছি বলে আমার কিছু দক্ষতা আছে।
আইরিশস্ট্যাট

@ আইরিশ স্ট্যাট একটি স্পর্শ বিচ্ছিন্ন। দুর্দান্ত অভিজ্ঞতা, আমার জন্মের আগে থেকেই আপনি আমার মতো পাঁক লাগিয়ে রেখেছেন।
অ্যাডাম

: অ্যাডাম পুরো ধারণাটি অন্য ব্যক্তিকে সহায়তা করা। আমি সত্যিই আশা করি যে এটি হয়েছে। আমি "পাঙ্কস" শব্দটি দ্বারা বিভ্রান্ত হয়ে পড়েছি কারণ আমার তেমন অনুভূতি নেই। শুধু সাহায্য করার চেষ্টা করছি!
আইরিশস্ট্যাট

1

এই দুটি সময়ের সিরিজের মনে হয় একটি নির্বিচার ট্রেন্ড রয়েছে। এটি এমন একটি সম্পর্ক যা পরবর্তী বিশ্লেষণের আগে আপনি অবশ্যই মুছে ফেলতে চান। ব্যক্তিগতভাবে, আমি নিম্নলিখিত হিসাবে এগিয়ে যেতে হবে:

1) আমি প্রতিটি সময় সিরিজের জন্য একটি ধ্রুবক এবং একটি সময়ের বিরুদ্ধে একটি রিগ্রেশন চালাব, এবং প্রতিটি সময় সিরিজের জন্য অবশিষ্টাংশ গণনা করব।

২) উপরোক্ত পদক্ষেপে গণনা করা দুটি অবশেষ সিরিজ নিয়ে, আমি একটি সাধারণ লিনিয়ার রিগ্রেশন চালিয়ে যাব (একটি ধ্রুবক শব্দ ব্যতীত) এবং টি-স্ট্যাটিস্টিক, পি-মানটি দেখব এবং সিদ্ধান্ত নিয়েছি যে এর মধ্যে আরও নির্ভরতা রয়েছে কি না? দুটি সিরিজ।

এই বিশ্লেষণটি লিনিয়ার রিগ্রেশনটিতে আপনি যে ধারনা তৈরি করেছেন একই সেটটি ধরে নিয়েছে।


: ব্যবহারকারী 3544 একটি ধ্রুবকের বিরুদ্ধে সময়মতো রিগ্রেশন চালানো হ'ল একধরণের অবনতি যা প্রাক-সাদা করার এক প্রকার; ডিফারেন্সিং হ'ল প্রাক-সাদা করার আরও একটি রূপ: উভয়ই অনুমানযোগ্য কারণ একাধিক প্রবণতা বা বিবিধ অপারেটরগুলির বিভিন্ন রূপ থাকতে পারে। মনে রাখবেন যে ডিফারেন্সিং অপারেটর একটি এআরআইএমএ ফিল্টারের একটি বিশেষ কেস যা একটি সিরিজকে সাদা আওয়াজে রূপান্তর করে। সাধারণভাবে এক্স
শব্দটিকে শোনার

: ব্যবহারকারী 3544 আপনার সহজ সরল জটিল একক প্রবণতা ব্যবহার করে আপনার প্রশংসা করা উচিত ছিল তবে আমি মনে করি যে কখনও কখনও অনুমান করা উচিত নয় A সিরিজের স্তর পরিবর্তন বা প্রচুর ট্রেন্ড থাকলে সাধারণ প্রবণতা প্রায়শই অকেজো। পরামিতিগুলির স্থায়িত্ব সম্পর্কিত পরীক্ষার অনুমানকে দৃust় এবং পরিচালনা করা দরকার যেখানে চৌ সময়কালের সাহায্যে নির্বিচারে বিন্দুটি বেছে নেওয়ার পরিবর্তে পরামিতিগুলি পরিবর্তিত হয়ে থাকতে পারে এমন সময়ে পয়েন্টগুলির জন্য অনুসন্ধান করে। এটি সর্বজনবিদিত যে অটো-পারস্পরিক সম্পর্কের জন্য অস্বাভাবিক মানগুলি নিম্নগামী পক্ষপাত পরীক্ষা করে যার জন্য তাদের এগুলি সনাক্ত করা দরকার।
আইরিশস্ট্যাট

আইরিশস্ট্যাট: আপনার প্রশংসা প্রশংসা পেয়েছে এবং শুনেছি .. :) আমি দুটি মন্তব্যের সাথে সম্পূর্ণরূপে একমত, যদিও দুটি সময় সিরিজের প্লটগুলি পেয়েছি, আমি ভেবেছিলাম "আসুন এটি সহজ
রাখি

1
: ব্যবহারকারী 3544 আমার প্রিয় আইনস্টাইনের উদ্ধৃতিটি "যতটা সম্ভব সবকিছু সহজ করুন, তবে সহজ নয়" বা পুনরুদ্ধার করা মডেলগুলিকে যথাসম্ভব সহজ সরল করুন, তবে সহজ নয় কারণ কিছু লোক সাধারণকে উদ্দেশ্য বলে মনে করেন যদিও এটি অপর্যাপ্ত বিশ্লেষণের কারণ হতে পারে। এক্ষেত্রে আপনার পরামর্শটি স্তরের শিফট আলোকিত করার সময় দুটি সমাহার মধ্যে সমসাময়িক পারস্পরিক সম্পর্ক এবং ল্যাগ পারস্পরিক সম্পর্ক চিহ্নিত করার পক্ষে যথেষ্ট হবে। আরও পড়ুন: brainyquote.com/quotes/quotes/a/…
আইরিশস্ট্যাট

0

কিছু ক্ষেত্রে কেউ একটি তাত্ত্বিক মডেল জানেন যা আপনার অনুমানটি পরীক্ষা করতে ব্যবহার করতে পারে। আমার বিশ্বে "জ্ঞান" প্রায়শই অনুপস্থিত থাকে এবং একটিতে অবশ্যই পরিসংখ্যানগত কৌশলগুলি অবলম্বন করা উচিত যা অনুসন্ধানের তথ্য বিশ্লেষণ হিসাবে শ্রেণীবদ্ধ করা যেতে পারে যা নিম্নলিখিতগুলির সংক্ষিপ্তসার দেয় W মিথ্যা ধনাত্মক হিসাবে সহজেই খুঁজে পাওয়া যায় বলে প্রায়শই বিভ্রান্তকারী ইনসোফার। এর প্রথম দিকের বিশ্লেষণগুলির মধ্যে একটি ইউইউ, জিইউ, 1926 সালে পাওয়া যায়, "কেন আমরা মাঝে মাঝে সময় সিরিজের মধ্যে বোকামি সম্পর্কিত সম্পর্ক পাই? নমুনা বিষয়ে একটি গবেষণা এবং সময় সিরিজের প্রকৃতি", রয়্যাল স্ট্যাটিস্টিকাল সোসাইটির 89, 1– এর জার্নাল 64। বিকল্পভাবে যখন সিরিজের এক বা একাধিক তারা ব্যতিক্রমী ক্রিয়াকলাপ দ্বারা প্রভাবিত হয়ে থাকে (ঝাঁকুনি দেখুন " 2001 সালে কোহোর্ট বি-তে হঠাৎ ধাক্কা) যা কার্যকরভাবে গুরুত্বপূর্ণ সম্পর্কগুলি আড়াল করতে পারে। এখন সময়ের সিরিজের মধ্যে একটি সম্পর্ক সনাক্তকরণ কেবল সমসাময়িক সম্পর্কই নয়, সম্ভাব্য পিছিয়ে থাকা সম্পর্কগুলিও পরীক্ষা করে বিস্তৃত। অবিরত, যদি উভয়ই ধারাবাহিকতাটি একঘেয়েমি দ্বারা প্রভাবিত হয়ে থাকে (এক-সময়ের ইভেন্ট) তবে আমাদের অবশ্যই এই এক-সময়িক বিকৃতির জন্য সামঞ্জস্য করে আমাদের বিশ্লেষণকে দৃus়তর করতে হবে। সময় সিরিজের সাহিত্যটি আরও পরিষ্কারভাবে কাঠামো সনাক্ত করার জন্য প্রাক-হোয়াইটিংয়ের মাধ্যমে কীভাবে সম্পর্ককে চিহ্নিত করতে হয় তা নির্দেশ করে। আন্তঃ সম্পর্কিত সম্পর্কিত কাঠামো সনাক্তকরণের পূর্বে প্রি-হোয়াইটেনিং ইন্ট্রা-রিলেটিভ কাঠামোর জন্য সামঞ্জস্য করে। লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: এখন সময়ের সিরিজের মধ্যে একটি সম্পর্ক সনাক্তকরণ কেবল সমসাময়িক সম্পর্কই নয়, সম্ভাব্য পিছিয়ে থাকা সম্পর্কগুলিও পরীক্ষা করে বিস্তৃত। অবিরত, যদি উভয়ই ধারাবাহিকতাটি একঘেয়েমি (এক-সময় ইভেন্ট) দ্বারা প্রভাবিত হয়ে থাকে তবে আমাদের অবশ্যই এই এক-সময়ের বিকৃতির জন্য সামঞ্জস্য করে আমাদের বিশ্লেষণকে শক্তিশালী করতে হবে। সময় সিরিজের সাহিত্যটি আরও পরিষ্কারভাবে কাঠামো সনাক্ত করার জন্য প্রাক-হোয়াইটিংয়ের মাধ্যমে কীভাবে সম্পর্ককে চিহ্নিত করতে হয় তা নির্দেশ করে। আন্তঃ সম্পর্কিত সম্পর্কিত কাঠামো সনাক্তকরণের পূর্বে প্রি-হোয়াইটেনিং ইন্ট্রা-রিলেটিভ কাঠামোর জন্য সামঞ্জস্য করে। লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: এখন সময়ের সিরিজের মধ্যে একটি সম্পর্ক সনাক্তকরণ কেবল সমসাময়িক সম্পর্কই নয়, সম্ভাব্য পিছিয়ে থাকা সম্পর্কগুলিও পরীক্ষা করে বিস্তৃত। অবিরত, যদি উভয়ই ধারাবাহিকতাটি একঘেয়েমি (এক-সময় ইভেন্ট) দ্বারা প্রভাবিত হয়ে থাকে তবে আমাদের অবশ্যই এই এক-সময়ের বিকৃতির জন্য সামঞ্জস্য করে আমাদের বিশ্লেষণকে শক্তিশালী করতে হবে। সময় সিরিজের সাহিত্যটি আরও পরিষ্কারভাবে কাঠামো সনাক্ত করার জন্য প্রাক-হোয়াইটিংয়ের মাধ্যমে কীভাবে সম্পর্ককে চিহ্নিত করতে হয় তা নির্দেশ করে। আন্তঃ সম্পর্কিত সম্পর্কিত কাঠামো সনাক্তকরণের পূর্বে প্রি-হোয়াইটেনিং ইন্ট্রা-রিলেটিভ কাঠামোর জন্য সামঞ্জস্য করে। লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: যদি উভয়ই ধারাবাহিকতাটি একঘেয়েমি দ্বারা প্রভাবিত হয়ে থাকে (এককালীন ইভেন্টগুলি) তবে আমাদের অবশ্যই এই এক-সময়ের বিকৃতির জন্য সামঞ্জস্য করে আমাদের বিশ্লেষণকে শক্তিশালী করতে হবে। সময় সিরিজের সাহিত্যটি আরও পরিষ্কারভাবে কাঠামো সনাক্ত করার জন্য প্রাক-হোয়াইটিংয়ের মাধ্যমে কীভাবে সম্পর্ককে চিহ্নিত করতে হয় তা নির্দেশ করে। আন্তঃ সম্পর্কিত সম্পর্কিত কাঠামো সনাক্তকরণের পূর্বে প্রি-হোয়াইটেনিং ইন্ট্রা-রিলেটিভ কাঠামোর জন্য সামঞ্জস্য করে। লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: যদি উভয়ই ধারাবাহিকতাটি একঘেয়েমি দ্বারা প্রভাবিত হয়ে থাকে (এককালীন ইভেন্টগুলি) তবে আমাদের অবশ্যই এই এক-সময়ের বিকৃতির জন্য সামঞ্জস্য করে আমাদের বিশ্লেষণকে শক্তিশালী করতে হবে। সময় সিরিজের সাহিত্যটি আরও পরিষ্কারভাবে কাঠামো সনাক্ত করার জন্য প্রাক-হোয়াইটিংয়ের মাধ্যমে কীভাবে সম্পর্ককে চিহ্নিত করতে হয় তা নির্দেশ করে। আন্তঃ সম্পর্কিত সম্পর্কিত কাঠামো সনাক্তকরণের পূর্বে প্রি-হোয়াইটেনিং ইন্ট্রা-রিলেটিভ কাঠামোর জন্য সামঞ্জস্য করে। লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে: লক্ষ্য করুন কী শব্দটি কাঠামো চিহ্নিত করছে। এই পদ্ধতির সাহায্যে সহজেই নিম্নলিখিত "দরকারী মডেল" বাড়ে:

ওয়াই (টি) = -194.45
+ [এক্স 1 (টি)] [(+ 1.2396+ 1.6523 বি ** 1)] কোহরাটা

   +[X2(T)][(- 3.3924)]                :PULSE          3

   +[X3(T)][(- 2.4760)]                :LEVEL SHIFT   30 reflecting persistant  unusal activity

   +[X4(T)][(+ 1.1453)]                :PULSE         29

   +[X5(T)][(- 2.7249)]                :PULSE         11

   +[X6(T)][(+ 1.5248)]                :PULSE         27

   +[X7(T)][(+ 2.1361)]                :PULSE          4

   +[X8(T)][(+ 1.6395)]                :PULSE         13

   +[X9(T)][(- 1.6936)]                :PULSE         12

   +[X10(T)[(- 1.6996)]                :PULSE         19

   +[X11(T)[(- 1.2749)]                :PULSE         10

   +[X12(T)[(- 1.2790)]                :PULSE         17

  +       [A(T)]

যা 1.2936 এর সমসাময়িক সম্পর্ক এবং 1.6523 এর পিছনে থাকা প্রভাবের পরামর্শ দেয়। মনে রাখবেন যে বেশ কয়েকটি বছর ছিল যেখানে অস্বাভাবিক ক্রিয়াকলাপটি সনাক্ত করা হয়েছিল। (1975,2001,1983,1999,1976,1985,1984,1991 এবং 1989)। বছরের জন্য সামঞ্জস্য আমাদের এই দুটি সিরিজের সম্পর্ক আরও স্পষ্টভাবে মূল্যায়ন করতে দেয়।

পূর্বাভাস দেওয়ার ক্ষেত্রে

মোডেল এক্সআরএমএক্স
ওয়াই হিসাবে প্রকাশিত [টি] = এ [১] ওয়াই [টি -১] + ... + এ [পি] ওয়াই [টিপি]
+ ডাব্লু [০] এক্স [টি-০] + ... + ডাব্লু [আর] এক্স [টিআর]
+ বি [1] এ [টি -১] + ... + বি [কিউ] এ [টিকিউ]
+ ধ্রুবক

ডান দিকের পাশের চুক্তিটি হল: -194.45

COHORTA 0 1.239589 এক্স (39) * 78.228616 = 96.971340

COHORTA 1 1.652332 এক্স (38) * 77.983000 = 128.853835

আমি ~ L00030 0 -2.475963 এক্স (39) * 1.000000 = -2.475963

      NET PREDICTION FOR Y(    39 )=                     28.894826 

চারটি সহগ বা কোহোর্তার জন্য আরিমা মডেল থেকে প্রাপ্ত সময়কাল 39 (78৮.২২6 period১)) সময়কালে কোহোর্টার জন্য অবশ্যই একটি পূর্বাভাস দেওয়ার জন্য প্রয়োজনীয় ছিল।


4
38 বছরের মধ্যে নয়টি "অস্বাভাবিক" ক্রিয়াকলাপ প্রদর্শন করে? (স্পষ্টত) 25 প্যারামিটার সহ একটি মডেলটিতে ?! এই ব্যাখ্যার সাথে কিছু ভুল। এই সমস্ত ডাল এবং লেভেল শিফট ছাড়াও আপনি কি ননলাইনার উপাদানটি কোহোর্ট বিয়ের ট্রেন্ডে খুঁজে পেয়েছেন?
হোবার

2
ডান কলামে সংখ্যাগুলি কী (3, 30, 29, 11 ইত্যাদি)? এগুলি আপনার ডেটা বর্ণনার অংশ বলে মনে হয় এবং তাই পরামিতিগুলিও। এমনকি যদি আমরা সেগুলি গণনা করি না, 38 মানগুলি বর্ণনা করার জন্য 14 পরামিতি ব্যবহার করে, বিশেষত যখন প্রশ্নটি কেবল "কোনও প্রবণতা রয়েছে?", তখন অত্যধিক বলে মনে হয়। এই বিষয়টির জন্য, প্রবণতাটি আসলে কী? এই সমস্ত অনুমানের মধ্যে একটি এটি খনন করে? যদি কোনও চিকিত্সক আপনার কাছে এসে জিজ্ঞাসা করে থাকেন, "ঠিক আছে, 1972 সাল থেকে কোহোর্ট বিতে রোগীদের জন্য কী সম্পাদন করা হয়েছে," আপনি কি তাদের একটি পরিষ্কার বাক্যে বলতে পারেন?
হোয়বার

2
পুনরায় "খুব শক্তিশালী ভবিষ্যদ্বাণী": আপনার মডেলটি কী পরিমাণ তা আমি ভুল বোঝাবুঝি হতে পারি তবে সাধারণভাবে এমন একটি পদ্ধতির (সময়ের সিরিজ বা অন্যথায়) আরও ভাল বিবরণ যা আপনার এক-চতুর্থাংশের ডেটা "অস্বাভাবিক" হিসাবে চিহ্নিত করে এবং "সমন্বয়" প্রয়োজন হবে "অতিশয় সাজানো" এবং "অযথা জটিল"। কোহোর্ট বি-তে কোনও প্রবণতার আপনার বক্তব্য কেবল অবিশ্বাস্য।
হোবার

2
@ অ্যাডাম, কারণ এই বিশ্লেষণটি মূলত 10 "ডাল" এর মধ্যে থাকা পরিবর্তনশীলতার তথ্যগুলিকে উপেক্ষা করে, পূর্বাভাসের চারপাশে যে কোনও পূর্বাভাস ব্যান্ড রাখে তা অত্যন্ত মাত্রায় আশাবাদী (খুব শক্ত) হবে। তদুপরি, একটি গভীর বিশ্লেষণ যা সমস্ত ডেটা অন্তর্ভুক্ত করে (আমার চিত্রের বিশ্লেষণের বিপরীতে যা কেবলমাত্র প্রথমার্ধকে অন্তর্ভুক্ত করে) প্রবণতাটিতে কিছুটা হ্রাসের সাথে সামঞ্জস্য রেখে একটি অরৈখিক উপাদান সনাক্ত করতে পারে এবং এটিও এখানে সনাক্ত করা যায়নি। পূর্বাভাসের চেয়ে বেশি গুরুত্বপূর্ণ হ'ল 2000-2001 এর প্রভাব বোঝা: যদি এটি পুনরুক্ত করা যায় তবে সমস্ত পূর্বাভাস সম্ভবত ভুল।
হোবার

1
@ তবে আমি স্বীকার করি যে সমস্ত প্রযুক্তিগত জারগানটি আমি জানি না, তবে আপনার ব্যাখ্যাটি ভালভাবে বোঝায়। অনেক ধন্যবাদ.
আদম

-1

এই উত্তরটি কিছু গ্রাফিকগুলিকে বিচ্ছিন্ন করে একটি দরকারী মডেল থেকে অবশিষ্টাংশ! [] [1]

প্রকৃতপক্ষে হস্তক্ষেপ পরিষ্কারমডেল অবশিষ্টাংশের এসিএফএখানে চিত্র বর্ণনা লিখুন CohortB এর ফিট এবং পূর্বাভাস মডেল থেকে রেসিডুয়ালসপ্রকৃত ফিট এবং পূর্বাভাস

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.