এটি একটি সাধারণ পরিস্থিতি; আসুন এটি রাখা। কীটি গুরুত্বপূর্ণ তা সম্পর্কে ফোকাস করা কী:
তথ্য একটি দরকারী বিবরণ প্রাপ্ত।
এই বিবরণ থেকে পৃথক বিচ্যুতি মূল্যায়ন।
ব্যাখ্যায় সম্ভাবনার সম্ভাব্য ভূমিকা ও প্রভাব মূল্যায়ন করা।
মেধা অখণ্ডতা এবং স্বচ্ছতা বজায় রাখা।
এখনও অনেক পছন্দ আছে এবং বিশ্লেষণের অনেক ধরণের বৈধ এবং কার্যকর হবে। আসুন এখানে একটি পদ্ধতির চিত্রিত করুন যা এই মূল নীতিগুলির সাথে তার আনুগত্যের জন্য সুপারিশ করা যেতে পারে।
অখণ্ডতা বজায় রাখতে, আসুন ডেটাগুলি অর্ধভাগে বিভক্ত করুন: 1972 থেকে 1990 পর্যন্ত পর্যবেক্ষণগুলি এবং 1991 সাল থেকে 2009 সাল পর্যন্ত (প্রতিটি ক্ষেত্রে 19 বছর) পর্যবেক্ষণগুলি। আমরা প্রথমার্ধে মডেলগুলি ফিট করব এবং তারপরে দ্বিতীয়ার্ধে প্রজেক্ট করার জন্য ফিটগুলি কতটা ভাল কাজ করে তা দেখুন। এটি দ্বিতীয়ার্ধের মধ্যে ঘটেছিল এমন উল্লেখযোগ্য পরিবর্তনগুলি সনাক্ত করার অতিরিক্ত সুবিধা রয়েছে।
একটি দরকারী বিবরণ পেতে, আমাদের (ক) পরিবর্তনগুলি পরিমাপ করার একটি উপায় খুঁজে বের করতে হবে এবং (খ) এই পরিবর্তনগুলির জন্য উপযুক্ততম সম্ভাব্য মডেলটি ফিট করতে হবে, এটি মূল্যায়ন করতে হবে এবং সহজ মডেলগুলি থেকে বিচ্যুতি সামঞ্জস্য করার জন্য আরও জটিল জটিলগুলি পুনরুদ্ধার করতে হবে।
(ক) আপনার অনেক পছন্দ আছে: আপনি কাঁচা ডেটা দেখতে পারেন; আপনি তাদের বার্ষিক পার্থক্য তাকান করতে পারেন; আপনি লগারিদমগুলির সাথে এটি করতে পারেন (আপেক্ষিক পরিবর্তনগুলি মূল্যায়ন করতে); আপনি হারিয়ে যাওয়া বছরের জীবন বা আপেক্ষিক আয়ু (আরএলই) মূল্যায়ন করতে পারেন; বা অন্য অনেক জিনিস। কিছুটা চিন্তাভাবনা করার পরে, আমি আরএলই বিবেচনা করার সিদ্ধান্ত নিয়েছি, কোহোর্ট বি-তে তুলনামূলকভাবে কোহোর্ট বি এর আয়ু অনুপাত হিসাবে সংজ্ঞায়িত হয়েছে সৌভাগ্যক্রমে, গ্রাফগুলি দেখায়, কোহর্ট এ-এর আয়ু নিয়মিতভাবে বাড়ছে সময়ের সাথে সাথে ফ্যাশন, যাতে আরএলই-তে বেশিরভাগ এলোমেলো চেহারার তারতম্য কোহোর্ট বি-র পরিবর্তনের কারণে ঘটে
(খ) শুরু করার সবচেয়ে সহজতম মডেলটি একটি লিনিয়ার প্রবণতা। আসুন দেখুন এটি কতটা ভাল কাজ করে।
এই প্লটের গা blue় নীল পয়েন্টগুলি হ'ল ফিটিংয়ের জন্য রাখা ডেটা; হালকা সোনার পয়েন্টগুলি পরবর্তী ডেটা, ফিটের জন্য ব্যবহৃত হয় না। কালো লাইনটি .009 / বছরের slালু সহ উপযুক্ত। ড্যাশযুক্ত রেখাগুলি পৃথক ভবিষ্যতের মানগুলির জন্য পূর্বাভাস অন্তর v
সামগ্রিকভাবে, ফিটটি দেখতে দুর্দান্ত দেখাচ্ছে: অবশিষ্টাংশগুলির পরীক্ষা (নীচে দেখুন) সময়ের সাথে সাথে তাদের আকারগুলিতে কোনও গুরুত্বপূর্ণ পরিবর্তন দেখা যায় না (ডেটা পিরিয়ড 1972-1990 সময়কালে)। (কিছুটা ইঙ্গিত পাওয়া যায় যে তারা যখন প্রারম্ভিক আয়ু কম ছিল তখন তাদের প্রারম্ভিক আকারে বড় হতে থাকে। সিরিয়াল সম্পর্কের (ইতিবাচক কয়েকটি রান এবং নেতিবাচক অবশিষ্টাংশের রান দ্বারা প্রদর্শিত), তবে স্পষ্টতই এটি গুরুত্বহীন। কোনও আউটলিয়ার নেই, যা পূর্বাভাস ব্যান্ডের বাইরে পয়েন্টগুলি দ্বারা নির্দেশিত হবে।
একটি আশ্চর্যের বিষয় হ'ল 2001 সালে মানগুলি হঠাৎ করে নীচের ভবিষ্যদ্বাণী ব্যান্ডের কাছে পড়ে এবং সেখানেই থাকে: হঠাৎ হঠাৎ বড় কিছু ঘটেছিল এবং অবিচল থাকে।
এখানে অবশিষ্টাংশগুলি রয়েছে, যা পূর্বে উল্লিখিত বিবরণ থেকে বিচ্যুতি ।
যেহেতু আমরা অবশিষ্টগুলি 0 টির সাথে তুলনা করতে চাই, উল্লম্ব লাইনগুলি ভিজ্যুয়াল সহায়তা হিসাবে শূন্য স্তরে টানা হয়। আবার, নীল পয়েন্টগুলি ফিটগুলির জন্য ব্যবহৃত ডেটা দেখায়। হালকা স্বর্ণগুলি হ'ল 2000 সালের পরে নিম্ন ভবিষ্যদ্বাণী সীমাটির নিকটবর্তী হওয়া ডেটাগুলির অবশিষ্টাংশ।
এই চিত্র থেকে আমরা অনুমান করতে পারি যে 2000-2001 পরিবর্তনের প্রভাব প্রায় -0.07 ছিল । এটি কোহোর্ট বি এর মধ্যে পুরো জীবনকালের আকস্মিকভাবে 0.07 (7%) ড্রপ প্রতিফলিত করে that ড্রপের পরে, অবশিষ্টাংশের অনুভূমিক প্যাটার্নটি দেখায় যে পূর্ববর্তী প্রবণতা অব্যাহত ছিল, তবে নতুন নিম্ন স্তরে। বিশ্লেষণের এই অংশটি অনুসন্ধানমূলক হিসাবে বিবেচনা করা উচিত : এটি নির্দিষ্টভাবে পরিকল্পনা করা হয়নি, তবে বহির্ভূত তথ্যগুলির মধ্যে একটি আশ্চর্যজনক তুলনা (1991-2009) এবং বাকী ডেটার সাথে ফিট করার কারণে এটি এসেছে।
অন্য একটি জিনিস - এমনকি মাত্র 19 প্রাথমিক বছরের ডেটা ব্যবহার করে, opeালের মানক ত্রুটিটি ছোট: এটি কেবল .0009, .009 এর আনুমানিক মানের দশমাংশের। স্বাধীনতার 17 ডিগ্রি সহ 10 টি সম্পর্কিত টি-পরিসংখ্যান অত্যন্ত তাত্পর্যপূর্ণ (পি-মান এর চেয়ে কম)10- 7); যে, আমরা আত্মবিশ্বাসী হতে পারি প্রবণতা সুযোগ কারণে নয়। এটি বিশ্লেষণে সুযোগের ভূমিকা সম্পর্কে আমাদের মূল্যায়নের একটি অংশ। অন্যান্য অংশগুলি অবশিষ্টাংশগুলির পরীক্ষা are
এই তথ্যগুলিতে আরও জটিল মডেলের ফিট করার কোনও কারণ নেই বলে মনে হয়, সময়ের সাথে সাথে আরএলইতে আসল প্রবণতা আছে কিনা তা অনুমান করার উদ্দেশ্যে নয়: একটি রয়েছে। আমরা আমাদের অনুমানকে আরও পরিমার্জন করতে 2001-এর পূর্বের মানগুলিতে এবং 2000-পরবর্তী মানগুলিতে ডেটা বিভক্ত করতে পারিপ্রবণতাগুলির মধ্যে, তবে অনুমানের পরীক্ষাগুলি করা সম্পূর্ণরূপে সত্য হবে না। পি-মানগুলি কৃত্রিমভাবে কম হবে, কারণ বিভাজন পরীক্ষা আগে থেকেই পরিকল্পনা করা হয়নি। তবে অনুসন্ধানের অনুশীলন হিসাবে এ জাতীয় অনুমান ঠিক আছে। আপনার ডেটা থেকে আপনি যা পারেন তা শিখুন! অতিমাত্রায় নিজেকে (যাতে আপনি প্রায় অর্ধ ডজন প্যারামিটার বা তার বেশি ব্যবহার করেন বা স্বয়ংক্রিয় ফিটিং কৌশলগুলি ব্যবহার করেন তবে প্রায় ঘটবে তা নিশ্চিত) বা ডেটা স্নুপিং: আনুষ্ঠানিক নিশ্চিতকরণ এবং অনানুষ্ঠানিকতার মধ্যে পার্থক্য সম্পর্কে সতর্ক থাকুন (তবে তবে মূল্যবান) ডেটা এক্সপ্লোরেশন।
সংক্ষেপে বলা যাক:
আয়ুষ্কালের উপযুক্ত পরিমাপ (আরএলই) বাছাই করে, অর্ধেক তথ্য রেখে, একটি সাধারণ মডেল ফিটিং করে, এবং সেই মডেলটিকে অবশিষ্ট তথ্যের বিপরীতে পরীক্ষা করে আমরা দৃ confidence় আত্মবিশ্বাসের সাথে প্রতিষ্ঠা করেছি যে : একটি ধারাবাহিক প্রবণতা ছিল; এটি দীর্ঘ সময় ধরে লিনিয়ারের কাছাকাছি ছিল; এবং 2001 সালে আরএলইতে হঠাৎ অবিরাম অবিরাম ড্রপ হয়েছিল।
আমাদের মডেল লক্ষণীয়ভাবে পার্সামোনিয়াস : প্রাথমিক তথ্য সঠিকভাবে বর্ণনা করার জন্য এটি কেবল দুটি সংখ্যার (একটি interাল এবং আটকানো) প্রয়োজন। এই বিবরণ থেকে একটি সুস্পষ্ট কিন্তু অপ্রত্যাশিত প্রস্থান বর্ণনা করতে এটি একটি তৃতীয় (বিরতির তারিখ, 2001) প্রয়োজন। এই থ্রি-প্যারামিটার বর্ণনার সাথে সম্পর্কিত কোনও আউটলিয়ার নেই। সিরিয়াল পারস্পরিক সম্পর্ক (সাধারণত সময়-সিরিজের কৌশলগুলির ফোকাস) চিহ্নিত করে, পৃথক পৃথক বিচ্যুতিগুলি (অবশিষ্টাংশগুলি) প্রদর্শিত বা আরও জটিল ফিটগুলি উপস্থাপনের মাধ্যমে (যেমন একটি চতুর্ভুজ সময় উপাদান যুক্ত করার মাধ্যমে) মডেলটি যথেষ্ট পরিমাণে উন্নতি করতে যাচ্ছে না বা সময়ের সাথে সাথে আকারগুলির আকারগুলিতে মডেলিংয়ের পরিবর্তন)।
প্রবণতা প্রতি বছর 0.009 আরএলই হয়েছে । এর অর্থ হ'ল প্রতিটি অতিক্রান্ত বছরটির সাথে, কোহোর্ট বি এর মধ্যে আয়ুর পরিপূর্ণতা একটি সম্পূর্ণ প্রত্যাশিত স্বাভাবিক জীবনকালকে 0.009 (প্রায় 1%) যুক্ত করেছে। সমীক্ষা চলাকালীন (৩) বছর), যা পুরো আজীবন উন্নতির এক তৃতীয়াংশ 37 37 * 0.009 = 0.34 = এক তৃতীয়াংশ হবে। 2001-এর বিপর্যয় 1972 থেকে ২০০৯ সাল পর্যন্ত পুরো আয়কালের প্রায় 0.28 এ লাভ হ্রাস করে (যদিও সেই সময়ের মধ্যে সামগ্রিক আয়ু 10% বৃদ্ধি পেয়েছিল)।
যদিও এই মডেলটি উন্নত করা যেতে পারে, সম্ভবত এটির জন্য আরও পরামিতিগুলির প্রয়োজন হবে এবং উন্নতিটি দুর্দান্ত হওয়ার সম্ভাবনা নেই (অবশিষ্টাংশের সত্যায়নের কাছাকাছি এলোমেলো আচরণ হিসাবে)। সামগ্রিকভাবে, অতএব, আমাদের এত কম বিশ্লেষণমূলক কাজের জন্য ডেটা যেমন একটি কমপ্যাক্ট, দরকারী, সহজ বিবরণে পৌঁছানোর বিষয়বস্তু হওয়া উচিত ।