Forecastability
আপনি ঠিক বলেছেন যে এটি পূর্বাভাসের প্রশ্ন। সেখানে হয়েছে forecastability উপর কয়েকটি নিবন্ধ মধ্যে IIF এর বৃত্তিক ওরিয়েন্টেড জার্নাল দূরদর্শিতা । (সম্পূর্ণ প্রকাশ: আমি একটি সহযোগী সম্পাদক।)
সমস্যাটি হ'ল পূর্বাভাস "ইতিবাচক" ক্ষেত্রে নির্ধারণ করা ইতিমধ্যে শক্ত।
কয়েকটি উদাহরণ
ধরুন আপনার কাছে এর মতো টাইম সিরিজ রয়েছে তবে জার্মান কথা বলতে পারবেন না:
আপনি কীভাবে এপ্রিল মাসে বড় শৃঙ্গকে মডেল করবেন এবং আপনি কীভাবে কোনও তথ্য পূর্বাভাসে অন্তর্ভুক্ত করবেন?
আপনি যদি না জানতেন যে এই সময়ের সিরিজটি একটি সুইস সুপার মার্কেট চেইনে ডিমের বিক্রি, যা পশ্চিমা ক্যালেন্ডার ইস্টারের ঠিক আগে পৌঁছেছে , আপনার কোনও সুযোগ থাকবে না। এছাড়াও, ইস্টার ক্যালেন্ডারে প্রায় ছয় সপ্তাহের মধ্যে চলে যাওয়ার সাথে সাথে, যে কোনও পূর্বাভাসে ইস্টারের নির্দিষ্ট তারিখটি অন্তর্ভুক্ত নয় (ধরে নিলে, বলুন যে এটি কেবল কিছু মৌসুমের শীর্ষে ছিল যা পরের বছরের নির্দিষ্ট সপ্তাহে পুনরুত্থিত হবে) সম্ভবত খুব দূরে হবে।
একইভাবে, ধরে নিন আপনার নীচের নীল রেখাটি রয়েছে এবং 2010-02-28 এ যা ঘটেছিল তা মডেল করতে চান 2010-02-27 এ "স্বাভাবিক" নিদর্শন থেকে আলাদা:
আবার, যখন কানাডিয়ানদের পূর্ণ একটি শহর পুরোপুরি টিভিতে অলিম্পিক আইস হকি ফাইনাল খেলা দেখবে তখন কী ঘটেছিল তা না জেনে, এখানে কী ঘটেছিল তা বোঝার কোনও সুযোগ আপনার নেই, এবং কখনই এরকম কিছু ঘটবে তা আপনি অনুমান করতে পারবেন না to
অবশেষে, এটি দেখুন:
এটি নগদ এবং বহনের দোকানে দৈনিক বিক্রয়ের একটি সিরিজ । (ডানদিকে, আপনার একটি সাধারণ টেবিল রয়েছে: ২৮২ দিনের শূন্য বিক্রয় ছিল, ৪২ দিনের মধ্যে 1 টি বিক্রয় ছিল ... এবং একদিনে 500 টি বিক্রি হয়েছিল)) এটি কী জিনিস তা আমি জানি না।
আজ অবধি, আমি জানি না যে ৫০০ টি বিক্রয় নিয়ে একদিন কী ঘটেছিল My আমার সর্বোত্তম অনুমান যে কোনও গ্রাহক এই পণ্যটি যা ছিল তার একটি বৃহত পরিমাণ প্রি-অর্ডার করেছিলেন এবং এটি সংগ্রহ করেছিলেন। এখন, এটি না জেনে, এই নির্দিষ্ট দিনের জন্য কোনও পূর্বাভাস খুব দূরে থাকবে। বিপরীতভাবে, অনুমান করুন যে এটি ঠিক ইস্টারের আগে ঘটেছিল, এবং আমাদের কাছে একটি বোবা স্মার্ট অ্যালগরিদম রয়েছে যা বিশ্বাস করে এটি একটি ইস্টার প্রভাব হতে পারে (সম্ভবত এটি ডিম?) এবং পরের ইস্টারটির জন্য আনন্দের সাথে 500 ইউনিট পূর্বাভাস করেছে। ওহ, পারে যে ভুল হয়ে যেতে পারে।
সারাংশ
সব ক্ষেত্রেই আমরা দেখতে পাই যে পূর্বাভাসটি কেবলমাত্র তখনই বুঝতে পারে যখন আমাদের ডেটাগুলিকে প্রভাবিত করে এমন সম্ভাব্য কারণগুলির সম্পর্কে যথেষ্ট গভীর ধারণা হয়। সমস্যাটি হ'ল আমরা যদি এই কারণগুলি না জানি তবে আমরা জানি না যে আমরা সেগুলি না জানি। অনুযায়ী ডোনাল্ড রামসফেল্ড :
[টি] এখানে পরিচিত পরিচিত; আমরা জানি কিছু আছে. আমরা জানি যে অজানা রয়েছে; এর অর্থ হল আমরা জানি এমন কিছু জিনিস রয়েছে যা আমরা জানি না। তবে অজানা অজানাও রয়েছে - আমরা যা জানি না আমরা তা জানি না।
যদি হকি সম্পর্কে ইস্টার বা কানাডিয়ানদের ভবিষ্যদ্বাণী আমাদের কাছে অজানা, তবে আমরা আটকে রয়েছি - এবং আমাদের সামনে এগিয়ে যাওয়ার কোনও উপায়ও নেই, কারণ আমাদের কী প্রশ্ন জিজ্ঞাসা করা উচিত তা আমরা জানি না।
এগুলিতে হ্যান্ডেল পাওয়ার একমাত্র উপায় হ'ল ডোমেন জ্ঞান সংগ্রহ করা।
উপসংহার
আমি এ থেকে তিনটি সিদ্ধান্ত নিয়েছি:
- আপনার মডেলিং এবং ভবিষ্যদ্বাণীতে আপনাকে সর্বদা ডোমেন জ্ঞান অন্তর্ভুক্ত করতে হবে।
- এমনকি ডোমেন জ্ঞান থাকা সত্ত্বেও, আপনার পূর্বাভাস এবং ব্যবহারকারীদের কাছে গ্রহণযোগ্য হওয়ার পূর্বাভাসের জন্য পর্যাপ্ত তথ্য পাওয়ার নিশ্চয়তা নেই। উপরে যে আউটলেট দেখুন।
- যদি "আপনার ফলাফলগুলি দুর্বিষহ হয়" তবে আপনি যতটা অর্জন করতে পারেন তার চেয়ে বেশি আশা করছেন। আপনি যদি ন্যায্য মুদ্রা টসের পূর্বাভাস দিচ্ছেন তবে 50% নির্ভুলতার বেশি পাওয়ার কোনও উপায় নেই। বাহ্যিক পূর্বাভাস নির্ভুলতার মানদণ্ডকে বিশ্বাস করবেন না।
তলদেশের সরুরেখা
এখানে আমি কীভাবে বিল্ডিং মডেলগুলি প্রস্তাব করব - এবং কখন থামবে তা লক্ষ্য করুন:
- আপনার যদি ইতিমধ্যে এটি না থাকে তবে ডোমেন জ্ঞানের সাথে কারও সাথে কথা বলুন।
- পদক্ষেপ 1 এর উপর ভিত্তি করে সম্ভাব্য ইন্টারঅ্যাকশন সহ আপনি যে ডেটা পূর্বাভাস করতে চান তার প্রধান চালকদের সনাক্ত করুন।
- ক্রম-বৈধতা বা একটি হোল্ডআউট নমুনা ব্যবহার করে মডেলগুলি নির্ধারণ করুন step পদক্ষেপ অনুযায়ী শক্তি ক্রম হ্রাস ক্রমে ড্রাইভারগুলি সহ পুনরাবৃত্তভাবে মডেলগুলি তৈরি করুন।
- যদি আপনার পূর্বাভাসের নির্ভুলতা আরও কিছু না বাড়ায় তবে হয় পদক্ষেপ 1 এ ফিরে যান (উদাহরণস্বরূপ, আপনি ব্যাখ্যা করতে পারবেন না এমন নির্লজ্জ ভুল-ভবিষ্যদ্বাণী সনাক্ত করে এবং ডোমেন বিশেষজ্ঞের সাথে এগুলি নিয়ে আলোচনা করে), বা স্বীকার করুন যে আপনি আপনার শেষের দিকে পৌঁছেছেন মডেলদের ক্ষমতা। আপনার বিশ্লেষণকে আগে থেকে সময়-বক্সিং করা সহায়তা করে।
নোট করুন যে আমি যদি আপনার আসল মডেল প্লেটؤসটি ব্যবহার করি তবে বিভিন্ন শ্রেণির মডেলগুলি চেষ্টা করার পরামর্শ দিচ্ছি না। সাধারণত, আপনি যদি যুক্তিসঙ্গত মডেলটি দিয়ে শুরু করেন, তবে আরও কিছু পরিশীলিত জিনিস ব্যবহারের ফলে শক্তিশালী উপকার পাওয়া যাবে না এবং কেবল "পরীক্ষার সেটটিতে অত্যধিক উপযোগী" হতে পারে। আমি এটি প্রায়শই দেখেছি, এবং অন্যান্য লোকেরা তাতে একমত হয় ।