আমি বেশ কয়েকটি বিভিন্ন মডেলের মূল্যায়ন করতে চাই যা একটি মাসিক স্তরে আচরণের পূর্বাভাস সরবরাহ করে। ডেটা ভারসাম্যযুক্ত, এবং 100,000 এবং 12. ফলাফলটি নির্ধারিত মাসে একটি কনসার্টে অংশ নিচ্ছে, সুতরাং এটি কোনও মাসে ~ 80% লোকের জন্য শূন্য, তবে ভারী ব্যবহারকারীদের একটি দীর্ঘ ডান লেজ রয়েছে। ভবিষ্যদ্বাণীগুলি আমার কাছে ফলাফলের গণনা প্রকৃতির সম্মান বলে মনে হয় না: ভগ্নাংশের সংগীতানুষ্ঠান প্রচলিত।
আমি মডেল সম্পর্কে কিছুই জানি না। আমি প্রতি মাসে প্রতিটি ব্যক্তির জন্য 6 টি পৃথক ব্ল্যাক-বাক্স পূর্বাভাস পালন করি। মডেল নির্মাতাদের কাছে অনুমানের জন্য নেই এমন অতিরিক্ত ডেটা আমার কাছে রয়েছে (যদিও কনসার্ট-গায়াররা একই থাকে), এবং আমি এখানে गेজ করতে চাই যেখানে প্রতিটি ভাল (যথাযথতা এবং নির্ভুলতার ক্ষেত্রে) পারফর্ম করে। উদাহরণস্বরূপ, কিছু মডেল ঘন ঘন কনসার্ট-ভ্রমণকারীদের জন্য কী ভাল পূর্বাভাস দেয় তবে পালঙ্ক আলুর পক্ষে ব্যর্থ হয়? জানুয়ারির জন্য ভবিষ্যদ্বাণীটি ডিসেম্বরের পূর্বাভাসের চেয়ে ভাল? বিকল্পভাবে, এটি জেনে রাখা ভাল লাগবে যে ভবিষ্যদ্বাণীগুলি আমাকে বাস্তবের দিক থেকে লোকদের সঠিকভাবে স্থান দিতে দেয়, এমনকি যদি সঠিক মাত্রার উপর নির্ভর করা যায় না তবে।
আমার প্রথম চিন্তাটি ছিল ভবিষ্যদ্বাণী করা এবং সময় ডামিগুলির উপর বাস্তবের একটি স্থির প্রতিক্রিয়াগুলি পরিচালনা করুন এবং প্রতিটি মডেলের জন্য আরএমএসই বা । তবে প্রতিটি মডেল কোথায় ভাল করবে বা পার্থক্যগুলি উল্লেখযোগ্য (যদি আমি আরএমএসই বুটস্ট্র্যাপ না করি) সম্পর্কে প্রশ্নের উত্তর দেয় না। ফলাফলের বিতরণও এই পদ্ধতির সাথে আমাকে চিন্তিত করে।
আমার দ্বিতীয় ধারণাটি ছিল ফলাফলটি 0, 1-3 এবং 3+ এ বিভক্ত করা এবং বিভ্রান্তির ম্যাট্রিক্স গণনা করা, তবে এটি সময়ের মাত্রা উপেক্ষা করে আমি যদি এর মধ্যে 12 না করি। এটিও বেশ মোটা।
আমি concord
টিজে স্টিচেন এবং এনজে কক্স- এর স্টাটা কমান্ড সম্পর্কে অবগত রয়েছি - যার by()
বিকল্প রয়েছে, তবে এর জন্য বার্ষিক মোটের জন্য ডেটা ভেঙে পড়তে হবে। এটি অন্যান্য দরকারী পরিসংখ্যানগুলির মধ্যে আত্মবিশ্বাসের ব্যবধানগুলির সাথে লিনের কনকর্ড্যান্স সহ সম্পর্কের সূচক গণনা করে । সিসিসি -1 থেকে 1 এর মধ্যে রয়েছে, নিখুঁত চুক্তিতে 1 এ।
এছাড়া Harrell এর এর (মাধ্যমে গণনা করা
হয়, যা হয়েছে আর Newson দ্বারা) বিকল্প, কিন্তু আমি নিশ্চিত যে আমার প্যানেল ডেটার সাথে মোকাবেলা করতে সম্ভব হবে নই। এটি আপনাকে আত্মবিশ্বাসের অন্তর দেয়। অবিচ্ছিন্ন ফলাফলের জন্য হ্যারেলের সি হ'ল একটি আরওসি বক্ররেখা (এউসি) এর আওতাধীন অঞ্চলটির সাধারণীকরণ। এটি এমন সমস্ত জোড়ার অনুপাত যা অর্ডার করা যেতে পারে যে উচ্চতর ভবিষ্যদ্বাণীযুক্ত বিষয়টিতে আসলে উচ্চতর ফলাফল রয়েছে। সুতরাং একেবারে বৈষম্যমূলক মডেলের জন্য র্যান্ডম পূর্বাভাসের জন্যদেখুন Harrell এর বই , p.493somersd
cluster
আপনি কীভাবে এই সমস্যা মোকাবেলা করবেন? আপনি কি এমএপিই এর মতো পরিসংখ্যান গণনা করার পরামর্শ দিবেন যা পূর্বাভাসের ক্ষেত্রে সাধারণ?
দরকারী জিনিস এখন পর্যন্ত পাওয়া গেছে:
- লিন্স কনকর্ড্যান্স কারেলিলেশন কোপিটির পুনরাবৃত্তি পরিমাপ সংস্করণে স্লাইড