আমার প্রায়শই প্রায় 5000 টি সম্পর্কিত বৈশিষ্ট্য / সংশ্লেষ এবং বাইনারি প্রতিক্রিয়া সহ একটি ডেটাসেট রয়েছে। ডেটা আমাকে দেওয়া হয়েছিল, আমি তা সংগ্রহ করি নি। আমি মডেলগুলি তৈরি করতে লাসো এবং গ্রেডিয়েন্ট বুস্টিং ব্যবহার করি। আমি পুনরাবৃত্তিযুক্ত, নেস্টেড ক্রস বৈধতা ব্যবহার করি। আমি লাসোর বৃহত্তম (পরম) 40 সহগ এবং গ্রেডিয়েন্ট বুস্টেড গাছগুলির 40 টির সবচেয়ে গুরুত্বপূর্ণ বৈশিষ্ট্যগুলি সম্পর্কে রিপোর্ট করি (40 এর সম্পর্কে বিশেষ কিছুই ছিল না; এটি কেবলমাত্র যুক্তিসঙ্গত তথ্য বলে মনে হয়েছিল)। আমি সিভির ভাঁজ এবং পুনরাবৃত্তির উপরও এই পরিমাণগুলির বৈচিত্রটি প্রতিবেদন করি।
আমি "গুরুত্বপূর্ণ" বৈশিষ্ট্যগুলিতে এক ধরণের মিউজিক করছি, পি-মান বা কার্যকারিতা বা কোনও কিছু সম্পর্কে কোনও বিবৃতি দিচ্ছি না, বরং এই প্রক্রিয়াটিকে এক ধরণের বিবেচনা করছি --- যদিও একধরণের অপূর্ণতা এবং এলোমেলোভাবে --- কিছু ঘটনার অন্তর্দৃষ্টি।
ধরে নিই আমি এই সমস্ত সঠিকভাবে করেছি (উদাহরণস্বরূপ, কার্যকরভাবে ক্রস বৈধকরণ কার্যকর করা হয়েছে, লাসোর জন্য ছোট), এই পদ্ধতির কি যুক্তিযুক্ত? উদাহরণস্বরূপ, একাধিক অনুমান পরীক্ষা, পোস্ট বিশ্লেষণ, মিথ্যা আবিষ্কার নিয়ে সমস্যা আছে কি? নাকি অন্য সমস্যা?
উদ্দেশ্য
একটি বিরূপ ঘটনার সম্ভাবনা পূর্বাভাস
- সর্বাগ্রে, সম্ভাবনাটি নির্ভুলভাবে অনুমান করুন
- আরও গৌণ - একটি স্যানিটি চেক হিসাবে, তবে সম্ভবত এমন কিছু অভিনব ভবিষ্যদ্বাণী প্রকাশ করা যা আরও তদন্ত করা যেতে পারে, উপরে বর্ণিত সহগ এবং আমদানি পরিদর্শন করবে।
উপভোক্তা
- এই ইভেন্টটির ভবিষ্যদ্বাণী করতে আগ্রহী গবেষকরা এবং ইভেন্টটি ঘটতে শুরু করে এমন লোকেরা যারা শেষ করেছেন
আমি তাদের থেকে এটি বেরিয়ে আসতে চাই
তাদের যদি ডেটা দিয়ে মডেলিং প্রক্রিয়াটি বর্ণিত হিসাবে পুনরাবৃত্তি করতে চান তবে তাদের ইভেন্টটি পূর্বাভাস দেওয়ার ক্ষমতা দিন Give
অপ্রত্যাশিত ভবিষ্যদ্বাণীদের উপর কিছু আলোকপাত করুন। উদাহরণস্বরূপ, এটি পরিণত হতে পারে যে সম্পূর্ণ অপ্রত্যাশিত কিছু হ'ল সেরা ভবিষ্যদ্বাণী। অন্য কোথাও মডেলাররা ভবিষ্যদ্বাণীকে আরও গুরুতর বিবেচনা করতে পারেন।