আমি একটি বিশ্লেষণ পরিচালনা করছি যেখানে প্রাথমিক লক্ষ্যটি বোঝা to ডেটাসেট ক্রস-বৈধকরণের জন্য যথেষ্ট বড় (10 কে), এবং ভবিষ্যদ্বাণীকারীরা ধারাবাহিক এবং ডামি ভেরিয়েবল উভয়ই অন্তর্ভুক্ত করে এবং ফলাফলটি ধারাবাহিক থাকে। মূল লক্ষ্যটি ছিল মডেলটির ব্যাখ্যা সহজ করার জন্য কিছু ভবিষ্যদ্বাণীকারীদের লাথি মেরে বোঝা যায় কিনা তা দেখার জন্য goal
প্রশ্নাবলী:
আমার প্রশ্নটি "কোনটি ফলাফলগুলি ব্যাখ্যা করে এবং সেই ব্যাখ্যাটির একটি 'যথেষ্ট শক্তিশালী' অংশ"। তবে লাসোর জন্য ল্যাম্বডা প্যারামিটারটি নির্বাচন করতে, আপনি ক্রস-বৈধতা, অর্থাৎ মানদণ্ড হিসাবে ভবিষ্যদ্বাণীমূলক বৈধতা ব্যবহার করেন। অনুমান করার সময়, ভবিষ্যদ্বাণীমূলক বৈধতা আমি যে সাধারণ প্রশ্নটি জিজ্ঞাসা করছি তার জন্য যথেষ্ট যথেষ্ট প্রক্সি?
বলুন লাসো 8 টি পূর্বাভাসীর মধ্যে মাত্র 3 রেখেছিল। এবং এখন আমি নিজেকে জিজ্ঞাসা করছি: "এগুলির পরিণতিতে কী প্রভাব ফেলে"। উদাহরণস্বরূপ, আমি একটি লিঙ্গ পার্থক্য পেয়েছি। লাসো সঙ্কুচিত হওয়ার পরে, সহগটি পরামর্শ দেয় যে মহিলারা পুরুষদের চেয়ে 1 পয়েন্ট বেশি। তবে সংকোচন ছাড়াই (অর্থাত্, প্রকৃত ডেটাসেটে) তারা 2.5 পয়েন্ট উচ্চতর স্কোর করে।
- আমার "বাস্তব" লিঙ্গ প্রভাব হিসাবে আমি কোনটিকে গ্রহণ করব? কেবল ভবিষ্যদ্বাণীমূলক বৈধতার দ্বারা যাওয়া, এটি সঙ্কুচিত সহগ হবে।
- বা একটি প্রসঙ্গে, বলুন যে আমি পরিসংখ্যানের বিষয়ে দক্ষ নয় এমন লোকের জন্য একটি প্রতিবেদন লিখছি। আমি কোন সহগকে তাদের প্রতিবেদন করব?