আমি এই বক্তৃতা নোটগুলিতে বর্ণিত (5 পৃষ্ঠায়) বৈশিষ্ট্য নির্বাচনের ক্ষেত্রে পারস্পরিক তথ্যের ধারণাটি প্রয়োগ করার চেষ্টা করছি ।
আমার প্ল্যাটফর্মটি মতলব। অনুপ্রেরণামূলক তথ্য থেকে পারস্পরিক তথ্য গণনা করার সময় একটি সমস্যা আমি দেখতে পাই যে সংখ্যাটি সর্বদা উপরের দিকে পক্ষপাতদুষ্ট থাকে। মতলব সেন্ট্রিয়ায় এমআই গণনা করতে আমি প্রায় 3 ~ 4 টি আলাদা ফাইল পেয়েছি এবং যখন আমি স্বাধীন র্যান্ডম ভেরিয়েবলগুলিতে ফিড করি তখন এগুলি সমস্ত বড় সংখ্যক (যেমন> 0.4) দেয়।
আমি কোনও বিশেষজ্ঞ নই, তবে সমস্যাটি মনে হচ্ছে আপনি এমআই গণনা করার জন্য যদি আপনি কেবল যৌথ এবং প্রান্তিক ঘনত্ব ব্যবহার করেন, তবে প্রক্রিয়াতে পক্ষপাতটি প্রবর্তন করা হয় কারণ এমআই সংজ্ঞা দ্বারা ইতিবাচক হয়। পারস্পরিক তথ্যকে সঠিকভাবে কীভাবে অনুমান করা যায় সে সম্পর্কে কারও কাছে ব্যবহারিক পরামর্শ রয়েছে?
একটি সম্পর্কিত প্রশ্ন, বাস্তবে, লোকেরা কীভাবে বৈশিষ্ট্যগুলি নির্বাচন করতে এমআই ব্যবহার করে? এমআই তত্ত্বীয়ভাবে আনবাউন্ডেড না হওয়ায় কীভাবে একটি থ্রেশহোল্ড মান নিয়ে আসবেন তা আমার কাছে স্পষ্ট নয়। অথবা লোকেরা কেবল এমআই দ্বারা বৈশিষ্ট্যগুলি র্যাঙ্ক করে এবং শীর্ষস্থানীয় কে বৈশিষ্ট্য গ্রহণ করে?