শ্রেণিবিন্যাসের প্রসঙ্গে আকর্ষণীয় ভবিষ্যদ্বাণীকারীদের বিচ্ছিন্ন করার উদ্দেশ্য যখন ছোট নমুনা ক্লিনিকাল স্টাডিতে র্যান্ডম অরণ্য বা দণ্ডিত রিগ্রেশন (এল 1 বা এল 2 পেনাল্টি সহ, বা এর সংমিশ্রণ) এর মতো মেশিন লার্নিং কৌশলগুলি প্রয়োগ করার বিষয়ে আপনি কী ভাবেন? এটি মডেল নির্বাচনের বিষয়ে কোনও প্রশ্ন নয় বা আমি পরিবর্তনশীল প্রভাব / গুরত্বের সর্বোত্তম প্রাক্কলনটি কীভাবে খুঁজে পাব সে সম্পর্কে জিজ্ঞাসা করছি না। আমি দৃ strong়ভাবে অনুমান করার পরিকল্পনা করি না তবে কেবল মাল্টিভারিয়েট মডেলিং ব্যবহার করি, তাই প্রতিটি ভবিষ্যদ্বাণীকে একবারে আগ্রহের ফলাফলের বিরুদ্ধে পরীক্ষা করা এবং তাদের আন্তঃসম্পর্ককে বিবেচনায় নেওয়া এড়িয়ে চলি।
আমি কেবল ভাবছিলাম যে এই বিশেষ চরম ক্ষেত্রে যদি ইতিমধ্যে এই জাতীয় দৃষ্টিভঙ্গি প্রয়োগ করা হয়েছিল, তবে 10-30 বিভাগযুক্ত বা অবিচ্ছিন্ন ভেরিয়েবলের ডেটা সহ 20-30 বিষয় বলুন say এটি ঠিক কেস নয় এবং আমি মনে করি যে এখানে সমস্যাটি আমরা বোঝানোর চেষ্টা করার ক্লাসগুলির সংখ্যার (যা প্রায়শই ভালভাবে সুষম হয় না) এবং (খুব) ছোট এন এর সাথে সম্পর্কিত। বায়োইনফরম্যাটিকসের প্রসঙ্গে আমি এই বিষয়ে বিশাল সাহিত্যের বিষয়ে সচেতন, তবে আমি সাইকোমেট্রিকভাবে পরিমাপ করা ফিনোটাইপস (যেমন নিউরোসাইকোলজিকাল প্রশ্নাবলীর জুড়ে) সহ বায়োমেডিকাল স্টাডির সাথে সম্পর্কিত কোনও রেফারেন্স পাইনি।
প্রাসঙ্গিক কাগজগুলিতে কোনও ইঙ্গিত বা পয়েন্টার?
হালনাগাদ
এই ধরণের ডেটা বিশ্লেষণের জন্য আমি অন্য কোনও সমাধানের জন্য উন্মুক্ত, যেমন সি 4.5 অ্যালগরিদম বা এর ডেরাইভেটিভস, অ্যাসোসিয়েশন বিধি পদ্ধতি এবং তদারকি বা আধা-তত্ত্বাবধানে শ্রেণিবদ্ধকরণের জন্য কোনও ডেটা মাইনিং কৌশল।