আমি বর্তমানে জিনোমিক্সের জন্য একটি লজিস্টিক রিগ্রেশন মডেল নিয়ে কাজ করছি। একটি ইনপুট ক্ষেত্রগুলির মধ্যে আমি একটি কোভারিয়েট হিসাবে অন্তর্ভুক্ত করতে চাই genes
। প্রায় 24,000 টি জিন রয়েছে। কম্পিউটেশনাল বায়োলজিতে এই স্তরের পরিবর্তনশীলতার সাথে অনেকগুলি বৈশিষ্ট্য রয়েছে এবং কয়েক লক্ষ লক্ষ নমুনা প্রয়োজন।
- আমি যদি
LabelEncoder()
সেই 24 কে জিন করি - এবং তারপরে
OneHotEncoder()
...
24,000 কলামগুলি কি আমার 2.2 গিগাহার্জ কোয়াড কোর আই 7 সিপিইউর জন্য প্রশিক্ষণের সময়কে অযৌক্তিক করে তুলবে?
যদি তা হয়, তবে আমি এটির সাথে নিতে পারি এমন এনকোডিংয়ের জন্য কি আলাদা পদ্ধতি আছে?
আমি কি কোনওভাবে এই বৈশিষ্ট্যটিতে আমার মডেলের একটি স্তর উত্সর্গ করার চেষ্টা করব?
এর অর্থ কি আমার 24K ইনপুট নোড দরকার?