আমার মনে হয় এগুলি 2 টি আলাদা জিনিস,
বৈশিষ্ট্য নির্বাচন দিয়ে শুরু করা যাক :
এই কৌশলটি বৈশিষ্ট্যগুলি নির্বাচনের জন্য ব্যবহৃত হয় যা লক্ষ্যমাত্রার ভেরিয়েবলের সর্বাধিক ব্যাখ্যা করে (লক্ষ্য ভেরিয়েবলের সাথে একটি সম্পর্ক রয়েছে) theএই পরীক্ষাটি মডেলটি ডেটা প্রয়োগ করার ঠিক আগে চালানো হয়।
এটির আরও ভাল ব্যাখ্যা করার জন্য আসুন একটি উদাহরণ দেওয়া যাক: এখানে 10 টি বৈশিষ্ট্য এবং 1 টার্গেট ভেরিয়েবল রয়েছে, 9 টি বৈশিষ্ট্য 90% টার্গেট ভেরিয়েবল এবং 10 টি বৈশিষ্ট্য একসাথে লক্ষ্য ভেরিয়েবলের 91% ব্যাখ্যা করে। সুতরাং 1 ভেরিয়েবল খুব বেশি পার্থক্য তৈরি করছে না তাই আপনি মডেলিংয়ের আগে এটি সরিয়ে ফেলেন (এটি ব্যবসায়ের ক্ষেত্রেও বিষয়গত)। আমাকে ভবিষ্যদ্বাণীপূর্ণ গুরুত্ব হিসাবেও বলা যেতে পারে।
ফিচার এক্সট্রাকশন সম্পর্কে এখন কথা বলা যাক ,
যা আনসভের্বাইজড লার্নিংয়ে ব্যবহৃত হয়, ছবিগুলিতে কনট্যুর এক্সট্রাকশন, একটি টেক্সট থেকে দ্বি-গ্রাম উত্তোলন, কথ্য পাঠ্য রেকর্ডিং থেকে ফোনমেস নিষ্কাশন। আপনি যখন ডেটা অভিধানের মতো ডেটা সম্পর্কে কিছু জানেন না, তখন অনেকগুলি বৈশিষ্ট্য যার অর্থ ডেটা বোধগম্য বিন্যাসে নয়। তারপরে আপনি এমন কিছু বৈশিষ্ট্য পাওয়ার জন্য এই কৌশলটি প্রয়োগ করার চেষ্টা করছেন যা ডেটা সর্বাধিক ব্যাখ্যা করে। বৈশিষ্ট্য নিষ্কাশন বৈশিষ্ট্যগুলির একটি রূপান্তর জড়িত, যা প্রায়শই বিপরীত হয় না কারণ মাত্রা হ্রাস প্রক্রিয়ায় কিছু তথ্য হারিয়ে যায়।
বৈশিষ্ট্যগুলি নিষ্কাশন করতে আপনি প্রদত্ত ডেটাতে ফিচার এক্সট্রাকশন প্রয়োগ করতে পারেন এবং তারপরে সাবসেটটি নির্বাচন করার জন্য টার্গেট ভেরিয়েবলের সাথে সম্মান সহ ফিচার নির্বাচন প্রয়োগ করতে পারেন যা ভাল ফলাফলের সাথে একটি ভাল মডেল তৈরি করতে সহায়তা করতে পারে।
আরও ভাল বোঝার জন্য আপনি এই লিঙ্ক -১ , লিংক -২ দিয়ে যেতে পারেন।
আমরা সেগুলি আর, পাইথন, এসপিএসে প্রয়োগ করতে পারি।
আরও কিছু স্পষ্টতা প্রয়োজন হলে আমাকে জানান।