ক 1। মাত্রিকতা হ্রাস কী: আপনি যদি কোনও ম্যাট্রিক্সের ডেটার কথা ভাবেন, যেখানে সারিগুলি উদাহরণ এবং কলামগুলি বৈশিষ্ট্য (বা বৈশিষ্ট্য) হয় তবে মাত্রিকতা হ্রাস এই ডাটা ম্যাট্রিক্সকে কম কলাম সহ নতুন ম্যাট্রিক্সে ম্যাপিং করছে। ভিজ্যুয়ালাইজেশনের জন্য, আপনি যদি প্রতিটি ম্যাট্রিক্স-কলাম (বৈশিষ্ট্য) বৈশিষ্ট্য স্পেসের একটি মাত্রা হিসাবে মনে করেন, তবে মাত্রিকতা হ্রাস হ'ল উচ্চ মাত্রিক স্থান (আরও কলাম) থেকে নিম্ন মাত্রিক উপ-স্পেসে (কম কলাম) উদাহরণের অভিক্ষেপ।
এই রূপান্তরটির মূল উদ্দেশ্য হ'ল (1) তথ্য ম্যাট্রিক্সে তথ্য সংরক্ষণ করা, যখন গণনা জটিলতা হ্রাস করা যায়; (২) ডেটাতে বিভিন্ন শ্রেণীর পৃথকীকরণের উন্নতি করা।
A2,। বৈশিষ্ট্য নির্বাচন বা বৈশিষ্ট্য নিষ্কাশন হিসাবে মাত্রাজনিত হ্রাস: আমি সর্বব্যাপী আইরিস ডেটাसेट ব্যবহার করব , যা ডেটা সায়েন্সের যুক্তিযুক্ত 'হ্যালো ওয়ার্ল্ড'। সংক্ষেপে, আইরিস ডেটাসেটের 3 টি শ্রেণি এবং 4 টি বৈশিষ্ট্য (কলাম) রয়েছে। আইরিস ডেটাসেটের মাত্রা 4 থেকে 2 হ্রাস করার জন্য আমি বৈশিষ্ট্য নির্বাচন এবং নিষ্কাশন চিত্রিত করব।
পাইথনের লাইব্রেরিটি সিউবোর্ন ব্যবহার করে এই ডেটাসেটের যুগল-ভিত্তিক সহ-প্রকরণটি গণনা করি। কোডটি হ'ল: sns.pairplot (আইরিস, হিউ = "প্রজাতি", মার্কারস = ["ও", "এস", "ডি"]) যে চিত্রটি পেয়েছি তা হ'ল
আমি প্রদান করা বৈশিষ্ট্যের জোড় (2 মাত্রা) নির্বাচন করতে পারি যা সরবরাহ করে আমার আইরিস ডেটাসেটে 3 শ্রেণি (প্রজাতি) এর মধ্যে সবচেয়ে বড় বিভাজন। এটি বৈশিষ্ট্য-নির্বাচনের ক্ষেত্রে হবে।
পরবর্তী বৈশিষ্ট্য নিষ্কাশন হয়। এর সাথে, আমি আইরিসের 4-মাত্রিক বৈশিষ্ট্য স্থানটি একটি নতুন 2-মাত্রিক উপ-স্পেসে প্রজেক্ট করছি, যা অক্ষটি মূল স্থানের সাথে সামঞ্জস্য নয়। এগুলি নতুন বৈশিষ্ট্য। এগুলি সাধারণত মূল উচ্চ মাত্রিক স্থানে বিতরণের উপর ভিত্তি করে। সর্বাধিক জনপ্রিয় পদ্ধতি হ'ল প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস, যা মূল স্থানটিতে ইগেনভেেক্টরগুলিকে গণনা করে।
স্পষ্টতই, আমরা কেবল ইগেনভেেক্টরগুলির উপর ভিত্তি করে একটি সাবসেসে লিনিয়ার এবং বিশ্ব প্রজেকশন ব্যবহারের মধ্যে সীমাবদ্ধ নেই। আমরা অ-রৈখিক প্রক্ষেপণ পদ্ধতিও ব্যবহার করতে পারি। স্নায়ুবিক নেটওয়ার্ক ব্যবহার করে অ-রৈখিক পিসিএর
উদাহরণ এখানে দেওয়া হয়েছে শেষ উদাহরণের বৈশিষ্ট্য (মাত্রা) নিষ্কাশন করা হয়েছেনিউরাল নেটওয়ার্ক ব্যবহার করে মূল 4 টি বৈশিষ্ট্য থেকে। আপনি এই পিসিএ পদ্ধতি কোড ব্যবহার করে নিজেই আইরিস ডেটাসেটের জন্য পিসিএর বিভিন্ন স্বাদের সাথে পরীক্ষা করতে পারেন ।
সংক্ষিপ্তসার: বৈশিষ্ট্য নিষ্কাশন পদ্ধতিগুলি বৈশিষ্ট্য নির্বাচনের তুলনায় পারফরম্যান্সে সেরা বলে মনে হতে পারে, তবে পছন্দটি অ্যাপ্লিকেশন দ্বারা পূর্বাভাস দেওয়া হয়েছে। বৈশিষ্ট্য নিষ্কাশন থেকে প্রাপ্ত বৈশিষ্ট্যগুলি সাধারণত শারীরিক ব্যাখ্যা হারাতে পারে যা হাতের কাজটির উপর ভিত্তি করে কোনও সমস্যা হতে পারে বা নাও পারে। উদাহরণস্বরূপ, যদি আপনি ব্যয়বহুল সেন্সর সহ একটি খুব ব্যয়বহুল ডেটা সংগ্রহের কাজটি ডিজাইন করেন এবং বৈশিষ্ট্যগুলিতে (বিভিন্ন সেন্সরের সংখ্যা) অর্থনীতির প্রয়োজন হয় তবে আপনি সমস্ত উপলভ্য সেন্সর ব্যবহার করে একটি ছোট পাইলট নমুনা সংগ্রহ করতে চান এবং তারপরে একটি নির্বাচন করুন যা বড় ডেটা সংগ্রহের কাজের জন্য সবচেয়ে তথ্যবহুল tive