আমার কাছে 11 টি ভেরিয়েবল সহ একটি ডেটাসেট রয়েছে এবং ডেটা হ্রাস করার জন্য পিসিএ (অर्थোগোনাল) করা হয়েছিল। বিষয়টি রাখার জন্য উপাদানগুলির সংখ্যা সম্পর্কে সিদ্ধান্ত নেওয়া আমার পক্ষে বিষয়টি সম্পর্কে আমার জ্ঞান এবং স্ক্রি প্লট (নীচে দেখুন) থেকে প্রমাণিত হয়েছিল যে দুটি মূল উপাদান (পিসি) তথ্য ব্যাখ্যা করার জন্য যথেষ্ট ছিল এবং বাকী উপাদানগুলি কেবলমাত্র কম তথ্যমূলক ছিল।
সমান্তরাল বিশ্লেষণ সহ স্ক্রি প্লট: পর্যবেক্ষণ করা ইগেনভ্যালু (সবুজ) এবং 100 টি সিমুলেশন (লাল) এর উপর ভিত্তি করে সিমুলেটেড ইজেনভ্যালুগুলি। স্ক্রি প্লট 3 টি পিসি প্রস্তাব দেয়, যেখানে সমান্তরাল পরীক্ষায় কেবল প্রথম দুটি পিসিই প্রস্তাব দেয়।
আপনি দেখতে পাচ্ছেন কেবল মাত্র 48% বৈকল্পিকতা দুটি প্রথম পিসি দ্বারা ক্যাপচার করা যেতে পারে।
প্রথম 2 পিসি দ্বারা তৈরি প্রথম বিমানটিতে পর্যবেক্ষণের মাধ্যমে হায়ারারিকালিকালগ্রিজাল ক্লাস্টারিং (এইচএসি) এবং কে-মানে ক্লাস্টারিং ব্যবহার করে তিনটি পৃথক ক্লাস্টার প্রকাশিত হয়েছিল। এই 3 টি ক্লাস্টার সমস্যার সমাধানের সাথে খুব প্রাসঙ্গিক বলে প্রমাণিত হয়েছিল এবং অন্যান্য অনুসন্ধানের সাথেও সামঞ্জস্য ছিল। সুতরাং কেবল মাত্র 48% বৈকল্পিকতা সমস্ত কিছু দুর্দান্তভাবে দখল করে নিয়েছিল except
আমার দুই পর্যালোচকদের মধ্যে একজন বলেছেন: একজন এই গবেষণাগুলির উপর খুব বেশি নির্ভর করতে পারে না কারণ কেবলমাত্র 48% বৈচিত্র্য ব্যাখ্যা করা যেতে পারে এবং এটি প্রয়োজনীয়তার চেয়ে কম।
প্রশ্নটি বৈধ হওয়ার জন্য পিসিএ দ্বারা কতটা বৈকল্পিক গ্রহণ করতে হবে
তার কোনও প্রয়োজনীয় মান আছে ? এটি ডোমেন জ্ঞান এবং ব্যবহারের পদ্ধতিগুলির উপর নির্ভর করে না? পুরো বিশ্লেষণের যোগ্যতাটি কি কেবল ব্যাখ্যাযোগ্য বৈকল্পিকের নিছক মূল্যের ভিত্তিতে বিচার করতে পারে?
মন্তব্য
- ডেটা হ'ল জিনের 11 টি ভেরিয়েবল যা রিয়েল-টাইম কোয়ানটিটিভেটিভ পলিমেরেস চেইন রিঅ্যাকশন (আরটি-কিউপিসিআর) নামক আণবিক জীববিজ্ঞানের খুব সংবেদনশীল পদ্ধতি দ্বারা পরিমাপ করা হয়।
- বিশ্লেষণগুলি আর ব্যবহার করে করা হয়েছিল।
- মাইক্রোয়ারে বিশ্লেষণ, কেমোমেট্রিক্স, স্পেকোমেট্রিক বিশ্লেষণ বা এর মতো ক্ষেত্রে বাস্তব জীবনের সমস্যাগুলির উপর নির্ভর করে তাদের ব্যক্তিগত অভিজ্ঞতার উপর ভিত্তি করে ডেটা বিশ্লেষকদের উত্তরগুলি প্রশংসিত হয়।
- যথাসম্ভব রেফারেন্স সহ উত্তরটি সমর্থন করার বিষয়টি বিবেচনা করুন।