পিসিএতে কম ভেরিয়েন্স উপাদানগুলি, তারা কি সত্যই কেবল শব্দ করছে? এটির জন্য পরীক্ষা করার কোনও উপায় আছে কি?


18

আমি সিদ্ধান্ত নেওয়ার চেষ্টা করছি যে কোনও পিসিএর উপাদান সংরক্ষণ করা হবে কিনা। এগেনভ্যালুটির परिमाणের উপর ভিত্তি করে একটি গাজিলিয়ন মাপদণ্ড রয়েছে, বর্ণিত এবং তুলনা করা যেমন এখানে বা এখানে

তবে, আমার আবেদনে আমি জানি যে বৃহত্তর (স্টাডেন্ট) ইগোনালুয়ের তুলনায় ছোট (এস্ট) ইগন্যালুও ছোট হবে এবং প্রস্থের উপর ভিত্তি করে মানদণ্ডগুলি ছোট (এস্ট) একটিকে প্রত্যাখ্যান করবে। এটা আমি চাই না। আমি যে বিষয়ে আগ্রহী তা: যে কোনও পদ্ধতি জানা যায় যা ক্ষুদ্র ইগানুয়ালুয়ালের প্রকৃত অনুষঙ্গকে বিবেচনা করে বিবেচনা করে: এটি কি সমস্ত পাঠ্যপুস্তকে উল্লিখিত "সত্য" শব্দের, বা সম্ভাবনার "কিছু" আছে সুদ বাকি? যদি এটি সত্যিই শব্দ হয় তবে এটিকে সরিয়ে দিন, অন্যথায় এটি চালিয়ে যান, ইগন্যালুয়ের পরিমাণ কত বেশি হোক।

পিসিএতে উপাদানগুলির জন্য কি এমন কোনও প্রতিষ্ঠিত এলোমেলোতা বা বিতরণ পরীক্ষা রয়েছে যা আমি খুঁজে পাচ্ছি না? বা কেউ কি এমন কোনও কারণ জানেন যে এটি একটি নির্বোধ ধারণা হবে?

হালনাগাদ

দুটি ব্যবহারের ক্ষেত্রে হিস্টোগ্রামগুলি (সবুজ) এবং উপাদানগুলির স্বাভাবিক অনুমান (নীল): একবার সম্ভবত সত্যই শব্দ হয়, একবার সম্ভবত "ঠিক" শব্দ হয় না (হ্যাঁ, মানগুলি ছোট, তবে সম্ভবত এলোমেলো নয়)। উভয় ক্ষেত্রে সর্বাধিক একক মান value 160, সর্বনিম্ন, অর্থাত্ এই একক মান, 0.0 xx - যে কোনও কাট-অফ পদ্ধতির পক্ষে খুব ছোট।

আমি যা খুঁজছি তা এটি আনুষ্ঠানিক করার একটি উপায় ...

সম্ভবত সত্যিই "ন্যায্য" শব্দ সম্ভবত গোলমাল নয় তবে এতে আকর্ষণীয় বিট থাকতে পারে


2
আপনি যে পরীক্ষাগুলি উল্লেখ করেছেন তার মধ্যে অনেকগুলি আপনার কাছে ঠিক মতো সম্পত্তি রয়েছে: তারা "সংকেত" থেকে "শব্দ" আলাদা করার চেষ্টা করে।
whuber

2
আমি সম্প্রতি একটি অনুরূপ প্রশ্নে আগ্রহী হয়েছি, তবে একটি নির্দিষ্ট পরিস্থিতিতে যখন আপনার কাছে প্রতিটি ডাটা পয়েন্টের জন্য একাধিক পরিমাপ থাকে। প্রতিটি ডেটা পয়েন্টের জন্য একাধিক নমুনা পাওয়া গেলে পিসিএ উপাদান নির্বাচন করে দেখুন । সম্ভবত এটি আপনার ক্ষেত্রেও প্রযোজ্য?
অ্যামিবা বলেছেন মনিকাকে

পিসিগুলিতে বিতরণমূলক পরীক্ষাগুলি তাদের এলোমেলোভাবে শোনার বিষয়ে সিদ্ধান্ত নিতে খুব আকর্ষণীয় ধারণা হিসাবে (যেটি আমি কখনও প্রয়োগ করতে দেখিনি); আইসিএতে অনুরূপ কিছু করা হয়, যা সুনির্দিষ্টভাবে সর্বাধিক অ-গাওসিয়ান উপাদানগুলির সন্ধান করে। পিসিএ করা এবং তারপরে যে উপাদানগুলি "খুব গৌসিয়ান" রয়েছে তা এড়িয়ে যাওয়ার আইসিএ স্বাদ রয়েছে এবং সম্ভবত এটি কার্যকরভাবে কাজ করবে!
অ্যামিবা

উত্তর:


20

একটি ছোট অধ্যক্ষ উপাদান (পিসি) এর এলোমেলোতা পরীক্ষা করার একটি উপায় হ'ল শব্দের পরিবর্তে এটি একটি সংকেতের মতো আচরণ করা: অর্থাত্ এটির সাথে আগ্রহের আরও পরিবর্তনশীল ভবিষ্যদ্বাণী করার চেষ্টা করুন। এটি মূলত মূল উপাদানগুলির রিগ্রেশন (পিসিআর)

পিসিআর এর ভবিষ্যদ্বাণীমূলক প্রসঙ্গে, লট (1973) পিসি এমনভাবে নির্বাচন করার পরামর্শ দেয় যাতে সর্বাধিক হয় ; Gunst এবং Mason (1977) উপর ফোকাস । ছোট ইগেনভ্যালু (এমনকি ক্ষুদ্রতম!) সহ পিসিগুলি পূর্বাভাসগুলি উন্নত করতে পারে (হোটেলিং, ১৯৫ Mass; ম্যাসি, ১৯ ;;; হকিন্স, ১৯3৩; হ্যাডি ও লিং, ১৯৯৯ ; জ্যাকসন, ১৯৯১) এবং কিছু প্রকাশিত, ভবিষ্যদ্বাণীমূলক অ্যাপ্লিকেশনগুলিতে খুব আকর্ষণীয় প্রমাণিত হয়েছে ( জলিফ , 1982 , 2010 ) । এর মধ্যে রয়েছে:আর2এমএস

  • একটি রাসায়নিক ইঞ্জিনিয়ারিং মডেল পিসি 1, 3, 4, 6, 7 এবং 9 টির মোট 8 টি ( স্মিথ এবং ক্যাম্পবেল, 1980 ) ব্যবহার করে
  • 10 এর মধ্যে 8, 2 এবং 10 (গুরুত্ব অনুসারে) পিসি ব্যবহার করে একটি বর্ষার মডেল ( কুং ও শরীফ, 1980 )
  • 6 এর মধ্যে 4 এবং 5 পিসি ব্যবহার করে একটি অর্থনৈতিক মডেল (হিল, ফম্বি, এবং জনসন, 1977)

উপরের তালিকাভুক্ত উদাহরণগুলির মধ্যে পিসিগুলি তাদের ইগেন্যুয়ালুজের র্যাংকড মাপ অনুসারে নম্বরযুক্ত। জলিফ (1982) একটি ক্লাউড মডেল বর্ণনা করে যাতে শেষ উপাদানটি সবচেয়ে বেশি অবদান রাখে। তিনি শেষ করেছেন:

উপরোক্ত উদাহরণগুলি দেখিয়েছে যে শেষ কয়েকটি প্রধান উপাদানগুলি মূল উপাদানগুলির রিগ্রেশনটিতে গুরুত্বপূর্ণ হওয়ার জন্য অস্পষ্ট বা উদ্ভট তথ্য খুঁজে পাওয়া দরকার না। বরং এটি মনে হয় যে এই ধরণের উদাহরণগুলি বাস্তবে প্রচলিত হতে পারে। পার্বত্য ইত্যাদি। (1977) মূল উপাদানগুলি বাছাইয়ের জন্য কৌশলগুলির একটি বিশদ এবং দরকারী আলোচনা দেবে যা কেবলমাত্র পরিবর্তনের আকারের ভিত্তিতে নির্বাচনের ধারণা চিরতরে সমাহিত করা উচিত ছিল। দুর্ভাগ্যক্রমে এটি ঘটেছে বলে মনে হয় না, এবং ধারণাটি সম্ভবত 20 বছর আগের চেয়ে এখন আরও ব্যাপক is

তদুপরি, ছোট-এগেনুয়ালু পিসিগুলি বাদ দিয়ে পক্ষপাতিত্ব চালু করতে পারে (ম্যাসন এবং গানস্ট, 1985)হাদি এবং লিং (1998) পাশাপাশি রিগ্রেশন বিবেচনা করার পরামর্শ দেয় ; তারা তাদের নিবন্ধটি সংক্ষেপে এইভাবে:এসএস

(পি-1)ওয়াই

প্রতিক্রিয়া ভেরিয়েবলের প্রকরণ হিসাববিদ্যা মধ্যে পিসিআর ব্যর্থতার জন্য কারণ পিসিতে PCD [প্রধান উপাদান পচানি] যা শুধুমাত্র উপর নির্ভর করে উপর ভিত্তি করে নির্বাচিত করা হয় । সুতরাং, যদি পিসিআরটি ব্যবহার করতে হয়, তবে এটি সতর্কতার সাথে ব্যবহার করা উচিত এবং পিসিগুলি বজায় রাখার জন্য কেবল বৈষম্য ক্ষয় দ্বারা নয়, প্রতিটি প্রধান উপাদানকে বর্গক্ষেত্রের সংমিশ্রণের যোগফলের দ্বারা পরিচালিত হওয়া উচিত।এক্স

আমার এই উত্তরটি @ স্কার্টির কাছে owণী, যিনি পিসিআর পিসি সিলেকশন সম্পর্কে আমার নিজের ভুল ধারণাটি সংশোধন করেছিলেন খুব কিছু সহায়ক মন্তব্য সহ, যার মধ্যে রয়েছে: " জলিফ (2010) পিসি নির্বাচনের অন্যান্য পদ্ধতির পর্যালোচনা করে।" এই ধারণাটি আরও ধারণাগুলি সন্ধানের জন্য ভাল জায়গা হতে পারে।

তথ্যসূত্র

- গানস্ট, আরএফ, এবং ম্যাসন, আরএল (1977)। প্রতিরোধে পক্ষপাতদুষ্ট অনুমান: গড় স্কোয়ার ত্রুটি ব্যবহার করে একটি মূল্যায়ন। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশন জার্নাল, 72 (359), 616–628।
- হাদি, এএস, এবং লিংক, আরএফ (1998) প্রধান উপাদানগুলির রিগ্রেশন ব্যবহারের বিষয়ে কিছু সতর্কতা নোট। আমেরিকান পরিসংখ্যানবিদ, 52 (1), 15-19 Http://www.uvm.edu/~rsingle/stat380/F04/possible/Hadi+Ling-AmStat-1998_PCRegression.pdf থেকে প্রাপ্ত ।
- হকিন্স, ডিএম (1973)। প্রধান উপাদান বিশ্লেষণ দ্বারা বিকল্প রিগ্রেশন তদন্ত উপর। ফলিত পরিসংখ্যান, 22 (3), 275-256।
- হিল, আরসি, ফম্বি, টিবি, এবং জনসন, এসআর (1977)। প্রধান উপাদানগুলির সংমিশ্রণের জন্য উপাদান নির্বাচনের মানদণ্ড।পরিসংখ্যানগুলিতে যোগাযোগ - তত্ত্ব এবং পদ্ধতি, 6 (4), 309–334।
- হোটেলিং, এইচ। (1957)। বিশ্লেষণকে ফ্যাক্টর বিশ্লেষণের জন্য আরও বহু নতুন পরিসংখ্যানমূলক পদ্ধতির সম্পর্ক। ব্রিটিশ জার্নাল অফ স্ট্যাটিস্টিকাল সাইকোলজি, 10 (2), 69-79।
- জ্যাকসন, ই। (1991)। প্রধান উপাদানগুলির জন্য ব্যবহারকারীর গাইড । নিউ ইয়র্ক: উইলে
- জলিফ, আইটি (1982)। রিগ্রেশনে মূল উপাদানগুলির ব্যবহার সম্পর্কে নোট। ফলিত পরিসংখ্যান, 31 (3), 300-303। থেকে সংগৃহীত http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2082.pdf
- জলিফ, আইটি (২০১০)প্রধান উপাদান বিশ্লেষণ (দ্বিতীয় সংস্করণ)। স্প্রিঙ্গের।
- কুং, ইসি, এবং শরীফ, টিএ (1980) পূর্ববর্তী উচ্চ বায়ু পরিস্থিতি সহ ভারতীয় গ্রীষ্মকালীন বর্ষা শুরু হওয়ার প্রতিরোধের পূর্বাভাস। প্রয়োগযুক্ত আবহাওয়া জার্নাল, 19 (4), 370–380। Http://iri.columbia.edu/~ousmane/print/Onset/EnnestSharif80_JAS.pdf থেকে প্রাপ্ত।
- লট, ডাব্লুএফ (1973)। সর্বনিম্ন-বর্গক্ষেত্রের রিগ্রেশনতে মূল উপাদানগুলির সীমাবদ্ধতার সর্বোত্তম সেট। পরিসংখ্যানগুলিতে যোগাযোগ - তত্ত্ব এবং পদ্ধতি, 2 (5), 449–464।
- মেসন, আরএল, এবং গানস্ট, আরএফ (1985)। রিগ্রেশনে মূল উপাদান নির্বাচন করা। পরিসংখ্যান এবং সম্ভাবনার চিঠিগুলি, 3 (6), 299–301।
- ম্যাসি, ডাব্লুএফ (1965)। অনুসন্ধানী পরিসংখ্যান গবেষণায় প্রধান উপাদানগুলি রিগ্রেশন। আমেরিকান পরিসংখ্যান সমিতি জার্নাল, 60 (309), 234-256। থেকে সংগৃহীত http://automatica.dei.unipd.it/public/Schenato/PSC/2010_2011/gruppo4-Building_termo_identification/IdentificazioneTermodinamica20072008/Biblio/Articoli/PCR%20vecchio%2065.pdf
- স্মিথ, জি।, এবং ক্যাম্পবেল, এফ (1980)। কিছু রিজ রিগ্রেশন পদ্ধতির সমালোচনা। আমেরিকান পরিসংখ্যান সমিতি জার্নাল, 75 (369), 74-81। Https://cowles.econ.yale.edu/P/cp/p04b/p0496.pdf থেকে প্রাপ্ত ।


4
... এবং আপনার সমস্যার সমাধান করার জন্য আপনার যে প্রভাবটি প্রয়োজন তা কেবল অন্য শব্দগুলির চেয়ে বেশি হওয়া অন্যান্য প্রভাবগুলির চেয়ে বড় guarantee হাতে সমস্যা। আমি এমন ডেটা দেখেছি যেখানে 95% বৈকল্পিক কিছু শারীরিক প্রভাবের কারণে শব্দ
পেয়েছিল

3
খুব সুন্দর পর্যালোচনা, তবে (আবারো দ্বিধায় দুঃখের) গতি হাদি ও লিং, প্রতিক্রিয়ার দৃ strong় সম্পর্কের ভিত্তিতে পিসিগুলিকে রিগ্রেশন বজায় রাখার জন্য নির্বাচন করা প্রতিক্রিয়ার দৃ strong় সম্পর্কের ভিত্তিতে মূল ভবিষ্যদ্বাণীকারীদের বাছাইয়ের মতোই বিপজ্জনক। ক্রস-বৈধকরণ অপরিহার্য এবং সঙ্কুচিত করা ভাল। ভবিষ্যদ্বাণীকারীদের উপর ডেটা হ্রাস গাইড, প্রতিক্রিয়া অন্ধ, উদাহরণস্বরূপ অনেক একই জিনিস পরিমাপকারী ভবিষ্যদ্বাণীকারীদের গ্রুপের প্রথম পিসি ব্যবহার করে, বা ভেরিয়েবল ক্লাস্টারিং দ্বারা নির্ধারিত ব্যক্তি হিসাবে ব্যক্তিগতভাবে আমি পিসিএর বিচার্য বিচারের সাথে বিষয়বস্তু জ্ঞানের সাথে পছন্দ করতাম।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

2
এই প্রশ্নের উত্তরটি +1 (অনেক দিন আগে), তবে এখনই এই থ্রেডটি পর্যালোচনা করার পরে, আমাকে অবশ্যই বলতে হবে যে এই উত্তরটি মূল প্রশ্নের প্রায় কোনও উত্তর দেয় না: ওপি বিচার করতে উপাদানগুলির উপর কোনও বিতরণমূলক পরীক্ষা ব্যবহার করতে পারে কিনা সে সম্পর্কে জিজ্ঞাসা করছিলেন তাদের এলোমেলোতা। ওপিতে আমার শেষ মন্তব্যটিও দেখুন।
অ্যামিবা

2

@ নিক স্টাওনারের উত্তরে যোগ করা, আপনি যখন সাবস্পেস ক্লাস্টারিংয়ের সাথে কাজ করছেন, পিসিএ প্রায়শই একটি দুর্বল সমাধান is

পিসিএ ব্যবহার করার সময়, বেশিরভাগই উচ্চতম ইগেনভ্যালুযুক্ত ইগেনভেেক্টর সম্পর্কে উদ্বিগ্ন, যা সেই দিকগুলিকে প্রতিনিধিত্ব করে যেখানে ডেটা সবচেয়ে বেশি প্রসারিত হয় ' যদি আপনার ডেটাটি ছোট উপস্পেস নিয়ে থাকে তবে পিসিএ এগুলিকে পুরোপুরি উপেক্ষা করবে যেহেতু তারা সামগ্রিক ডেটা বৈকল্পিকতায় খুব বেশি অবদান রাখে না।

সুতরাং, ছোট আইজেনভেেক্টর সবসময় খাঁটি শব্দ হয় না।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.