এলডিএতে "লিনিয়ার বৈষম্যের সহগ" কী কী?


17

ইন R, আমি শ্রেণিবদ্ধকরণের জন্য ldaলাইব্রেরি থেকে ফাংশন ব্যবহার MASSকরি। আমি যেমন এলডিএ বুঝি, ইনপুট এক্সy লেবেল বরাদ্দ করা হবে , যা p(y|x) সর্বাধিক করে ?

তবে আমি যখন মডেলটি ফিট করি, যেখানে

x=(Lag1,Lag2)
y=Direction,
আমি আউটপুটটি বেশ বুঝতে পারি না lda,

সম্পাদনা করুন: নীচে আউটপুট পুনরুত্পাদন করতে, প্রথম চালান:

library(MASS)
library(ISLR)

train = subset(Smarket, Year < 2005)

lda.fit = lda(Direction ~ Lag1 + Lag2, data = train)
> lda.fit
Call:
lda(Direction ~ Lag1 + Lag2, data = train)

Prior probabilities of groups:
    Down       Up 
0.491984 0.508016 

Group means:
            Lag1        Lag2
Down  0.04279022  0.03389409
Up   -0.03954635 -0.03132544

Coefficients of linear discriminants:
            LD1
Lag1 -0.6420190
Lag2 -0.5135293

আমি উপরের আউটপুটে সমস্ত তথ্য বুঝতে পারি তবে একটি জিনিস, কী LD1? আমি এটির জন্য ওয়েব অনুসন্ধান করি, এটি কি লৈখিক বৈষম্যমূলক স্কোর ? এটা কি এবং কেন আমার এটি দরকার?

হালনাগাদ

আমি (যেমন বিভিন্ন পোস্ট পড়তে এই এবং এই এক এবং) এছাড়াও ডিএ জন্য ওয়েবে অনুসন্ধান, এবং এখন এখানে কি আমি ডিএ বা Lda বিভাগ সম্পর্কে চিন্তা করুন।

  1. এটা তোলে শ্রেণীবিন্যাস করতে ব্যবহার করা যেতে পারে, এবং যখন এই উদ্দেশ্যে, আমি বায়েসের পদ্ধতির ব্যবহার করতে পারেন, যে, অবর গনা p(y|x) প্রতিটি বর্গ জন্য , এবং তারপর শ্রেণীভুক্ত সর্বোচ্চ অবর সঙ্গে ক্লাসে । এই পদ্ধতির দ্বারা, আমি আদৌ বৈষম্যগুলি খুঁজে পাওয়ার দরকার নেই, তাই না?yix

  2. আমি পোস্টে পড়া, ডিএ বা অন্তত Lda বিভাগ প্রাথমিকভাবে লক্ষ্য করে দেয়া হয় dimensionality কমানো , জন্য K ক্লাস এবং D -dim predictor স্থান, আমি প্রকল্প করতে D -dim x একটি নতুন (K1) -dim বৈশিষ্ট্য স্থান z , অর্থাৎ,

    x=(x1,...,xD)z=(z1,...,zK1)zi=wiTx
    ,zমূলxথেকে রুপান্তরিত বৈশিষ্ট্য ভেক্টর হিসাবে দেখা যেতে পারেএবং প্রতিটিwiভেক্টর যার উপরxপ্রজেক্ট করা হয়।

আমি কি উপরোক্ত বিবৃতি সম্পর্কে সঠিক? যদি হ্যাঁ, আমার নিম্নলিখিত প্রশ্নগুলি রয়েছে:

  1. বৈষম্যমূলক কী ? প্রতিটি এন্ট্রি zi ভেক্টর মধ্যে z একটি discriminant হয়? অথবা wi ?

  2. বৈষম্যমূলক ব্যবহার করে শ্রেণিবিন্যাস কীভাবে করবেন?


1
এলডিএর দুটি স্বতন্ত্র পর্যায় রয়েছে: নিষ্কাশন এবং শ্রেণিবিন্যাস। নিষ্কাশনের সময়, ইনপুট ভেরিয়েবলের লিনিয়ার সংমিশ্রণ হিসাবে সুস্পষ্ট ভেরিয়েবলগুলি বৈষম্য বলা হয়। এই লিনিয়ার সংমিশ্রণের সহগকে বৈষম্যমূলক সহগ বলা হয়; এই আপনি সম্পর্কে জিজ্ঞাসা কি। ২ য় পর্যায়ে, ডেটা পয়েন্টগুলি মূল বৈকল্পিক দ্বারা নয়, সেই বৈষম্যমূলক শ্রেণীর দ্বারা ক্লাসে বরাদ্দ করা হয়। আরও পড়তে, discriminant analysisএই সাইটে অনুসন্ধান করুন।
ttnphns

2
লিনিয়ার বৈষম্যমূলক স্কোর একটি বৈষম্যমূলক দ্বারা ডেটা পয়েন্টের একটি মান, সুতরাং এটি বৈষম্যমূলক সহগের সাথে বিভ্রান্ত করবেন না, যা একটি রিগ্রেশনাল কোপিলিটির মতো। আমার বিস্তারিত উত্তর এখানে দেখুন
ttnphns

Xp(y|x)LD1

আপনি আসল ভেরিয়েবলের ভিত্তিতে বেয়েস-রুল শ্রেণিবদ্ধকরণ করতে এবং করতে পারেন may তবে এটি বৈষম্যমূলক বিশ্লেষণ হবে না। এলডিএর অপরিহার্য অংশটি হল মাত্রিকতা হ্রাস, যা আপনাকে মূল পরিবর্তনশীল-শ্রেণিবদ্ধদের সংখ্যক ডেরাইভেটিভ শ্রেণিবদ্ধকারী, বৈষম্যবিদদের দ্বারা প্রতিস্থাপন করতে দেয়। দয়া করে এখানে পোস্টগুলি পড়ুন, বিশেষত আমার, তারা বুদ্ধিমানভাবে এলডিএর ধারণা এবং গণিতের বর্ণনা দেয়।
ttnphns

@ এনটিএনএফএনএস, আপনি উপরের মন্তব্যে লিঙ্কিত পোস্টটি পড়ছি, ;-)
অ্যাভোকাডো

উত্তর:


5

LDA10.6420190×Lag1+0.5135293×Lag2

নীচের চার্টটি প্রশ্নের মধ্যে ব্যবহৃত ডেটা সেটের জন্য স্কোর, উত্তরীয় সম্ভাবনা এবং শ্রেণিবিন্যাসের মধ্যে সম্পর্কের চিত্র তুলে ধরেছে। মৌলিক নিদর্শনগুলি সর্বদা দ্বি-গ্রুপ এলডিএর সাথে থাকে: স্কোর এবং উত্তরীয় সম্ভাবনার মধ্যে 1-থেকে -1 ম্যাপিং থাকে এবং উত্তরীয় সম্ভাবনাগুলি বা স্কোরগুলি থেকে তৈরি হয়ে গেলে পূর্বাভাস সমান হয়।

স্কোর, উত্তরোত্তর সম্ভাবনা, শ্রেণিবিন্যাস

উপ-প্রশ্নের উত্তর এবং কিছু অন্যান্য মন্তব্যে

  • যদিও এলডিএটি মাত্রা হ্রাসের জন্য ব্যবহার করা যেতে পারে, উদাহরণে যা চলছে তা এটি নয়। দুটি গ্রুপের সাথে, পর্যবেক্ষণ অনুযায়ী কেবলমাত্র একক স্কোরের প্রয়োজনীয়তার কারণ হ'ল এটিই যা প্রয়োজন। এটি কারণ একটি গ্রুপে থাকার সম্ভাবনা অন্য দলের মধ্যে থাকার সম্ভাবনার পরিপূরক (কারণ, তারা 1 যুক্ত করে)। আপনি এটি চার্টে দেখতে পারেন: -৪ এর কম স্কোরগুলি ডাউন গ্রুপে থাকা হিসাবে শ্রেণিবদ্ধ করা হয়েছে এবং উচ্চতর স্কোরগুলি আপ হওয়ার পূর্বাভাস দেওয়া হয়েছে ।

  • কখনও কখনও স্কোর ভেক্টর বলা হয় a discriminant function। কখনও কখনও সহগকে এটি বলা হয়। উভয়ই সঠিক কিনা তা নিয়ে আমি পরিষ্কার নই। আমি বিশ্বাস করি যে MASS সহগকে discriminantবোঝায়।

  • এমএএসএস প্যাকেজের ldaফাংশনটি অন্যান্য অন্যান্য এলডিএ সফ্টওয়্যারটির জন্য আলাদাভাবে সহগ তৈরি করে। বিকল্প পদ্ধতির প্রতিটি গ্রুপের জন্য সহগের একটি সেট গণনা করা হয় এবং সহগের প্রতিটি সেটকে একটি বাধা থাকে। এই সহগগুলি ব্যবহার করে বৈষম্যমূলক কার্য (স্কোর) গণনা করা হয়েছে, শ্রেণিবিন্যাসটি সর্বোচ্চ স্কোরের উপর ভিত্তি করে শ্রেণিবিন্যাসের পূর্বাভাস দেওয়ার জন্য উত্তরোত্তর সম্ভাবনাগুলি গণনা করার দরকার নেই। আমি গিটহাবে কিছু এলডিএ কোড রেখেছি যা MASSফাংশনের একটি পরিবর্তন যা এই আরও সুবিধাজনক সহগগুলি তৈরি করে (প্যাকেজটি বলা হয় Displayr/flipMultivariates, এবং আপনি যদি কোনও বস্তু ব্যবহার করে তৈরি করেন তবে আপনি সহগগুলি ব্যবহার LDAকরতে পারেন obj$original$discriminant.functions)।

  • আমি আর কোডের জন্য সব ধারণা এই পোস্টে পোস্ট করেছেন এখানে

  • স্কোর থেকে উত্তরীয় সম্ভাবনার গণনার জন্য কোনও একক সূত্র নেই। বিকল্পগুলি বোঝার সবচেয়ে সহজ উপায় হ'ল (যাই হোক আমার পক্ষে) উত্স কোডটি দেখে, ব্যবহার করে:

library(MASS) getAnywhere("predict.lda")


I'm not clear on whether either [word use] is correct"বৈষম্যমূলক ফাংশন" ওরফে "বৈষম্যমূলক" একটি নিষ্কাশিত বৈকল্পিক - একটি পরিবর্তনশীল, একটি মাত্রা। সুতরাং ইনপুট ভেরিয়েবল এবং মানগুলি দ্বারা এটি নির্ধারণের জন্য এটি সহগের (ওজন) উভয় দ্বারা চিহ্নিত করা হয়। হুবহু পিসিএ-তে পিসির মতো। সুতরাং, "বৈষম্যমূলক সহগ" এবং "বৈষম্যমূলক স্কোর" সঠিক ব্যবহার।
ttnphns

@ এনটিএনএফএনএস, আপনার পরিভাষাটির ব্যবহারটি খুব স্পষ্ট এবং দ্ব্যর্থহীন। তবে, বিষয়টিতে পোস্ট এবং প্রকাশনাগুলির বেশিরভাগ অংশে এটি ব্যবহার নয় যা আমি তৈরি করার চেষ্টা করছিলাম। একাকী শব্দ-অর্থের ভিত্তিতে, এটি আমার কাছে বেশ স্পষ্ট যে "বৈষম্যমূলক ফাংশন" এর গাণিতিক ফাংশন (অর্থাত্ সংশ্লেষ এবং সহগ) উল্লেখ করা উচিত, তবে আবার আমার কাছে পরিষ্কার হয় নি যে এটির ব্যাপক ব্যবহার।
টিম

@ কোডটির জন্য আপনি যে লিঙ্কটি পোস্ট করেছেন তা শেষ হয়ে গেছে, দয়া করে আপনার উত্তরটিতে কোডটি অনুলিপি করতে পারবেন?
বাক্সেক্স

0

এই ফাংশনটির পিছনে তত্ত্বটি হ'ল "বেশ কয়েকটি জনগোষ্ঠীর মধ্যে বৈষম্যমূলক আচরণের জন্য ফিশারের পদ্ধতি"। আমি রেফারেন্সের জন্য প্রয়োগকৃত মাল্টিভিয়ারেট স্ট্যাটিস্টিকাল অ্যানালাইসিসের (আইএসবিএন: 9780134995397) 11.6 অধ্যায়টি প্রস্তাব দিই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.