প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ বনাম ক্লাস্টার বিশ্লেষণ - অনুমানের মধ্যে পার্থক্য?


30

একটি ক্লাস্টার বিশ্লেষণ বনাম একটি সুপ্ত বর্গ বিশ্লেষণ (এলসিএ) থেকে তৈরি করা যেতে পারে এমন সূত্রগুলির মধ্যে কী কী পার্থক্য রয়েছে? এটি কি সঠিক যে একটি এলসিএ একটি অন্তর্নিহিত সুপ্ত পরিবর্তনশীল ধরে নিয়েছে যা ক্লাসগুলিকে উত্থিত করে, যেখানে ক্লাস্টার বিশ্লেষণ একটি ক্লাস্টারিং অ্যালগরিদম থেকে সম্পর্কযুক্ত বৈশিষ্ট্যের একটি অভিজ্ঞতা অভিজ্ঞতা আছে? দেখে মনে হয় যে সামাজিক বিজ্ঞানগুলিতে, এলসিএ জনপ্রিয়তা অর্জন করেছে এবং পদ্ধতিগতভাবে এটি উচ্চতর হিসাবে বিবেচিত হয় যে এটির একটি আনুষ্ঠানিক চি-স্কোয়ার তাত্পর্য পরীক্ষা রয়েছে, যা গুচ্ছ বিশ্লেষণ করে না।

উদাহরণস্বরূপ, "এলসিএ এটির জন্য উপযুক্ত (তবে ক্লাস্টার বিশ্লেষণ নয়) আকারে দেওয়া যেতে পারে তবে দুর্দান্ত হবে, এবং ক্লাস্টার বিশ্লেষণ এটির জন্য উপযুক্ত হবে (তবে সুপ্ত শ্রেণির বিশ্লেষণ নয়)।

ধন্যবাদ! ব্রায়ান


1
inferencesআপনি এই প্রসঙ্গে কী ডাকবেন এবং কেন কেবলমাত্র আগ্রহের ক্ষেত্রেই ভিন্নতা?
ttnphns

1
@ttnphns ইনফারেন্স অনুসারে, আমি ফলাফলগুলির মূল ব্যাখ্যাটি বলতে চাইছি। আমি "আগ্রহ অনুসারে কেবলমাত্র পার্থক্য" সম্পর্কে আমার আগ্রহ সম্পর্কে আপনার প্রশ্নের উত্তর অংশ সম্পর্কে নিশ্চিত নই? আমি তাদের নিজ নিজ অ্যালগরিদম বা অন্তর্নিহিত গণিতের সম্পাদনে আগ্রহী নই। ফলাফলগুলি কীভাবে ব্যাখ্যা করা হবে তাতে আমি আগ্রহী।
ব্রায়ান পি

উত্তর:


27

প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ আসলে একটি সীমাবদ্ধ মিশ্রণ মডেল ( এখানে দেখুন )। এফএমএম এবং অন্যান্য ক্লাস্টারিং অ্যালগোরিদমগুলির মধ্যে প্রধান পার্থক্য হ'ল এফএমএমের প্রস্তাব দেয় এমন একটি "মডেল-ভিত্তিক ক্লাস্টারিং" পদ্ধতির যা আপনার সম্ভাব্য মডেল ব্যবহার করে ক্লাস্টারগুলি উত্স করে যা আপনার ডেটা বন্টনকে বর্ণনা করে। সুতরাং কিছু নির্বিচারে নির্বাচিত দূরত্ব পরিমাপের সাথে ক্লাস্টারগুলি সন্ধান করার পরিবর্তে, আপনি এমন একটি মডেল ব্যবহার করেন যা আপনার ডেটা বন্টনকে বর্ণনা করে এবং এই মডেলটির উপর ভিত্তি করে আপনি সম্ভাবনাগুলি মূল্যায়ন করেন যে কয়েকটি ক্ষেত্রে কিছু প্রচ্ছন্ন শ্রেণীর সদস্য। সুতরাং আপনি বলতে পারেন যে এটি একটি শীর্ষ-ডাউন পদ্ধতির (আপনি আপনার ডেটা বন্টন বর্ণনা দিয়ে শুরু করেছেন) অন্য ক্লাস্টারিং অ্যালগোরিদমগুলি বরং নীচের দিকে আপ (আপনি কেসের মধ্যে মিল খুঁজে পেয়েছেন)।

যেহেতু আপনি আপনার ডেটা মডেল নির্বাচনের জন্য একটি পরিসংখ্যানের মডেল ব্যবহার করেন এবং ফিটের ভালতার মূল্যায়ন করা সম্ভব - ক্লাস্টারিংয়ের বিপরীতে। এছাড়াও, যদি আপনি ধরে নেন যে এমন কোনও প্রক্রিয়া বা "সুপ্ত কাঠামো" রয়েছে যা আপনার ডেটার কাঠামোর নীচে অন্তর্ভুক্ত থাকে তবে এফএমএম এর উপযুক্ত পছন্দ বলে মনে হয় যেহেতু তারা আপনাকে আপনার ডেটার পিছনের সুপ্ত কাঠামোর মডেল করতে সক্ষম করে (বরং কেবলমাত্র সাদৃশ্যগুলির সন্ধানে)।

অন্যান্য পার্থক্য হ'ল এফএমএমগুলি ক্লাস্টারিংয়ের চেয়ে আরও নমনীয়। ক্লাস্টারিং অ্যালগরিদমগুলি কেবল ক্লাস্টারিং করে, যখন এফএমএম- এবং এলসিএ-ভিত্তিক মডেলগুলি রয়েছে

  • দলগুলির মধ্যে বিশ্লেষণ, নিশ্চিতকরণযোগ্য করতে আপনাকে সক্ষম করুন
  • আইটিএম রেসপন্স থিওরি (এবং অন্যান্য) মডেলগুলি এলসিএর সাথে একত্রিত করুন,
  • স্বতন্ত্র শ্রেণীর সদস্যতার পূর্বাভাস দেওয়ার জন্য কোভেরিয়েটগুলি অন্তর্ভুক্ত করুন,
  • এবং / অথবা এমনকি সুপ্ত-শ্রেণীর রিগ্রেশন মধ্যে ক্লাস্টার রিগ্রেশন মডেল ,
  • আপনার ডেটা কাঠামো ইত্যাদির কাঠামোর সাথে সাথে আপনাকে সময়ের পরিবর্তনের মডেল করতে সক্ষম করে

আরও উদাহরণের জন্য দেখুন:

হাজেনার্স জেএ এবং ম্যাককুটিয়ন, আ.লীগ (২০০৯)। ফলিত প্রচ্ছন্ন শ্রেণীর বিশ্লেষণ। ক্যামব্রিজ ইউনিভার্সিটি প্রেস.

এবং আর এর মধ্যে ফ্লেক্সমিক্স এবং পোলসিএসিএ প্যাকেজগুলির ডকুমেন্টেশন , নিম্নলিখিত কাগজপত্র সহ:

লিনজার, ডিএ, এবং লুইস, জেবি (২০১১)। পোলসিএএ: বহুভুজ পরিবর্তনশীল সুপ্ত শ্রেণীর বিশ্লেষণের জন্য একটি আর প্যাকেজ। পরিসংখ্যান সফটওয়্যার জার্নাল, 42 (10), 1-29।

লিশ, এফ (2004)। ফ্লেক্সিমিক্স: স্ট্যাটিস্টিকাল সফটওয়্যার, জার্নাল জার্নালের 11 (8), 1-18 এ সীমাবদ্ধ মিশ্রণ মডেল এবং সুপ্ত কাঁচের রিগ্রেশনের সাধারণ কাঠামো

গ্রান, বি।, এবং লিশ, এফ (২০০৮)। ফ্লেক্সমিক্স সংস্করণ 2: সমবর্তী ভেরিয়েবল এবং বিভিন্ন এবং ধ্রুবক পরামিতিগুলির সাথে সসীম মিশ্রণ । পরিসংখ্যান সফটওয়্যার জার্নাল, 28 (4), 1-35।


3

একটি সুপ্ত শ্রেণির মডেল (বা সুপ্ত প্রোফাইল, বা আরও সাধারণভাবে, একটি সসীম মিশ্রণ মডেল) ক্লাস্টারিং (বা অবিরত শ্রেণিবদ্ধকরণ) এর জন্য একটি সম্ভাব্য মডেল হিসাবে ভাবা যেতে পারে। লক্ষ্যটি সাধারণত একই হয় - বৃহত্তর জনগোষ্ঠীর মধ্যে সমজাতীয় গ্রুপগুলি সনাক্ত করা। আমি মনে করি সুপ্ত শ্রেণীর মডেল এবং ক্লাস্টারিংয়ের অ্যালগরিদমিক পদ্ধতির মধ্যে প্রধান পার্থক্য হ'ল প্রাক্তন অবশ্যই ক্লাস্টারিংয়ের প্রকৃতি সম্পর্কে আরও তাত্ত্বিক অনুমানের কাছে নিজেকে ঘৃণা করেন; এবং যেহেতু সুপ্ত ক্লাসের মডেলটি পরীক্ষামূলক, তাই এটি সম্ভাবনার পরিসংখ্যানগুলির মাধ্যমে মডেল ফিটকে মূল্যায়নের জন্য অতিরিক্ত বিকল্প দেয় এবং শ্রেণিবিন্যাসে আরও ভাল ক্যাপচার / অনিশ্চয়তা ধরে রাখে।

আপনি এই থ্রেডে কিছু দরকারী টিডবিটস পাশাপাশি chl দ্বারা সম্পর্কিত পোস্টে এই উত্তরটি পেতে পারেন।

এছাড়া এই সঙ্গে সমান্তরাল (ক ধারণাগত স্তর দিকে) হয় প্রশ্ন পিসিএ সম্পর্কে বনাম ফ্যাক্টর বিশ্লেষণ, এবং এই এক খুব।


2

পার্থক্যটি হ'ল লেটেন্ট ক্লাস অ্যানালাইসিস ক্লাসের বৈশিষ্ট্যগুলির সম্ভাব্যতা নির্ধারণের জন্য লুকানো ডেটা (যা সাধারণত বৈশিষ্টগুলিতে সংযুক্তির নিদর্শন) ব্যবহার করে। তারপরে আইটেমগুলিকে তাদের বৈশিষ্ট্যের ভিত্তিতে শ্রেণিতে আলাদা করার সর্বাধিক সম্ভাবনা ব্যবহার করে সূচনাগুলি তৈরি করা যেতে পারে।

ক্লাস্টার বিশ্লেষণ বৈশিষ্ট্যগুলি প্লট করে এবং কোনও আইটেমের কোন শ্রেণীর অন্তর্গত তা নির্ধারণের জন্য নিকটতম প্রতিবেশী, ঘনত্ব বা শ্রেণিবিন্যাসের মতো অ্যালগরিদম ব্যবহার করে।

মূলত এলসিএ অনুমানকে "সম্ভাব্যতা ব্যবহার করে সর্বাধিক অনুরূপ নিদর্শনগুলি" হিসাবে বিবেচনা করা যেতে পারে এবং ক্লাস্টার বিশ্লেষণটি হবে "দূরত্ব ব্যবহার করে সবচেয়ে কাছের জিনিসটি কী"।


গুচ্ছ বিশ্লেষণ সম্পর্কে বিবৃতিতে কোন "জিনিস" বোঝায় আপনি কি তা পরিষ্কার করতে পারেন? এটি কি দূরত্বের এক ভিত্তিতে সবচেয়ে কাছের 'বৈশিষ্ট্য'?
ব্রায়ান পি

জিনিসটি কোনও বস্তু বা বৈশিষ্ট্য পরামিতিগুলির সাথে আপনি যে কোনও ডেটা ইনপুট করবেন object
সিসিএসভি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.