গুচ্ছ বিশ্লেষণ অনুমান


16

প্রাথমিক প্রশ্নের জন্য ক্ষমা, আমি বিশ্লেষণের এই ফর্মটিতে নতুন এবং এখন পর্যন্ত নীতিগুলির একটি খুব সীমিত ধারণা পেয়েছি।

আমি কেবল ভাবছিলাম যে মাল্টিভারিয়েট / ইউনিভারিটি পরীক্ষার জন্য প্যারামেট্রিক অনুমানগুলি ক্লাস্টার বিশ্লেষণের জন্য প্রয়োগ করে? ক্লাস্টার বিশ্লেষণ সম্পর্কিত যে তথ্যগুলির উত্স আমি পড়েছি তার অনেকগুলিই অনুমানগুলি নির্দিষ্ট করতে ব্যর্থ।

আমি পর্যবেক্ষণের স্বাধীনতার ধারণা গ্রহণে বিশেষ আগ্রহী। আমার উপলব্ধি হ'ল এই অনুমানের লঙ্ঘন (উদাহরণস্বরূপ আনোভা এবং মাওভা-তে) গুরুতর কারণ এটি অনুমানের ত্রুটিটিকে প্রভাবিত করে। আমার পড়া থেকে এখনও অবধি মনে হচ্ছে যে ক্লাস্টার বিশ্লেষণ মূলত একটি বর্ণনামূলক কৌশল (যার মধ্যে নির্দিষ্ট কিছু ক্ষেত্রে কেবল পরিসংখ্যানগত অনুক্রম জড়িত)। তদনুসারে, স্বাধীনতা এবং সাধারণত বিতরণ করা ডেটার মতো অনুমানগুলি কী প্রয়োজনীয়?

এই সমস্যাটি নিয়ে আলোচনা করা পাঠ্যের যে কোনও প্রস্তাবনাগুলি প্রশংসিত হবে। অনেক ধন্যবাদ.

উত্তর:


7

ঠিক আছে, ক্লাস্টারিং কৌশলগুলি দূরত্ব-ভিত্তিক পদ্ধতিগুলির মধ্যে সীমাবদ্ধ নয় যেখানে আমরা জ্যামিতিক অর্থে পরিসংখ্যানগত ইউনিটগুলির গোষ্ঠীগুলি খুঁজছি যা অস্বাভাবিকভাবে একে অপরের নিকটে থাকে। ঘনত্বের উপর নির্ভরশীল বিভিন্ন কৌশল রয়েছে (ক্লাস্টারগুলি বৈশিষ্ট্যের জায়গাতে "অঞ্চলগুলি" হিসাবে দেখা হয়) বা সম্ভাবনা বিতরণ

পরবর্তী ঘটনাটি মডেল-ভিত্তিক ক্লাস্টারিং হিসাবেও পরিচিত ; সাইকোমেট্রিকরা ফিনিট মিক্সচার মডেলের এই নির্দিষ্ট কেসটিকে বোঝাতে ল্যাটেন্ট প্রোফাইল অ্যানালাইসিস শব্দটি ব্যবহার করেন , যেখানে আমরা ধরে নিয়েছি যে জনসংখ্যা বিভিন্ন অনাবৃত গ্রুপ বা সুপ্ত শ্রেণীর সমন্বয়ে গঠিত এবং সমস্ত প্রকাশ্য ভেরিয়েবলের যৌথ ঘনত্ব এই শ্রেণীর মিশ্রণ- নির্দিষ্ট ঘনত্ব এমক্লাস্ট প্যাকেজ বা এমপ্লাস সফ্টওয়্যারটিতে ভাল প্রয়োগের ব্যবস্থা রয়েছে । বিভিন্ন শ্রেণি-আক্রমণকারী কোভেরিয়েন্স ম্যাট্রিক্স ব্যবহার করা যেতে পারে (প্রকৃতপক্ষে, ক্লাস্টারের সংখ্যা পরিবর্তিত করার সময় ম্যাক্লাস্টটি অনুকূলটি নির্বাচন করতে বিআইসির মানদণ্ড ব্যবহার করে)।

স্ট্যান্ডার্ড লেটেন্ট ক্লাস মডেল এমন ধারণাও তৈরি করে যে পর্যবেক্ষণ করা ডেটা জি মাল্টিভারিয়েট মাল্টিনোমিয়াল বিতরণের মিশ্রণ থেকে আসে mixture মডেল-ভিত্তিক ক্লাস্টার বিশ্লেষণে একটি ভাল ওভারভিউ পাওয়া যায় : গিলস সেলেক্সের একটি প্রতিরক্ষা

তবুও এই পদ্ধতিগুলি বন্টনমূলক অনুমানের উপর নির্ভর করে, এটি ক্লাস্টার বা ক্লাসের সংখ্যা সম্পর্কে সিদ্ধান্ত নিতে আনুষ্ঠানিক পরীক্ষা বা ধার্মিকতার সাথে উপযুক্ত সূচকগুলি ব্যবহার করা সম্ভব করে তোলে, যা দূরত্ব ভিত্তিক ক্লাস্টার বিশ্লেষণে একটি কঠিন সমস্যা থেকে যায়, তবে নীচের নিবন্ধগুলি দেখুন যা এই বিষয়টি নিয়ে আলোচনা করেছে:

  1. হ্যান্ডল, জে।, নোলস, জে। এবং কেল, ডিবি (2005)। জেনোমোত্তিক পোস্ট বিশ্লেষণে গণ্য ক্লাস্টারের বৈধতা। বায়োইনফরম্যাটিকস , 21 (15) , 3201-3212।
  2. হেননিগ, সি। (2007) ক্লাস্টার স্থিতিশীলতার ক্লাস্টার-ভিত্তিক মূল্যায়ন। গণনা পরিসংখ্যান এবং ডেটা বিশ্লেষণ , 52 , 258-271।
  3. হেননিগ, সি। (২০০৮) ডিসসুলেশন পয়েন্ট এবং বিচ্ছিন্নতা দৃust়তা: সাধারণ ক্লাস্টার বিশ্লেষণ পদ্ধতিগুলির জন্য দৃust়তার মানদণ্ড। মাল্টিভারিয়েট বিশ্লেষণের জার্নাল , 99 , 1154-1176।

3

ক্লাস্টারিংয়ের একটি বিস্তৃত পদ্ধতি রয়েছে, যা প্রকৃতির দ্বারা অনুসন্ধান করা হয় এবং আমি মনে করি না যে এগুলির মধ্যে যে কোনও হায়ারার্কিকাল বা পার্টিশন-ভিত্তিক, বৈকল্পিক বিশ্লেষণের জন্য যে ধরণের অনুমানগুলি পূরণ করতে হবে তার উপর নির্ভর করে।

আপনার প্রশ্নের উত্তর দেওয়ার জন্য স্টাটাতে [এমভি] ডকুমেন্টেশনগুলি একবার দেখে আমি 85 পৃষ্ঠায় এই মজাদার উক্তিটি পেয়েছি:

যদিও কেউ কেউ বলেছেন যে ক্লাস্টার বিশ্লেষণ করার মতো লোক রয়েছে তেমনি ক্লাস্টার-বিশ্লেষণ পদ্ধতি রয়েছে। এটি একটি স্থূল অবলম্বন! একটি ক্লাস্টার বিশ্লেষণ সম্পাদন করার জন্য অসীম আরও বেশি উপায় রয়েছে যা তাদের সম্পাদন করে।

সেই প্রসঙ্গে, আমি সন্দেহ করি যে ক্লাস্টারিং পদ্ধতিতে কোনও অনুমান প্রয়োগ রয়েছে। বাক্যটির বাক্যটি কেবলমাত্র একটি সাধারণ নিয়ম হিসাবে প্রকাশ করেছে যে গুচ্ছ তৈরি করার জন্য আপনার কিছু রূপ "ভিন্নতা পরিমাপ" দরকার, যা ক্লাস্টারগুলি তৈরি করার জন্য কোনও মেট্রিক দূরত্বও হওয়া দরকার না।

একটি ব্যতিক্রম আছে, যদিও, আপনি যখন পোস্ট-অনুমান বিশ্লেষণের অংশ হিসাবে পর্যবেক্ষণগুলি ক্লাস্টার করছেন। স্টাটাতে, vceএকই উত্সের 86 পৃষ্ঠায় কমান্ডটি নিম্নলিখিত সতর্কতা সহ এসেছে:

আপনি যদি স্টাটারার অনুমানের কমান্ডগুলির বৃহত অ্যারের সাথে পরিচিত হন তবে ক্লাস্টার বিশ্লেষণ (ক্লাস্টার কমান্ড) এবং vce (ক্লাস্টার ক্লাস্টওয়ার) বিকল্পের মধ্যে অনেক অনুমানের কমান্ডের সাথে অনুমোদিত পার্থক্যটি সম্পর্কে সতর্কতা অবলম্বন করুন। ক্লাস্টার বিশ্লেষণ ডেটাগুলিতে গোষ্ঠীগুলি সন্ধান করে। বিভিন্ন অনুমানের আদেশের সাথে অনুমোদিত vce (ক্লাস্টার ক্লাস্টওয়ার) বিকল্পটি ইঙ্গিত দেয় যে পর্যবেক্ষণগুলি বিকল্প দ্বারা সংজ্ঞায়িত গোষ্ঠীগুলির মধ্যে স্বতন্ত্র কিন্তু এগুলি গ্রুপগুলির মধ্যে অগত্যা স্বাধীন নয়। ক্লাস্টার কমান্ড দ্বারা উত্পাদিত একটি গ্রুপিং ভেরিয়েবল খুব কমই vce (ক্লাস্টার ক্লাস্টওয়ার) বিকল্পের ব্যবহারের পিছনে অনুমানটি পূরণ করবে।

তার উপর ভিত্তি করে, আমি ধরে নেব যে নির্দিষ্ট ক্ষেত্রে বাইরে স্বাধীন পর্যবেক্ষণ প্রয়োজন হয় না। স্বজ্ঞাতভাবে, আমি যোগ করব যে ক্লাস্টার বিশ্লেষণ এমনকি পর্যবেক্ষণগুলি কতটা স্বতন্ত্র বা না সেগুলি অনুসন্ধানের সুনির্দিষ্ট উদ্দেশ্যে ব্যবহৃত হতে পারে।

আমি, যে উল্লেখ করে শেষ করব পৃষ্ঠা 356 এর Stata সঙ্গে পরিসংখ্যান , লরেন্স হ্যামিলটন, ক্লাস্টার বিশ্লেষণ একজন "অপরিহার্য" দৃষ্টিভঙ্গি যেমন মান ভেরিয়েবল উল্লেখ যদিও তিনি সমস্যা সম্পর্কে অধিক গভীরতা ঢোকা না।


2

স্থানীয় ক্লাস্টার বিশ্লেষণ ভৌগোলিকভাবে উল্লেখযোগ্য পর্যবেক্ষণগুলি ব্যবহার করে এবং এটি ক্লাস্টার বিশ্লেষণের একটি উপসেট যা অনুসন্ধানী বিশ্লেষণের মধ্যে সীমাবদ্ধ নয়।

উদাহরণ 1

এটি সুষ্ঠু নির্বাচন জেলা করতে ব্যবহার করা যেতে পারে।

উদাহরণ 2

স্থানীয় স্থানিক স্বতঃসংশোধনের পদক্ষেপগুলি ক্লাস্টারিংয়ের AMOEBA পদ্ধতিতে ব্যবহৃত হয় । Aldstadt এবং Getis একটি স্থানিক ওজন ম্যাট্রিক্স যে সুনির্দিষ্ট করা যেতে পারে তৈরি করতে ফলে ক্লাস্টার ব্যবহার স্থানিক রিগ্রেশন একটি হাইপোথিসিস পরীক্ষা করা হবে।

অ্যাল্ডস্টাড্ট, জ্যারেড এবং আর্থার গেটিস (২০০)) দেখুন "একটি স্থানিক ওজন ম্যাট্রিক্স তৈরি করতে এবং স্থানিক ক্লাস্টার সনাক্ত করতে AMOEBA ব্যবহার করে” "ভৌগলিক বিশ্লেষণ 38 (4) 327-343

উদাহরণ 3

ক্লাস্টারের বিশ্লেষণ এলোমেলোভাবে ক্রমবর্ধমান অঞ্চলের উপর ভিত্তি করে মানদণ্ডের একটি সেট দেওয়া স্কুলগুলির উপস্থিতি অঞ্চল বা নির্বাচনী জেলাগুলির মতো প্রাতিষ্ঠানিক অঞ্চলগুলির নকশায় অন্যায়তা নির্দেশ করার জন্য সম্ভাব্য পদ্ধতি হিসাবে ব্যবহার করা যেতে পারে।


1

ক্লাস্টার বিশ্লেষণে প্রতি সেচটি অনুমানের পরীক্ষার সাথে জড়িত নয়, তবে এটি অনুসন্ধানের বিশ্লেষণের জন্য বিভিন্ন মিলের অ্যালগরিদমের কেবলমাত্র একটি সংগ্রহ। আপনি হাইপোথিসিস টেস্টিং কিছুটা জোর করতে পারেন তবে ফলাফলগুলি প্রায়শই বেমানান হয় কারণ ক্লাস্টার পরিবর্তনগুলি পরামিতিগুলির পরিবর্তনের জন্য খুব সংবেদনশীল।

http://support.sas.com/documentation/cdl/en/statug/63033/HTML/default/viewer.htm#statug_introclus_sect010.htm

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.