এখানে বেশ কয়েকটি ক্লাস্টারিং অ্যালগরিদমের সংক্ষিপ্তসার যা প্রশ্নের উত্তর দিতে সহায়তা করতে পারে
"আমার কোন ক্লাস্টারিং কৌশলটি ব্যবহার করা উচিত?"
বস্তুনিষ্ঠভাবে "সঠিক" ক্লাস্টারিং অ্যালগরিদম রেফ নেই
ক্লাস্টারিং অ্যালগরিদমগুলি তাদের "ক্লাস্টার মডেল" এর উপর ভিত্তি করে শ্রেণিবদ্ধ করা যেতে পারে। একটি বিশেষ ধরণের মডেলের জন্য ডিজাইন করা একটি অ্যালগরিদম সাধারণত ভিন্ন ধরণের মডেলটিতে ব্যর্থ হয়। উদাহরণস্বরূপ, কে-মানেগুলি নন-উত্তল ক্লাস্টারগুলি খুঁজে পাবে না, এটি কেবলমাত্র বিজ্ঞপ্তি আকারের ক্লাস্টারগুলি খুঁজে পেতে পারে।
অতএব, এই ক্লাস্টার মডেলগুলি বোঝা কীভাবে বিভিন্ন ক্লাস্টারিং অ্যালগরিদম / পদ্ধতিগুলির মধ্যে চয়ন করতে হয় তা বোঝার মূল হয়ে ওঠে। সাধারণ ক্লাস্টার মডেলগুলির মধ্যে রয়েছে:
[1] সংযোগ মডেল: দূরত্ব সংযোগের উপর ভিত্তি করে মডেল তৈরি করে। যেমন হায়ারারিকিকাল ক্লাস্টারিং। গাছ কাটা উচ্চতার ভিত্তিতে যখন আমাদের আলাদা বিভাজন প্রয়োজন তখন ব্যবহৃত হয়। আর ফাংশন: পরিসংখ্যান প্যাকেজ মধ্যে hclust।
[2] সেন্ট্রয়েড মডেল: একক গড় ভেক্টর দ্বারা প্রতিটি ক্লাস্টারের প্রতিনিধিত্ব করে মডেলগুলি তৈরি করে। যখন আমাদের খাস্তা বিভাজন প্রয়োজন (পরে বর্ণিত ফাজি ক্লাস্টারিংয়ের বিপরীতে) প্রয়োজন হয় তখন ব্যবহৃত হয়। আর ফাংশন: পরিসংখ্যান প্যাকেজ মধ্যে kmeans।
[3] বিতরণ মডেল: প্রত্যাশা-সর্বাধিককরণ অ্যালগরিদম দ্বারা ব্যবহৃত মাল্টিভিয়ারেট সাধারণ বিতরণগুলির মতো পরিসংখ্যান বিতরণের উপর ভিত্তি করে মডেল তৈরি করে। যখন ক্লাস্টার আকারগুলি কে-মানেগুলির থেকে পৃথক হতে পারে যা বৃত্তাকার ক্লাস্টারগুলি ধরে নেয়। আর ফাংশন: এমক্লাস্টার প্যাকেজে এমক্লাস্টার।
[4] ঘনত্ব মডেল: ডেটা স্পেসে সংযুক্ত ঘন অঞ্চল হিসাবে ক্লাস্টারগুলির ভিত্তিতে মডেল তৈরি করে models যেমন ডিবিএসসিএন এবং অপটিক্স। যখন ক্লাস্টার শেপগুলি কে-মানেগুলির বিপরীতে নির্বিচারে হতে পারে যা বৃত্তাকার ক্লাস্টারগুলি ধরে নেয় .. প্যাকেজ dbscan এ r ফাংশন dbscan।
[5] সাবস্পেস মডেল: উভয় ক্লাস্টার সদস্য এবং প্রাসঙ্গিক গুণাবলী উপর ভিত্তি করে মডেল তৈরি করে। উদাহরণস্বরূপ বাইক্লাস্টারিং (কো-ক্লাস্টারিং বা টু-মোড-ক্লাস্টারিং নামেও পরিচিত)। একসাথে সারি এবং কলাম ক্লাস্টারিংয়ের প্রয়োজন হলে ব্যবহৃত হয়। বিকলাস্ট প্যাকেজে আর ফাংশন বিকলাস্ট ust
[]] গোষ্ঠী মডেল: দলবদ্ধকরণ তথ্যের ভিত্তিতে মডেল তৈরি করে। যেমন সহযোগী ফিল্টারিং (সুপারিশকারী অ্যালগরিদম)। সুপারিশক প্যাকেজে ফাংশন সুপারিশকারী।
[]] গ্রাফ ভিত্তিক মডেল: চক্রের ভিত্তিতে মডেল তৈরি করে। সম্প্রদায় কাঠামো সনাক্তকরণ অ্যালগরিদমগুলি নির্দেশিত বা অপরিবর্তিত গ্রাফগুলিতে ঘন সাবগ্রাফগুলি সন্ধান করার চেষ্টা করে। যেমন ইগ্রাফ প্যাকেজে ক্লাস্টার_ওয়াকট্র্যাপ ফাংশন।
[8] কোহোনেন স্ব-সংগঠিত বৈশিষ্ট্য মানচিত্র: নিউরাল নেটওয়ার্কের ভিত্তিতে মডেল তৈরি করে। কোহোনেন প্যাকেজে আর ফাংশন সোম।
[9] স্পেকট্রাল ক্লাস্টারিং: নন-উত্তল ক্লাস্টার কাঠামোর উপর ভিত্তি করে মডেল তৈরি করে বা যখন কেন্দ্রের কোনও পরিমাপ সম্পূর্ণ ক্লাস্টারের উপযুক্ত বিবরণ না হয়। কার্নলব প্যাকেজে আর ফাংশন স্পেক।
[10] সাবস্পেস ক্লাস্টারিং: উচ্চ-মাত্রিক ডেটার জন্য, দূরত্বের কার্যগুলি সমস্যাযুক্ত হতে পারে। ক্লাস্টার মডেলগুলি ক্লাস্টারের জন্য সম্পর্কিত বৈশিষ্ট্যগুলি অন্তর্ভুক্ত করে। উদাহরণস্বরূপ, এইচডিডিসি ফাংশন আর প্যাকেজ এইচডি ক্লাসিফ।
[১১] সিকোয়েন্স ক্লাস্টারিং: গ্রুপ সিকোয়েন্সগুলি যা সম্পর্কিত। rBlast প্যাকেজ।
[12] আত্মীয়তার প্রচার: ডেটা পয়েন্টগুলির মধ্যে পাসওয়ার্ডের ভিত্তিতে মডেলগুলি তৈরি করে। এটি অ্যালগোরিদম চালানোর আগে নির্ধারিত ক্লাস্টারের সংখ্যা প্রয়োজন হয় না। নির্দিষ্ট কম্পিউটার ভিশন এবং গণনামূলক জীববিজ্ঞানের কাজের জন্য, যেমন- কে-মানে, রেফ রেপ্যাকেজ এপি ক্লাসটারের চেয়ে মানুষের মুখের ছবিগুলি ক্লাস্টারিং এবং নিয়ন্ত্রিত প্রতিলিপি সনাক্তকরণের পক্ষে এটি আরও ভাল।
[13] স্ট্রিম ক্লাস্টারিং: ডেটার উপর ভিত্তি করে মডেল যে এই ধরনের টেলিফোন রেকর্ড, আর্থিক লেনদেন ইত্যাদি একটানা পৌঁছা গুরুত্বপূর্ণ জৈব ফাংশন যেমন আর প্যাকেজ বার্চ [ https://cran.r-project.org/src/contrib/Archive/birch/]
[১৪] ডকুমেন্ট ক্লাস্টারিং (বা পাঠ্য ক্লাস্টারিং): এসভিডি ভিত্তিক মডেল তৈরি করে। এটি বিষয় নিষ্কাশন ব্যবহার করেছে। উদাহরণস্বরূপ গাজর [ http://search.carrot2.org] একটি ওপেন সোর্স অনুসন্ধান ফলাফল ক্লাস্টারিং ইঞ্জিন যা নথিগুলি থিম্যাটিক বিভাগে গুচ্ছ করতে পারে।
[15] প্রচ্ছন্ন শ্রেণীর মডেল: এটি পর্যবেক্ষিত মাল্টিভারিয়েট ভেরিয়েবলগুলির একটি সেটকে সুপ্ত ভেরিয়েবলগুলির একটি সেটের সাথে সম্পর্কিত করে। সহযোগী ফিল্টারিংয়ে এলসিএ ব্যবহার করা যেতে পারে। সুপারিশকারী প্যাকেজে আর ফাংশন সুপারিশকারীর সহযোগী ফিল্টারিং কার্যকারিতা রয়েছে।
[১]] বাইক্লাস্টারিং: একযোগে ক্লাস্টার সারি এবং দ্বি-মোড ডেটার কলামগুলিতে ব্যবহৃত হয়। উদাহরণস্বরূপ প্যাকেজ বিকলাস্টে আর ফাংশন বিক্লাস্ট।
[১]] সফট ক্লাস্টারিং (ফাজি ক্লাস্টারিং): প্রতিটি বস্তু প্রতিটি ক্লাস্টারের একটি নির্দিষ্ট ডিগ্রির অন্তর্গত। উদাহরণস্বরূপ, fclust প্যাকেজের মধ্যে Fclust ফাংশন।