শপিং কার্ট বিশ্লেষণ সম্পর্কে, আমি মনে করি যে মূল উদ্দেশ্য গ্রাহকদের দ্বারা কেনা পণ্যগুলির ঘন ঘন সংমিশ্রণকে পৃথক করা। association rules
এখানে সবচেয়ে প্রাকৃতিক পদ্ধতি প্রতিনিধিত্ব (প্রকৃতপক্ষে তারা আসলে এই কাজের জন্য উন্নত ছিল)। গ্রাহকদের দ্বারা কেনা পণ্য সংমিশ্রণ বিশ্লেষণ, এবং এই সংমিশ্রনের সংখ্যার পুনরাবৃত্তি বারবার 'যদি শর্ত থাকে, তবে ফলাফল' এর সাথে সম্পর্কিত আকর্ষণীয়তা পরিমাপের ফলে একটি নিয়মের দিকে পরিচালিত করে। Log-linear models
বিবেচিত ভেরিয়েবলের মধ্যে সমিতিগুলি তদন্ত করার জন্য আপনি বিবেচনা করতে পারেন ।
ক্লাস্টারিংয়ের ক্ষেত্রে, এখানে কিছু তথ্য কার্যকর হতে পারে:
প্রথমে বিবেচনা করুন Variable clustering
। ভেরিয়েবল ক্লাস্টারিং কলিনারিটি, রিডানডেন্সি মূল্যায়নের জন্য এবং ভেরিয়েবলগুলি ক্লাস্টারে আলাদা করার জন্য ব্যবহৃত হয় যা একক ভেরিয়েবল হিসাবে স্কোর করা যায়, ফলে ডেটা হ্রাস হয়। সন্ধান varclus
ফাংশন (রাঃ প্যাকেজ Hmisc)
ক্লাস্টারওয়াস স্থিতিশীলতার মূল্যায়ন: ফাংশন clusterboot
{আর প্যাকেজ fpc}
ক্লাস্টারের বৈধতার জন্য দূরত্ব ভিত্তিক পরিসংখ্যান: ফাংশন cluster.stats
{আর প্যাকেজ fpc}
এমবিকিউ যেমন উল্লেখ করেছে, ক্লাস্টারের সেরা সংখ্যা নির্ধারণের জন্য সিলুয়েট প্রস্থগুলি ব্যবহার করুন। এই দেখুন । সিলুয়েটের প্রস্থ সম্পর্কে, ওপসিল ফাংশনটিও দেখুন।
ফাঁক পরিসংখ্যানের মাধ্যমে কোনও ডেটা সেটে ক্লাস্টারের সংখ্যা নির্ধারণ করুন
বৈচিত্র্য সূচক এবং দূরত্ব পরিমাপ গণনা করার জন্য dsvdis এবং vegdist দেখুন
ইএম ক্লাস্টারিং অ্যালগরিদম সিদ্ধান্ত নিতে পারে ক্রস বৈধকরণের দ্বারা কতগুলি ক্লাস্টার তৈরি করা উচিত, (আপনি যদি কতগুলি ক্লাস্টার উত্পন্ন করতে হবে তা অ্যাপ্রিওরি নির্দিষ্ট করতে না পারেন)। যদিও ইএম অ্যালগরিদম সর্বাধিক রূপান্তরিত হওয়ার গ্যারান্টিযুক্ত তবে এটি স্থানীয় সর্বাধিক এবং এটি সম্ভবত গ্লোবাল সর্বাধিকের মতো নাও হতে পারে। গ্লোবাল সর্বাধিক প্রাপ্তির আরও ভাল সুযোগের জন্য, প্যারামিটার মানগুলির জন্য বিভিন্ন প্রাথমিক অনুমান সহ পুরো পদ্ধতিটি কয়েকবার পুনরাবৃত্তি করা উচিত। সামগ্রিক লগ-সম্ভাবনা চিত্রটি প্রাপ্ত বিভিন্ন চূড়ান্ত কনফিগারেশনগুলির তুলনা করতে ব্যবহার করা যেতে পারে: কেবলমাত্র স্থানীয় ম্যাক্সিমার মধ্যে সবচেয়ে বড়টি বেছে নিন । ওপেন-সোর্স প্রকল্প WEKA তে আপনি ইএম ক্লাস্টারের একটি বাস্তবায়ন পেতে পারেন
এই একটি আকর্ষণীয় লিঙ্ক।
এছাড়াও অনুসন্ধান এখানে জন্যFinding the Right Number of Clusters in k-Means and EM Clustering: v-Fold Cross-Validation
পরিশেষে, আপনি ক্লাস্টারিং ফলাফল ব্যবহার অন্বেষণ পারে clusterfly