ক্লাস্টারিং গ্রাহকের ডেটা ইলাস্টিক অনুসন্ধানে সঞ্চিত


10

আমার কাছে একগুচ্ছ গ্রাহক প্রোফাইল রয়েছে ক্লাস্টারের। এই প্রোফাইলগুলি এখন আমাদের ইমেল সাবস্ক্রিপশনের জন্য লক্ষ্য গোষ্ঠী তৈরির জন্য ব্যবহৃত হয়।

স্থিতিস্থাপক দিকযুক্ত অনুসন্ধানের ক্ষমতাগুলি ব্যবহার করে লক্ষ্য গোষ্ঠীগুলি এখন ম্যানুয়ালি গঠিত হয় (যেমন 23 বছরের সকল পুরুষ গ্রাহককে একটি গাড়ি এবং 3 বাচ্চা সহ পান) get

আমি কীভাবে আকর্ষণীয় গোষ্ঠীগুলির জন্য স্বয়ংক্রিয়ভাবে অনুসন্ধান করতে পারি - ডেটা সায়েন্স, মেশিন লার্নিং, ক্লাস্টারিং বা অন্য কিছু ব্যবহার করে?

প্রোগ্রামিং ভাষা এই কাজের জন্য একটি ভাল হাতিয়ার বলে মনে হচ্ছে, তবে আমি এই জাতীয় গোষ্ঠী অনুসন্ধানের একটি পদ্ধতি তৈরি করতে পারি না। একটি সমাধান হ'ল একরকম গ্রাহকদের বৃহত্তম ক্লাস্টার সন্ধান করা এবং তাদের লক্ষ্য দল হিসাবে ব্যবহার করা, তাই প্রশ্নটি হল:

আমি কীভাবে স্বয়ংক্রিয়ভাবে অনুরূপ গ্রাহকদের সবচেয়ে বড় ক্লাস্টারগুলি বেছে নিতে পারি (এই মুহুর্তে আমি জানি না এমন পরামিতিগুলির সমান)?

উদাহরণস্বরূপ: আমার প্রোগ্রামটি ইলাস্টিক সন্ধানের সাথে সংযুক্ত হবে, সিএসভিতে গ্রাহকের ডেটা অফলোড করবে এবং আর ল্যাঙ্গুয়েজ স্ক্রিপ্ট ব্যবহার করে দেখতে পাবে যে গ্রাহকদের বড় অংশ কোনও শিশু নেই এবং গ্রাহকদের আরও একটি বড় অংশের গাড়ি আছে এবং তাদের চোখের রঙ বাদামী।


1
"আকর্ষণীয় গোষ্ঠী" এর অধীনে আপনার অর্থ কী? আপনার কি কিছু পূর্বনির্ধারিত গুরুত্বপূর্ণ বৈশিষ্ট্য তালিকা রয়েছে?
ইয়াতুল

আকর্ষণীয় গোষ্ঠীগুলি কোনও আকারের চেয়ে বড় আকারের যে কোনও গ্রুপ যা অন্য সম্ভাব্য ক্লাস্টারের তুলনায় অনেক বড়।
কনস্ট্যান্টিন ভি। সালিখভ

1
আপনি কীভাবে আপনার ডেটার প্রস্তুতিমূলক পদক্ষেপগুলি সম্পাদন করবেন তা পরিষ্কার নয়। তবে আপনার en.wikedia.org/wiki/Anomaly_detection এ বর্ণিত অ্যালগরিদমের দিকে নজর দেওয়া উচিত । আমি যদি আপনি ছিলাম, আমি প্রথমে এসভিএম পদ্ধতিটি যাচাই করেছি
ইয়াতুল

আমি এসভিএম সম্পর্কে পড়েছি এবং আমি মনে করি এটি বিদ্যমান ডেটাসেটের উপর ম্যানুয়াল প্রশিক্ষণের পরে নতুন তৈরি হওয়া তথ্যের শ্রেণিবদ্ধকরণ সম্পর্কে - এটি বিদ্যমান ডেটা ক্লাস্টারিং এবং অস্বাভাবিক বড় ক্লাস্টারগুলি খুঁজে পাওয়ার বিষয়ে নয়। আমি কি সঠিক? আমি যদি হয় তবে এই পদ্ধতিটি আমি যা চাই তা তা নয়।
কনস্ট্যান্টিন ভি। সালিখভ

উত্তর:


6

এর জন্য যে অ্যালগরিদম ব্যবহার করা যায় তা হ'ল কে-মানে ক্লাস্টারিং অ্যালগরিদম

মূলত:

  1. আপনার সেট থেকে এলোমেলোভাবে কে ডেটাপয়েন্টগুলি চয়ন করুন, এম_1, ..., এম_ কে।
  2. "অভিমুখে না হওয়া পর্যন্ত":

    1. কে ক্লাস্টারগুলিতে আপনার ডেটা পয়েন্টগুলি বরাদ্দ করুন, যেখানে ক্লাস্টার i হ'ল পয়েন্টগুলির একটি সেট যার জন্য m_i আপনার বর্তমান মাধ্যমের নিকটতম
    2. I টি ক্লাস্টারে নির্ধারিত সমস্ত পয়েন্টের মধ্য দিয়ে প্রতিটি মি_আই প্রতিস্থাপন করুন।

এই অ্যালগরিদমটি কয়েকবার পুনরাবৃত্তি করা ভাল অনুশীলন, তারপরে ফলাফলটি চয়ন করুন যা প্রতিটি ক্লাস্টার i এবং কেন্দ্রের মি_আইয়ের পয়েন্টগুলির মধ্যে দূরত্বকে হ্রাস করে।

অবশ্যই, আপনাকে এখানে জানতে শুরু করতে হবে; আপনি এই পরামিতিটি বেছে নিতে ক্রস-বৈধতা ব্যবহার করতে পারেন।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.