সর্বাধিক এবং বন্ধ ঘন ঘন - উত্তর অন্তর্ভুক্ত


10

My  dataset:
1:A,B,C,E
2:A,C,D,E
3:     B,C,E
4:A,C,D,E
5:    C,D,E
6:    A,D,E

আমি সর্বাধিক ঘন ঘন আইটেম সেট এবং বন্ধ ঘন ঘন আইটেম সেটগুলি সন্ধান করতে চাই

  • ঘন ঘন আইটেমটি সেট হয় সর্বোচ্চ যদি এটা কোন ঘন অধিসেটের নেই।XF
  • একই ফ্রিকোয়েন্সি সহ সুপারসেট না থাকলে ঘন ঘন আইটেম সেট এক্স ∈ এফ বন্ধ হয়

সুতরাং আমি প্রতিটি আইটেম সেট উপস্থিতি গণনা।

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

{A,B} = 1; {A,C} = 3; {A,D} = 3; {A,E} = 4; {B,C} = 2; 
{B,D} = 0; {B,E} = 2; {C,D} = 3; {C,E} = 5; {D,E} = 3

{A,B,C} = 1; {A,B,D} = 0; {A,B,E} = 1; {A,C,D} = 2; {A,C,E} = 3; 
{A,D,E} = 3; {B,C,D} = 0; {B,C,E} = 2; {C,D,E} = 3

{A,B,C,D} = 0; {A,B,C,E} = 1; {B,C,D,E} = 0

ন্যূনতম সমর্থনটি // এ সেট করা খুব গুরুত্বপূর্ণ। এটি মনে করিয়ে দেওয়ার জন্য স্টিফেনকে ধন্যবাদ।50

কি সর্বোচ্চ = ?{A,B,C,E}

নেই বন্ধ = ?{A,B,C,D} and {B,C,D,E}

উত্তর:


5

আমি এই উত্সটিতে কিছুটা বর্ধিত সংজ্ঞা পেয়েছি (যার মধ্যে একটি ভাল ব্যাখ্যা রয়েছে)। এখানে আরও নির্ভরযোগ্য (প্রকাশিত) উত্স: CHARM: মোহাম্মদ জে জাকি এবং চিং-জুই হিশিয়াও দ্বারা বদ্ধ আইটেমसेट খনির জন্য একটি কার্যকর অ্যালগরিদম

এই উত্স অনুসারে:

  • যদি আইটেমসেটের মতো তার তাত্ক্ষণিক সুপারশেটের মতো কোনও সমর্থন না থাকে তবে কোনও আইটেমসেট বন্ধ রয়েছে
  • যদি কোনও আইটেমসেট সর্বাধিক ঘন ঘটে তবে এর তাত্ক্ষণিক সুপারশেটগুলির কোনওটিই ঘন ঘন না হয়


কিছু মন্তব্য:

  • এটি একটি মিনি_সপপোর্ট (সমর্থন = সমস্ত আইটেমসেটের সংখ্যা দ্বারা বিভক্ত আগ্রহের উপসেটযুক্ত আইটেম সেটগুলির সংখ্যা) সেট করা প্রয়োজন যা কোন আইটেমসটি ঘন ঘন তা নির্ধারণ করে । যদি কোনও আইটেমসেট ঘন ঘন হয় তবে এর সমর্থন> = মিনিট_ সমর্থন।
  • অ্যালগরিদমের ক্ষেত্রে, যখন কেউ সর্বাধিক ঘন ঘন এবং বদ্ধ আইটেমসেটগুলি সন্ধান করার চেষ্টা করে তখন মিনি_সুপোর্ট সহ আইটেমসেটগুলিই বিবেচনা করা হয়।
  • বন্ধের সংজ্ঞাটির গুরুত্বপূর্ণ দিকটি হ'ল, যদি কোনও তাত্ক্ষণিক সুপারসেট আরও বেশি সমর্থন সহ উপস্থিত থাকে তবে তা বিবেচনা করে না, কেবল একই সমর্থনযুক্ত তাত্ক্ষণিক সুপারসেটগুলি গুরুত্বপূর্ণ।
  • সর্বাধিক ঘন ঘন => বন্ধ => ঘন ঘন, তবে বিপরীত নয়।

ওপি উদাহরণের জন্য আবেদন

বিঃদ্রঃ:

  • সমর্থন গণনা পরীক্ষা করে নি
  • মিনি_সাম্পোর্ট = 0.5 বলুন। Min_support_count> = 3 হলে এটি পূরণ হয়
{এ} = 4; {A, E to কারণে বন্ধ হয়নি
{বি} = 2; not ঘন ঘন => উপেক্ষা করুন
{সি} = 5; {C, E to কারণে বন্ধ হয়নি
{ডি} = 4; {ডি, ই to এর কারণে বন্ধ নয়, তবে {এ, ডি eg এর কারণে সর্বাধিক নয়
{ই} = 6; বন্ধ, তবে উদাহরণস্বরূপ সর্বাধিক নয় {D, E

{এ, বি} = 1; not ঘন ঘন => উপেক্ষা করুন
{এ, সি} = 3; {এ, সি, ই to এর কারণে বন্ধ হয়নি
{এ, ডি} = 3; {এ, ডি, ই due এর কারণে বন্ধ হয়নি
{এ, ই} = 4; বন্ধ, তবে {এ, ডি, ই to এর কারণে সর্বাধিক নয়
{বি, সি} = 2; not ঘন ঘন => উপেক্ষা করুন
{বি, ডি} = 0; not ঘন ঘন => উপেক্ষা করুন
{বি, ই} = 2; not ঘন ঘন => উপেক্ষা করুন
{সে, ডি} = 3; {C, D, E due কারণে বন্ধ হয়নি
{সে, ই} = 5; বন্ধ, তবে {সে, ডি, ই to এর কারণে সর্বাধিক নয়
{ডি, ই} = 4; বন্ধ, তবে {এ, ডি, ই to এর কারণে সর্বাধিক নয়

{এ, বি, সি 1 = 1; not ঘন ঘন => উপেক্ষা করুন
{এ, বি, ডি 0 = 0; not ঘন ঘন => উপেক্ষা করুন
{এ, বি, ই} = 1; not ঘন ঘন => উপেক্ষা করুন
{এ, সি, ডি} = 2; not ঘন ঘন => উপেক্ষা করুন
{এ, সি, ই} = 3; সর্বাধিক ঘন ঘন
{এ, ডি, ই} = 3; সর্বাধিক ঘন ঘন
{বি, সি, ডি 0 = 0; not ঘন ঘন => উপেক্ষা করুন
{বি, সি, ই} = 2; not ঘন ঘন => উপেক্ষা করুন
{সে, ডি, ই} = 3; সর্বাধিক ঘন ঘন

{এ, বি, সি, ডি 0 = 0; not ঘন ঘন => উপেক্ষা করুন
{এ, বি, সি, ই} = 1; not ঘন ঘন => উপেক্ষা করুন
{বি, সি, ডি, ই 0 = 0; not ঘন ঘন => উপেক্ষা করুন

উত্স লিঙ্কটি নষ্ট হয়ে গেছে, কেবল আপনাকে জানাতে। এবং হ্যাঁ মিনি_সপোর্টটি খুব গুরুত্বপূর্ণ, আমি .50 ব্যবহার করছি
মাইক জন

1
দুঃখিত, স্থির।
স্টেফেন

1
min_support = 0.5 <=> min_support_count = 3 পরিবর্তিত হয়েছে এবং সেই অনুসারে উদাহরণ প্রয়োগ করা হয়েছে।
স্টেফেন

এপ্রিওরি ব্যবহার করুন, এবং আপনি আইটেমসেটগুলি গণনা এবং নির্মাণ করা অনেকগুলি সঞ্চয় করতে পারেন ...
কিউইট করেছেন - অ্যানি-মউসে

@ অ্যানি-মৌসিকে আমি এপ্রিওরি জানি ... বন্ধ ও সর্বাধিক ঘন ঘন আইটেমসেটগুলি যতটা সম্ভব বিশদ হিসাবে ব্যাখ্যা করার জন্য আমি ম্যানুয়ালি আইটেমসেটগুলি পদক্ষেপ নিয়েছিলাম, কারণ এটি ওপি (আইএমএইচও) এর বিভ্রান্তির কারণ ছিল।
স্টেফেন

1

আপনি এপ্রিওরি আলগোরিদিমটি পড়তে চাইতে পারেন। এটি চালাক ছাঁটাইয়ের মাধ্যমে অযৌক্তিক আইটেমসেটগুলি এড়িয়ে চলে।

{A} = 4 ;  {B} = 2  ; {C} = 5  ; {D} = 4  ; {E} = 6

বি ঘন ঘন হয় না, সরান।

দ্বি-আইটেমসেটগুলি তৈরি করুন এবং গণনা করুন ( Bইতিমধ্যে কোনও জাদু নেই, এটি ইতিমধ্যে বাইরে রয়েছে)

{A,C} = 3; {A,D} = 3; {A,E} = 4; 
{C,D} = 3; {C,E} = 5; {D,E} = 3

এগুলি সবই ঘন ঘন (লক্ষ্য করুন যে যা কিছু ছিল Bতা ঘন ঘন হতে পারে না!)

এখন উপসর্গ নিয়ম ব্যবহার করুন। কেবল একই এন -1 আইটেমের সাথে শুরু আইটেমসেটগুলি একত্রিত করুন। সমস্ত সরান, যেখানে কোনও উপসেট ঘন ঘন হয় না। বাকি আইটেমসেটগুলি গণনা করুন।

{A,C,D} = 2; {A,C,E} = 3; {A,D,E} = 3; 
{C,D,E} = 3

নোট যে {A,C,D}ঘন ঘন নয়। কোনও ভাগ করা উপসর্গ নেই, বৃহত্তর ঘন ঘন আইটেমসেট থাকতে পারে না !

খেয়াল করুন আমি কত কম কাজ করেছি!

সর্বাধিক / বন্ধ আইটেমসেটের জন্য সাবটেট / সুপারসেট পরীক্ষা করুন।

নোট করুন যেমন {E}=6, এবং {A,E}=4{E}এটি একটি উপসেট, তবে এর উচ্চতর সমর্থন রয়েছে, এটি বন্ধ থাকলেও সর্বাধিক নয়। {A}, তন্ন তন্ন হিসাবে এটি বেশী সমর্থন নেই {A,E}, অর্থাত্ এটা অপ্রয়োজনীয়

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.