যতদূর আমি ঘন ঘন প্যাটার্ন মাইনিং (এফপিএম) সমস্যা সমাধানের জন্য অ্যালগরিদমগুলির বিকাশ জানি, উন্নতির রাস্তায় কয়েকটি প্রধান চেকপয়েন্ট রয়েছে। প্রথমত, এগ্রিওরি অ্যালগরিদম 1993 সালে অগ্রওয়াল এট আল দ্বারা প্রস্তাবিত হয়েছিল । সমস্যাটির আনুষ্ঠানিককরণের পাশাপাশি। অ্যালগরিদম ডেটা বজায় রাখার জন্য একটি ল্যাটিস ব্যবহার করে সেটগুলি (পাওয়ারসেট) থেকে কিছু সেট স্ট্রিপ-অফ করতে সক্ষম হয়েছিল 2^n - 1
। পদ্ধতির একটি অপূর্ণতা প্রসারিত প্রতিটি সেটের ফ্রিকোয়েন্সি গণনা করার জন্য ডাটাবেসটি পুনরায় পড়ার প্রয়োজন ছিল।
পরে, 1997 সালে, জাকি এট আল। এলগরিদম একলাট প্রস্তাব করেছিলেন , যা জালির ভিতরে প্রতিটি সেটের ফলস্বরূপ ফ্রিকোয়েন্সি সন্নিবেশ করিয়েছিল। এটি ল্যাটিসের প্রতিটি নোডে, লেনদেন-আইডির সেট যুক্ত করে যা করা হয়েছিল যার মূল থেকে নোডের আইটেম ছিল। প্রধান অবদান হ'ল প্রতিটি সেটের ফ্রিকোয়েন্সি জানতে পুরো ডেটাसेटকে পুনরায় পড়তে হবে না, তবে এই জাতীয় ডেটা কাঠামোটি তৈরি করতে প্রয়োজনীয় মেমরিটি নিজেই ডেটাসেটের আকারের চেয়ে বেশি হতে পারে।
2000 সালে, হান এট আল। এফপিগ্রোথ নামে একটি উপসর্গ-গাছের ডেটা কাঠামো সহ এফপিগ্রোথ নামে একটি অ্যালগরিদম প্রস্তাবিত । অ্যালগরিদম উল্লেখযোগ্য ডেটা সংক্ষেপণ সরবরাহ করতে সক্ষম হয়েছিল, এবং কেবলমাত্র ঘন ঘন আইটেমসেট প্রাপ্ত হবে (প্রার্থী আইটেমসেট জেনারেশন ব্যতীত) প্রদান করে। এটি প্রতিটি লেনদেনের আইটেমগুলি হ্রাসমান ক্রমে বাছাইয়ের মাধ্যমে করা হয়েছিল, যাতে ঘন ঘন আইটেমগুলি গাছের ডেটা কাঠামোর মধ্যে সর্বনিম্ন পুনরাবৃত্তিগুলি থাকে। যেহেতু ফ্রিকোয়েন্সি শুধুমাত্র যখন গভীর গাছ ঢোঁড়ন নেমে অ্যালগরিদম করতে সক্ষম হয় স্ট্রিপ বন্ধ অ ঘন itemsets।
সম্পাদনা করুন :
আমি যতদূর জানি, এটি একটি অত্যাধুনিক অ্যালগরিদম হিসাবে বিবেচিত হতে পারে তবে আমি প্রস্তাবিত অন্যান্য সমাধানগুলি সম্পর্কে জানতে চাই। এফপিএম এর জন্য অন্য কোন অ্যালগরিদমকে "স্টেট অফ দ্য আর্ট" হিসাবে বিবেচনা করা হয়? কি স্বজ্ঞা / প্রধান-অবদান যেমন আলগোরিদিম?
এফপিগ্রোথ অ্যালগরিদম এখনও ঘন ঘন নিদর্শন খনির ক্ষেত্রে "শিল্পের রাজ্য" হিসাবে বিবেচিত হয়? যদি তা না হয় তবে কোন অ্যালগরিদম (গুলি) বড় ডেটাসেট থেকে আরও দক্ষতার সাথে ঘন ঘন আইটেমসেটগুলি বের করতে পারে?