শ্রেণিবিন্যাস বিধি উত্পন্ন করার জন্য অ্যালগরিদম


11

সুতরাং আমাদের কাছে এমন একটি মেশিন লার্নিং অ্যাপ্লিকেশনের সম্ভাবনা রয়েছে যা শ্রেণিবদ্ধদের দ্বারা সমাধান করা traditionalতিহ্যগত সমস্যা ডোমেনের সাথে মোটামুটি সুন্দরভাবে ফিট করে, অর্থাত্ আমাদের কাছে একটি আইটেম এবং একটি "বালতি" বর্ণিত বৈশিষ্ট্যগুলির একটি সেট রয়েছে যা তারা শেষ করে However নায়েভ বেয়েস বা অনুরূপ শ্রেণিবদ্ধের মতো সম্ভাব্যতার জন্য আমরা আমাদের আউটপুটটি প্রায় মানুষের পাঠযোগ্য নিয়মের একটি সেট হতে চাই যা শেষ ব্যবহারকারী দ্বারা পর্যালোচনা ও সংশোধন করতে পারে can

অ্যাসোসিয়েশন রুল লার্নিংটি অ্যালগরিদমের পরিবারের মতো দেখায় যা এই ধরণের সমস্যা সমাধান করে তবে এই অ্যালগরিদমগুলি বৈশিষ্ট্যগুলির সাধারণ সংমিশ্রণগুলি চিহ্নিত করার দিকে মনোনিবেশ করে বলে মনে হয় এবং এই বৈশিষ্ট্যগুলি নির্দেশ করতে পারে এমন একটি চূড়ান্ত বালতির ধারণা অন্তর্ভুক্ত করে না। উদাহরণস্বরূপ, আমাদের ডেটা সেটটি দেখতে এমন কিছু দেখাচ্ছে:

Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big,   steel } => { truck }
Item C { 2-door, small, steel } => { coupe }

আমি কেবল এই নিয়মগুলি চাই যা "এটি যদি বড় এবং দ্বি-দরজা হয় তবে এটি একটি ট্রাক," যে নিয়মগুলি বলে না "এটি যদি 4-দরজাটিও ছোট হয় তবে"।

আমি যে কাজটি করতে পারি তা হ'ল কেবল অ্যাসোসিয়েশন রুল লার্নিং অ্যালগরিদমগুলি ব্যবহার করা এবং যে বিধিগুলি শেষ বালতি জড়িত না সেগুলি উপেক্ষা করে, তবে এটি কিছুটা হ্যাকিং বলে মনে হয়। আমি কি এখানে অ্যালগরিদমের কিছু পরিবার মিস করেছি? বা সম্ভবত আমি সমস্যাটি শুরু করে ভুলভাবে পৌঁছে যাচ্ছি?

উত্তর:


9

কুইনলানের তৈরি সি 45 পূর্বাভাসের জন্য বিধি তৈরি করতে সক্ষম। এই উইকিপিডিয়া পৃষ্ঠাটি দেখুন। আমি জানি যে এ ওয়েকা তার নাম J48 হয়। আর বা পাইথনের বাস্তবায়নগুলি আমার কোনও ধারণা নেই। যাইহোক, এই জাতীয় সিদ্ধান্ত গাছ থেকে আপনার ভবিষ্যদ্বাণী করার নিয়মগুলি নির্ধারণ করতে সক্ষম হওয়া উচিত।

পরে সম্পাদনা করুন

এছাড়াও আপনি শ্রেণিবিন্যাসের জন্য সরাসরি লঙ্ঘনের নিয়মগুলির জন্য অ্যালগরিদমে আগ্রহী হতে পারেন। রিপ্পার হ'ল এটি যা ওয়েকে আবার এটির আলাদা নাম জেআরপি পেয়েছিল। রিপারের জন্য মূল কাগজটি দেখুন: দ্রুত কার্যকর নিয়ম আনয়ন, ডাব্লুডাব্লু কোহেন 1995


আমি আগের প্রকল্পে সি 45 / জে 48 নিয়ে পরীক্ষা-নিরীক্ষা করেছি। আমি বুঝতে পারি নি যে এগুলি থেকে পুনরুদ্ধার করতে পারে এমন কিছু বিধি রয়েছে। আমি রিপারও পরীক্ষা করে দেখব। ধন্যবাদ!
সুপার_স্যাবাস ২

এছাড়াও
সি 5050

এই প্রশ্ন / উত্তরটির জন্য একটি আপডেট সরবরাহ করতে চেয়েছিল: আমরা কিছু সাফল্যের সাথে জেআরপি ব্যবহার করেছি, তবে আমাদের নতুন শীর্ষস্থানীয় প্রতিযোগী ফুরিয়া ( cs.uni-paderborn.de/fileadmin/Informatik/eim-i-is/PDFs/… )। এটি মানব পর্যালোচনা / ব্যবহারের জন্য সর্বোত্তম নিয়ম তৈরি করছে কারণ এটি একটি বিস্তৃত নিয়ম উত্পন্ন করার চেষ্টা করে। জেআরপি দুর্দান্ত নিয়ম করে, তবে অন্য কোনও বিধি প্রয়োগ না হলে শ্রেণিবিন্যাসের ক্ষেত্রে এটির "ডিফল্ট" বিধি থাকে। ডিফল্ট বালতিগুলি আমাদের প্রকল্পের ব্যবসায়িক প্রসঙ্গে ভাল কাজ করে না, আমাদের সম্পূর্ণ বিধিগুলির প্রয়োজন।
super_seabass

7

এটি আসলে তার থেকেও সহজ, আপনি যা বর্ণনা করেছেন তা থেকে --- আপনি কেবলমাত্র একটি মৌলিক শ্রেণিবিন্যাস গাছের অ্যালগোরিদম সন্ধান করছেন (সুতরাং C4.5 এর মতো সামান্য আরও জটিল রূপগুলির প্রয়োজন নেই যা পূর্বাভাসের নির্ভুলতার জন্য অনুকূলিত হয়েছে) প্রচলিত পাঠ্যটি হ'ল:

http://www.amazon.com/Classification-Regression-Wadsworth-Statistics-Probability/dp/0412048418

এটি সহজেই আর তে প্রয়োগ করা হয়:

http://cran.r-project.org/web/packages/tree/tree.pdf

এবং পাইথন:

http://scikit-learn.org/stable/modules/tree.html


আমি এখানে সম্মত নই যে গাছগুলি এখানে সাহায্যকারী। এটি ফিল্টারিং নিয়মের একটি বিষয়, এবং এটি আর
অ্যাডিসেন্টস


1

আপনার আরতে কমান্ডের প্যাকেজটি চেষ্টা করা উচিত It এটি আপনাকে কেবল অ্যাসোসিয়েশন রুলগুলি তৈরি করতে দেয় না পাশাপাশি প্রতিটি নিয়মের দৈর্ঘ্য, প্রতিটি নিয়মের গুরুত্ব এবং আপনি সেগুলি ফিল্টারও করতে পারবেন যা আপনি যা খুঁজছেন তা চেষ্টা করুন (চেষ্টা করুন rh () এই প্যাকেজের কমান্ড)।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.