জমায়েত পদ্ধতিগুলি কীভাবে প্রয়োগ করতে হয় তা শেখার সংস্থানসমূহ


13

তারা কীভাবে কাজ করবে তাত্ত্বিকভাবে (বাছাই করা) আমি বুঝতে পারি, তবে কীভাবে আসল পদ্ধতিতে (যেমন ভোটদান, ওজনযুক্ত মিশ্রণ ইত্যাদি) ব্যবহার করা যায় তা নিশ্চিত নই।

  • জমায়েত পদ্ধতি প্রয়োগের জন্য ভাল সংস্থানগুলি কী কী?
  • পাইথনে বাস্তবায়ন সম্পর্কিত কোনও বিশেষ সংস্থান আছে কি?

সম্পাদনা করুন:

মন্তব্যে আলোচনার উপর ভিত্তি করে কিছু সাফ করার জন্য, আমি র্যান্ডমফরেস্ট ইত্যাদির মতো গোপনে থাকা অ্যালগরিদমগুলি খুঁজছি না তার পরিবর্তে, আমি ভাবছি যে কীভাবে আপনি বিভিন্ন অ্যালগোরিদম থেকে বিভিন্ন শ্রেণিবিন্যাসকে একত্রিত করতে পারেন।

উদাহরণস্বরূপ, বলুন যে কোনও নির্দিষ্ট পর্যবেক্ষণের শ্রেণীর পূর্বাভাস দেওয়ার জন্য কেউ লজিস্টিক রিগ্রেশন, এসভিএম এবং কিছু অন্যান্য পদ্ধতি ব্যবহার করে। এই পূর্বাভাসের উপর ভিত্তি করে শ্রেণীর সেরা প্রাক্কলনটি ক্যাপচার করার সর্বোত্তম উপায় কী?

উত্তর:


12

শুরু করার জন্য একটি ভাল জায়গা হ'ল নকল শেখার একটি ওভারভিউ পাওয়া। বিশেষ করে যদি আপনি তাকান করতে চাইবেন boosting এবং ব্যাগিং । আর একটি পদ্ধতি ছিল যা নেটফ্লিক্স পুরষ্কারে "দ্য এনসেম্বল" দল ব্যবহার করেছিল, তাকে "ব্লেন্ডিং" বা ফিচার স্ট্যাকিং বলা হয় ।

তারপরে, এমন কিছু গ্রন্থাগার সন্ধান করুন যা সেগুলি বাস্তবায়ন করে এবং সেখান থেকে কাজ করে। একটি দ্রুত গুগল বিজ্ঞান এবং কমলা হয়ে উঠেছে , উভয়েরই ব্যাগিং এবং বুস্টিং হওয়া উচিত (এবং তারা উভয় পাইথন)'re

যদি কেবল সাজসজ্জার পদ্ধতি ব্যবহার না করে আপনি কিছুটা তত্ত্ব শিখতে চান তবে আমি মনে করি এই পত্রিকাটি একটি ভাল জাম্পিং অফ পয়েন্ট হবে (আপনার আগ্রহী অংশগুলির জন্য রেফারেন্সগুলি অনুসরণ করুন)।

চিয়ার্স।


(+1) ওহ, দুর্দান্ত উল্লেখ এখানে: ও!
স্টিফেন

ধন্যবাদ। আমি যে কয়েকটি বিষয়ে কিছু জানি তার মধ্যে কয়েকটি সম্পর্কে কিছু অবদান রাখার চেষ্টা করছি।
স্টম্পি জো পিট

4

'ডেটা মাইনিংয়ে জড়ো করার পদ্ধতিগুলি: পূর্বাভাসের সংমিশ্রণের মাধ্যমে নির্ভুলতা উন্নত করা', সেনি এবং প্রবীণ - ব্যবহারিক জমায়েত তত্ত্ব এবং বাস্তবায়নের বিষয়ে দুর্দান্ত রেফারেন্স, তবে সহ কোডটি আর ভিত্তিক।

'মেশিন লার্নিং: একটি অ্যালগরিদমিক দৃষ্টিভঙ্গি,' এস। মার্সল্যান্ড - চমৎকার পাইথন ভিত্তিক ব্যবহারিক পাঠ্য, তবে প্রথম উল্লেখ হিসাবে খাঁটি পোষাক ধারণার প্রতি উত্সর্গীকৃত নয়।


2

স্টম্পি জো পিটের প্রতিক্রিয়া নিখুঁত ছিল, তবে যেহেতু আপনি পাইথন বাস্তবায়নের কথা উল্লেখ করেছেন, তাই আমি ইউনিভার্সিডে ফেডারেল ডি পের্নাম্বুকো থেকে ব্রিউ প্রকল্পটি উল্লেখ করতে চেয়েছিলাম ।

https://github.com/viisar/brew

from brew.base import Ensemble
from brew.base import EnsembleClassifier
from brew.combination import import Combiner

# create your Ensemble
clfs = your_list_of_classifiers # [clf1, clf2]
ens = Ensemble(classifiers = clfs)

# create your Combiner
# the rules can be 'majority_vote', 'max', 'min', 'mean' or 'median'
comb = Combiner(rule='majority_vote')

# now create your ensemble classifier
ensemble_clf = EnsembleClassifier(ensemble=ens, combiner=comb)
ensemble_clf.predict(X)

এই মুহুর্তে, তাদের প্রজন্মের মিশ্রণ, ছাঁটাই এবং গতিশীল নির্বাচন রয়েছে।

সীমাবদ্ধতা: কেবল শ্রেণিবিন্যাস; বর্তমানের সর্বজনীন সংস্করণে কোনও স্ট্যাকিং নেই; খুব বেশি ডকুমেন্টেশন নয়।


0

সালফোর্ড সিস্টেমে র্যান্ডম ফরেস্ট নামে একটি সফ্টওয়্যার প্যাকেজ রয়েছে যা এটি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন ট্রি গাছগুলির জন্য প্রয়োগ করে bles আমার কাছে অফার করার জন্য কোনও বিনামূল্যে আর প্যাকেজ নেই। আমার ধারণা তাদের একটি ব্যবহারকারী ম্যানুয়াল রয়েছে যা তাদের বাস্তবায়ন সম্পর্কে ব্যাখ্যা করবে। সাদৃশ্য দ্বারা আপনি সম্ভবত এটি অন্যান্য নকশা পদ্ধতিতে কীভাবে করবেন তা বুঝতে পারেন figure


2
গাছের ঝাঁকুনির জন্য অনেক দুর্দান্ত আর প্যাকেজ রয়েছে: যেমন র্যান্ডমফরেস্ট (ক্লাসিক অ্যালগরিদম), পার্টি :: ফরেস্ট (শর্তসাপেক্ষ গাছের ব্যবহার করে এলোমেলো বন), জিবিএম (গাছের গ্রেডিয়েন্ট বুস্টিং) কয়েকটি নাম রাখার জন্য। আমি ওপিটি ক্লাসিফায়ার / রিগ্রেশন অগ্নিস্টিক এনসেম্বেবলগুলি বাস্তবায়নের অনুপস্থিত হিসাবে পড়েছি। সহজ পদ্ধতিটি অবশ্যই গড় পূর্বাভাসের।
বি_মিনার

@ বি_মিনার এটা জানতে পেরে ভালো লাগলো যে আর-তে বাস্তবায়নগুলি উপলব্ধ Maybe আমি ওপি পড়ি এমন উত্সগুলি জানতে চাওয়ার জন্য যা কীভাবে সংগ্রহের পদ্ধতিগুলি প্রয়োগ করতে পারে তা বর্ণনা করে। সালফোর্ড প্যাকেজটি এমন একটি ছিল যা সম্পর্কে আমি সচেতন ছিলাম যাতে কিছু ডকুমেন্টেশন থাকতে পারে।
মাইকেল আর চেরনিক

ফ্রেউন্ড এবং স্ক্যাপায়ারের উপর ভিত্তি করে কাগজ বুস্টিংয়ের কাজগুলিতে সাধারণ হিসাবে আমি জানি যত ভাল ফলাফল গাছের শ্রেণিবদ্ধ ব্যবহার করে এসেছে।
মাইকেল আর চেরনিক

আমি সম্ভাব্যতার সাধারণ গড়ের মাধ্যমে ব্যক্তিগতভাবে সত্যই ভাল ফলাফল পাই - তবে আমার ডোমেন ক্লাসের লেবেল বাছাইয়ের চেয়ে সম্ভাবনার পক্ষে বেশি আগ্রহী।
বি_মিনার

@MichaelChernick আপনি কি সত্যিই তীব্র ভবিষ্যদ্বাণীপূর্ণ কাজ (মত ... একটি Kaggle প্রতিযোগী) করছেন, তাহলে আপনি বাছাই যাচ্ছেন না পারেন boosting বা র্যান্ডম বন। আপনি যতটা সম্ভব মডেলগুলিকে একত্রিত করতে চান যা আপনাকে সহায়তা করবে (যা সাধারণত একের চেয়ে অনেক বেশি)। সুতরাং, সেই প্রসঙ্গে, অন্যান্য জড়িত পদ্ধতিগুলি গুরুত্বপূর্ণ হতে চলেছে, এমনকি এলোমেলো বনগুলি অন্য যে কোনও কিছুর চেয়ে ভয়ঙ্কর।
স্টম্পি জো পিট

0

আমি এই টিউটোরিয়ালটি পেয়েছি যা অত্যন্ত সহায়ক ছিল। এটি সমস্ত টুকরোটির উত্তর দেয় না তবে আমি মনে করি এটি আলোচনার একটি দুর্দান্ত সূচনা: http://vikparuchuri.com/blog/intro-to-ensemble-firening-in-r/


0

সায়কিট - লার এম্বেঞ্জিং গাইড মেটা-ক্লাসিফায়ার এবং রেজিস্ট্রারগুলিকে ব্যাগিং এবং উত্সাহ প্রদান করে । এছাড়াও, এমএলএক্সএন্ড লাইব্রেরি মেটা-ক্লাসিফায়ার এবং রেজিস্ট্রারগুলির স্ট্যাকিংয়ের প্রয়োগ সরবরাহ করে ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.