কখন এলোমেলো বন এড়ানোর জন্য?


25

এলোমেলো অরণ্য বিভিন্ন কার্যক্রমে সুষ্ঠুভাবে সম্পাদন করার জন্য সুপরিচিত এবং লার্নিং পদ্ধতির চামড়াধারী হিসাবে পরিচিত । এমন কোন ধরণের সমস্যা বা নির্দিষ্ট পরিস্থিতি রয়েছে যেখানে একটি এলোমেলো বন ব্যবহার করা এড়ানো উচিত?


8
হাই। "পিএলএস হ'ল চামড়াবিদ ...", "বুটস্ট্র্যাপ হ'ল চামড়াবিদ ...", "এলোমেলো বন হ'ল চামড়াবিদ ..." <- আমি আপনাকে এ জাতীয় দাবি সম্পর্কে সন্দেহজনক হওয়ার পরামর্শ দিচ্ছি। এটি কেবল একটি মন্তব্য ছিল :)
স্টাফেন লরেন্ট

উত্তর:


24

উদ্ধৃতিটির সুনির্দিষ্ট ভাষা সম্পর্কে চিন্তাভাবনা করে, একজন চামড়াধারী একাধিক সরঞ্জাম: এটির মধ্যে প্রচুর ছোট্ট গিজমোসযুক্ত একটি হার্ডওয়্যার এক টুকরা। এটি এক জোড়া প্লাস, এবং একটি ছুরি এবং একটি স্ক্রু ড্রাইভার এবং আরও অনেক কিছু! এই প্রতিটি সরঞ্জামকে স্বতন্ত্রভাবে বহন করার পরিবর্তে, চামড়াবিদ একটি একক আইটেম যা আপনি আপনার ট্রাউজারগুলিতে ক্লিপ করতে পারেন যাতে এটি সর্বদা হাতে থাকে। এটি সুবিধাজনক , তবে বাণিজ্য বন্ধ হ'ল উপাদান উপাদানগুলির প্রতিটি তার কাজের ক্ষেত্রে সেরা নয় । ক্যান ওপেনার ব্যবহার করা শক্ত, স্ক্রু ড্রাইভারের বিটগুলি সাধারণত ভুল আকারের হয় এবং ছুরি হুইটলিংয়ের চেয়ে সামান্য কিছু অর্জন করতে পারে। যদি এই কোনও কাজ করা সমালোচনা করে থাকে তবে আপনাকে বিশেষায়িত সরঞ্জামের সাথে আরও ভালভাবে পরিবেশন করা যেতে হবে: একটি আসল ছুরি, একটি আসল স্ক্রু ড্রাইভার বা একটি প্রকৃত জোড় প্লেয়ার।

একটি এলোমেলো বন একই পদে চিন্তা করা যেতে পারে। এলোমেলো বন বিভিন্ন উপাত্ত সেটগুলিতে শক্ত ফল দেয় এবং সুরক্ষা পরামিতিগুলির জন্য অবিশ্বাস্যরকম সংবেদনশীল নয়। তবে এটি নিখুঁত নয়। সমস্যাটি সম্পর্কে আপনি যত বেশি জানেন, আপনার নির্দিষ্ট সমস্যাটি সমন্বিত করার জন্য বিশেষত মডেলগুলি তৈরি করা তত সহজ।

দু'টি সুস্পষ্ট ঘটনা রয়েছে যেখানে এলোমেলো বনগুলি লড়াই করবে:

  • স্পারসিটি - যখন ডেটা খুব কম থাকে তখন এটি খুব প্রশংসনীয় যে কোনও নোডের জন্য, বুটস্ট্র্যাপড নমুনা এবং বৈশিষ্ট্যগুলির এলোমেলো উপসাগর একটি আক্রমণকারী বৈশিষ্ট্য স্থান তৈরি করতে সহযোগিতা করবে। কোনও উত্পাদনশীল বিভাজন হওয়ার দরকার নেই, সুতরাং এই নোডের শিশুরা মোটেই সহায়ক হবে unlikely এক্সজিবিস্ট এই প্রসঙ্গে আরও ভাল করতে পারে।

  • ডেটা অক্ষ-সংযুক্ত নয় - ধরুন যে এক্স1 এবং এক্স2 দুটি বৈশিষ্ট্যের জায়গাতে একটি তির্যক সিদ্ধান্তের সীমানা রয়েছে । এমনকি যদি এটি আপনার ডেটা সম্পর্কিত একমাত্র প্রাসঙ্গিক মাত্রা, ত্রিভুজ সীমানা বর্ণনা করতে এটি একটি সাধারণ এলোমেলো বন মডেলকে অনেকগুলি বিভক্ত করে তুলবে। এটি কারণ প্রতিটি বিভক্তটি এক্স1 বা এক্স2 এর অক্ষের সাথে লম্বযুক্ত । (এটি স্বজ্ঞাত হওয়া উচিত কারণ একটি সাধারণ এলোমেলো বন মডেল x 1 > 4 ফর্মটির বিভাজন তৈরি করছেএক্স1>4।) ঘূর্ণন অরণ্য, যা প্রতিটি বিভক্তের জন্য নির্বাচিত বৈশিষ্ট্যগুলির উপসেটের উপর একটি পিসিএ প্রজেকশন সম্পাদন করে, এটি অতিক্রম করতে ব্যবহার করা যেতে পারে: একটি অर्थোগোনাল ভিত্তিতে প্রক্ষেপণগুলি নীতিগতভাবে অক্ষ-প্রান্তিক সম্পত্তিটির প্রভাবকে হ্রাস করবে কারণ বিভক্ত মূল ভিত্তিতে আর অক্ষযুক্ত হবে না।

    অক্ষর-প্রান্তিক বিভাজন এলোমেলো বন সিদ্ধান্তকে কীভাবে প্রভাবিত করে তার এই চিত্রটি এর অন্য উদাহরণ দেয়। সিদ্ধান্তের সীমানাটি উত্সের একটি বৃত্ত, তবে মনে রাখবেন যে এই নির্দিষ্ট এলোমেলো বন মডেলটি বৃত্তটিকে আনুমানিক করার জন্য একটি বাক্স আঁকবে ws এই সীমানাটি উন্নত করতে কেউ করতে পারে এমন অনেকগুলি বিষয় রয়েছে; সবচেয়ে সহজতে আরও ডেটা সংগ্রহ করা এবং আরও বেশি গাছ তৈরি করা অন্তর্ভুক্ত। এখানে চিত্র বর্ণনা লিখুন

  • র্যান্ডম অরণ্যগুলি মূলত কেবল সারণী ডেটাতে কাজ করে,উদাহরণস্বরূপ, ডেটা একটি চিত্র হচ্ছে বা পর্যবেক্ষণগুলি গ্রাফের সাথে একত্রে নেটওয়ার্ক করা হচ্ছে এমন বৈশিষ্ট্যগুলির মধ্যে বৈশিষ্ট্যগুলির মধ্যে শক্তিশালী, গুণগতভাবে গুরুত্বপূর্ণ সম্পর্ক নেই। এই কাঠামোগুলি সাধারণত অনেকগুলি আয়তক্ষেত্রাকার পার্টিশনের দ্বারা সুসংগত হয় না। যদি আপনার ডেটা কোনও সময়ের সিরিজে লাইভ থাকে বা চিত্রের একটি সিরিজ হয় বা গ্রাফে লাইভ থাকে বা অন্য কোনও সুস্পষ্ট কাঠামো থাকে তবে এলোমেলো অরণ্যে এটি স্বীকৃতি দিতে খুব কঠিন সময় কাটাতে হবে। আমার সন্দেহ নেই যে গবেষকরা এই পরিস্থিতিগুলিকে সামঞ্জস্য করার চেষ্টা করার পদ্ধতিটিতে বিভিন্ন প্রকারের বিকাশ ঘটিয়েছেন, তবে কোনও ভ্যানিলা এলোমেলো বন অগত্যা এই কাঠামোগুলিকে সহায়ক উপায়ে গ্রহণ করবে না। সুসংবাদটি হ'ল আপনি সাধারণত জানেন যে এটি কখন ঘটে থাকে, অর্থাত আপনি জানেন যে আপনার কাছে চিত্রগুলি রয়েছে, একটি সময় সিরিজ আছে বা কাজ করার জন্য একটি গ্রাফ রয়েছে,

আমার মনে হয় ভ্যানিলা এলোমেলো বনগুলিতে অ আয়তক্ষেত্রাকার পার্টিশন সনাক্ত করার সম্ভাবনা রয়েছে। আমাদের উদাহরণস্বরূপ চতুর্ভুজ বৈশিষ্ট্য থাকতে পারে এবং এক্স ^ 2 <সি এর মতো সীমানা সনাক্ত করতে পারে।
অনিরুদ্ধ আচার্য

2
@ অণিরুদ্ধ আচার্য আমি বলেছিলাম "সংগ্রাম" ব্যর্থ হবেন না। এখানে আমার উত্তর এটি পরিষ্কার করে দেয় যে চতুর্ভুজ বৈশিষ্ট্যগুলি একটি অনিবার্য সমস্যা নয়। তবে তির্যক বা চতুর্ভুজ বা অন্যান্য অ-সংযুক্ত প্রকারের বিভাজনগুলির জন্য গাছগুলি সেই বৈশিষ্ট্যগুলিতে বারবার আয়তাকার ফ্যাশনে প্রায় দ্বিগুণ / বক্ররেখার জন্য বিভক্ত হওয়া প্রয়োজন to আপনি এই পোস্টে চক্রান্তে সেই প্রভাবটি দেখতে পাচ্ছেন: তীক্ষ্ণ কোণগুলিতে দেখুন। আরএফ একটি বৃত্তের আনুমানিক জন্য স্কোয়ার ব্যবহার করছে।
সাইকোরাক্স মনিকাকে

আমার অর্থ আরএফকে চতুষ্কোণ (এবং অন্যান্য উচ্চতর ক্রম) বৈশিষ্ট্যগুলি খাওয়ানোই আয়তক্ষেত্রাকার পার্টিশনগুলির মডেলিংয়ের সংগ্রামকে হ্রাস করবে। উদাহরণস্বরূপ, আরএফগুলি বর্গ ব্যবহারের পরিবর্তে বৃত্তটি আনুমানিকভাবে 2 টি চতুর্ভুজ ব্যবহার করতে পারে। যদিও আমি সম্মত হই যে এটির মডেলগুলি যেমন ভেরিয়েবলের মধ্যে মিথস্ক্রিয়াকে অন্তর্ভুক্ত করে, ততটা সহজ নয় তবে আমি এটাকে শক্ত মনে করি না কারণ আরএফগুলি কাঁচা বৈশিষ্ট্যগুলিতে থ্রেশহোল্ডগুলি ব্যবহারের মধ্যে সীমাবদ্ধ নয়।
অনিরুদ্ধ আচার্য

1
@ অণিরুদ্ধ আচার্য আপনি যদি জানেন যে বর্গ শর্তাবলী সঠিক মডেল, আপনার এলোমেলো বন প্রয়োজন নেই: কেবল একটি রৈখিক মডেলটিতে বর্গাকার পদ যুক্ত করুন। আরএফ হ'ল আনুমানিক স্বেচ্ছাসেবী ফাংশনগুলির একটি ভাল উপায়, বিশেষত যখন তাদের অক্ষ-সারিবদ্ধ সিদ্ধান্তের কাজ থাকে।
সাইকোরাক্স মনিকাকে

@ অণিরুদ্ধআচার্য প্রস্তাবিত (চতুষ্কোণ শর্তাবলী) বৈশিষ্ট্য ইঞ্জিনিয়ারিংটি আরএফ এর সাথে মিলে ব্যবহার করার জন্য দরকারী পদক্ষেপ নয় কেন? হ্যাঁ এই বৈশিষ্ট্যগুলি একটি রৈখিক মডেলের সাথে যুক্ত করা যেতে পারে: তবে পরবর্তীকালে বৈশিষ্ট্যগুলির পৃথক পৃথক উপগ্রহের জন্য স্বতন্ত্রভাবে অনুকূলিত হওয়া অনেক ফলাফলের অবদানের সংমিশ্রনের আচরণ সরবরাহ করে না।
জাভাদবা

22

তীক্ষ্ণ কোণ নির্ভুলতা।

তারা ছড়িয়ে পড়া পদ্ধতি ব্যবহার করে। তারা গলদা জিনিস ভাল ফিট। নমুনার আকার কম হলে এগুলি বিস্তৃত এবং অত্যন্ত বিস্তারিত বিষয়গুলিতে ভালভাবে ফিট করে না। আমি কল্পনা করব যে তারা বহুবিধ সময়-সিরিজের ডেটাতে ভাল করে না - যখন এখানে কিছু একটা দূরত্বের সেই জিনিসটির উপর নির্ভর করে।

গ্রেডিয়েন্ট বুস্টেড অরণ্যগুলি মাপসই বা অতিরিক্ত-ফিট হতে পারে তবে একই ডেটার জন্য যথেষ্ট ত্রুটি পেতে পারে।

" লেদারম্যান " এর অস্তিত্ব নেই। কোনও "সিলভার বুলেট" নেই। সরঞ্জামবাক্স আছে। আপনার সরঞ্জামগুলি জানুন এবং সেগুলিতে ভাল যত্ন নিন যাতে তারা আপনার যত্ন নিতে পারে। "যখন আপনি হাতুড়ি হন তখন সাবধান থাকুন, তবে প্রতিটি সমস্যা পেরেকের মতো দেখায়" বিশেষত যখন আপনার সরঞ্জাম বাক্সে ঘন গ্রন্থাগার না থাকে।

যতক্ষণ না আপনি সমস্যাটি ভালভাবে জানেন, ততক্ষণ সহজেই যে কোনও বিষয় সমাধান হতে পারে তা কল্পনা করা সহজ, বা আপনার পছন্দসই সরঞ্জাম এটি সমাধান করতে পারে। প্রজ্ঞাটি সমস্যাটি বোঝার এবং আপনার সরঞ্জামগুলির সাথে খুব পরিচিত হওয়ার পরামর্শ দেয়।

যোগ করা: আপনার কাছে অন্য কিছু ব্যবহার করার জন্য পর্যাপ্ত গণনা সংস্থান বা সময় মার্জিন থাকলে। আরএফ কেবল প্রশিক্ষণের জন্যই দ্রুত নয়, তবে কার্যকর করার পক্ষে দ্রুত। খুব গভীর বুস্টেড স্ট্রাকচার এর চেয়ে কম। এটি সমর্থন করার জন্য আপনার ওভারহেড থাকতে হবে।


2
এখানে শয়তানের উকিল হওয়ার জন্য: নমুনার আকার কম হলে কোনও কিছুই " বিস্তৃত এবং অত্যন্ত বিস্তারিত বিষয়গুলির সাথে ভালভাবে ফিট করা যায় না
ইউএসআর 11852

5

এই প্রথম আমি প্রথম কোনও প্রশ্নের উত্তর দিচ্ছি, সুতরাং আমাকে এতে চাপিয়ে দেবেন না .. তবে আমি মনে করি আমি আপনার প্রশ্নের উত্তর দিতে পারি:

আপনি যদি কেবলমাত্র মডেল পারফরম্যান্সে আগ্রহী হন এবং ব্যাখ্যাযোগ্যতা র্যান্ডম ফরেস্টের মতো জিনিস না হয় তবে প্রায়শই খুব ভাল শেখার অ্যালগরিদম হয় তবে নিম্নলিখিত ক্ষেত্রে কিছুটা খারাপ সম্পাদন করেন:

১) প্রশিক্ষণের নমুনাগুলির সংখ্যার ক্ষেত্রে যখন মাত্রিকতা (বৈশিষ্ট্যগুলির সংখ্যা) খুব বেশি থাকে, তখন সেই ক্ষেত্রেগুলিতে একটি নিয়মিত রৈখিক রেগ্রেশন বা এসভিএম ভাল হয়।

২) ক্ষেত্রে উচ্চতর অর্ডার উপস্থাপনা / উপাত্তগুলিতে কনভোলিউশনাল কাঠামো রয়েছে যেমন কম্পিউটার ভিশন সমস্যাগুলির ক্ষেত্রে। কম্পিউটারের দৃষ্টিভঙ্গির ক্ষেত্রে একটি কনভ্যুশনাল নিউরাল নেটওয়ার্ক একটি এলোমেলো বনকে ছাড়িয়ে যাবে (সাধারণভাবে যদি জ্ঞান থাকে তবে যেটি শিক্ষার সাথে যুক্ত হতে পারে এটি একটি ভাল জিনিস)।

বলা হচ্ছে এলোমেলো বন একটি খুব ভাল সূচনা পয়েন্ট। আমি তার মেশিন লার্নিং দক্ষতার জন্য যে ব্যক্তির প্রশংসা করি তার একজন সর্বদা একটি এলোমেলো বন এবং নিয়মিত রেখাযুক্ত রেজিস্ট্রার শিখতে শুরু করে।

তবে আপনি যদি সেরা সম্ভাব্য পারফরম্যান্স চান তবে আমি আজকাল নিউরাল নেটওয়ার্ক ওরফে বিশ্বাস করি। ডিপ লার্নিং খুব আকর্ষণীয় পদ্ধতির মতো দেখাচ্ছে। কাগল-এর মতো ডেটা-চ্যালেঞ্জ ওয়েবসাইটগুলিতে আরও বেশি বেশি বিজয়ীরা প্রতিযোগিতার জন্য ডিপ লার্নিং মডেল ব্যবহার করেন। নিউরাল নেটওয়ার্কগুলির আরেকটি সমর্থক হ'ল তারা প্রচুর সংখ্যক নমুনা হ্যান্ডেল করতে পারে (> 10 one 6 কোনও এক সময় তাদের স্টোকাস্টিক গ্রেডিয়েন্ট অবতরণ ব্যবহার করে প্রশিক্ষণ দিতে পারে, এক সাথে ডেটার বিটগুলি খাওয়ানো)। ব্যক্তিগতভাবে আমি এটি ডিপ লার্নিংয়ের জন্য খুব আকর্ষণীয় প্রো বলে মনে করি।


2
উত্তম উত্তর, তবে আপনার শেষ পয়েন্টটি সঠিক নয়: মিনি ব্যাচের প্রশিক্ষণটি সমস্ত সাধারণ মেশিন লার্নিং অ্যালগরিদমগুলির জন্য প্রয়োগ করা যেতে পারে, উদাহরণস্বরূপ h2o দেখুন
যুবো

ওকে, আকর্ষণীয়, আমি এটি জানতাম না। আপনি কি বলছেন যে এই পদ্ধতিগুলি ব্যবহার করে কেউ মিনি-ব্যাচ / এসজিডি লার্নিং ব্যবহার করে একটি (সিদ্ধান্ত) গাছকে প্রশিক্ষণ দিতে পারে এবং এইভাবে প্রশিক্ষণের মোট ডেটার সংখ্যাগরিষ্ঠ বিভাজনের উপর ভিত্তি করে একটি গাছ তৈরি করতে পারে (বলুন 65%)?
এমজেডাব্লু

1
আমি মনে করি বৈশিষ্ট্যের সংখ্যা বেশি হলে এলোমেলো বনটি এখনও ভাল হওয়া উচিত - একটি গাছ তৈরি করার সময় কেবল একবারে প্রচুর বৈশিষ্ট্য ব্যবহার করবেন না এবং শেষে আপনার স্বাধীন শ্রেণিবদ্ধের একটি বন থাকবে যা সম্মিলিতভাবে হওয়া উচিত ( আশা করি) ভাল কর।
আলেক্সি গ্রিগোরভ

আমি যতদূর বুঝতে পেরেছি, h2o মিনিব্যাচ-প্রশিক্ষণের জন্য মানচিত্র-হ্রাসের দৃষ্টান্ত ব্যবহার করে। সিঙ্গল (কার্ট) গাছগুলি এইচ 2o এর মতো প্রয়োগ করা হয় না (তবে আমি মনে করি যে একটি অরক্ষিত গাছ কেবল একটি গাছ এবং সর্বাধিক পছন্দসই বাছাইকারী এলোমেলো বনের একটি বিশেষ ঘটনা?)
যুব

2
(1) এর যৌক্তিকতা কী? আপনি দাবি করুন, তবে কোনও সমর্থনকারী যুক্তি সরবরাহ করবেন না।
সাইকোরাক্স মনিকাকে

0

প্রথমত, র্যান্ডম ফরেস্ট নিম্নলিখিত ডেটা ধরণের ক্ষেত্রে প্রয়োগ করা যায় না:

  • চিত্র
  • অডিও
  • পাঠ্য (প্রিপ্রসেসিংয়ের পরে ডেটা বিচ্ছিন্ন হবে এবং আরএফ স্পার্স ডেটা দিয়ে ভাল কাজ করে না)

সারণী তথ্য প্রকারের জন্য, র্যান্ডম ফরেস্ট চেক করা সর্বদা ভাল কারণ:

  • এটিতে নিউরাল নেটওয়ার্ক বা এসভিএমগুলির চেয়ে কম ডেটা প্রস্তুতি এবং প্রিপ্রোসেসিং প্রয়োজন। উদাহরণস্বরূপ, আপনাকে বৈশিষ্ট্য স্কেলিং করার দরকার নেই।
  • র্যান্ডম ফরেস্ট প্রশিক্ষণের জন্য আপনি কেবলমাত্র ডিফল্ট প্যারামিটার ব্যবহার করতে পারেন এবং গাছের সংখ্যা নির্ধারণ করতে পারেন ( আরএফ-তে আরও বেশি গাছ ভাল )। যখন আপনি র‌্যান্ডম ফরেস্টকে নিউরাল নেটওয়ার্কগুলির সাথে তুলনা করেন , প্রশিক্ষণটি খুব সহজ (আর্কিটেকচারটি সংজ্ঞায়িত করার প্রয়োজন হয় না, বা প্রশিক্ষণের অ্যালগরিদম টিউন করার প্রয়োজন হয় না)। নিউরাল নেটওয়ার্কগুলির চেয়ে র্যান্ডম ফরেস্ট প্রশিক্ষণ সহজ is
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.