সিদ্ধান্ত গাছ বনাম কেএনএন


15

কোন ক্ষেত্রে সিদ্ধান্ত গাছ এবং অন্যান্য ক্ষেত্রে কেএনএন ব্যবহার করা ভাল?

কেন নির্দিষ্ট কিছু ক্ষেত্রে তাদের একটি ব্যবহার করবেন? এবং অন্য ক্ষেত্রে বিভিন্ন ক্ষেত্রে? (এর কার্যকারিতা দেখে, অ্যালগরিদমে নয়)

কারও সম্পর্কে কিছু ব্যাখ্যা বা রেফারেন্স আছে?


2
কেএনএন নিরীক্ষণযোগ্য নয়। সম্ভবত উত্তরটি কি-মানে নিয়ে ভাবছিল?

2
সিদ্ধান্ত গাছের পড়াশোনাও নিষ্ক্রিয় নয়। en.wikedia.org/wiki/Supervised_learning
ভ্যালেন্টাস

উত্তর:


9

তারা বিভিন্ন উদ্দেশ্যে পরিবেশন।

কেএনএন নিরীক্ষণযোগ্য, সিদ্ধান্ত গাছ (টিটি) তত্ত্বাবধানে রয়েছে। ( কেএনএন তত্ত্বাবধানে থাকা অবস্থায় কে-মানে নিরীক্ষণ করা হয়েছে, আমি মনে করি এই উত্তরটি কিছুটা বিভ্রান্তির সৃষ্টি করে। ) কেএনএন ক্লাস্টারিং, ডিটি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয়। ( উভয়ই শ্রেণিবদ্ধের জন্য ব্যবহৃত হয় ))

কেএনএন পাড়াগুলি নির্ধারণ করে, সুতরাং অবশ্যই একটি দূরত্বের মেট্রিক থাকতে হবে। এটি বোঝায় যে সমস্ত বৈশিষ্ট্যগুলি অবশ্যই সংখ্যাসূচক হতে হবে। দূরত্বের মেট্রিকগুলি বৈশিষ্ট্য এবং উচ্চ-মাত্রিক স্থানের মধ্যে বিভিন্ন স্কেল দ্বারা প্রভাবিত হতে পারে।

অন্যদিকে ডিটি, প্রদত্ত ইনপুট ভেক্টরের জন্য একটি শ্রেণির পূর্বাভাস দেয়। বৈশিষ্ট্যগুলি সংখ্যা বা নামমাত্র হতে পারে।

সুতরাং, আপনি যদি অনুরূপ উদাহরণ খুঁজতে চান তবে আপনি কেএনএন ব্যবহার করতে পারেন। আপনি উদাহরণগুলি শ্রেণিবদ্ধ করতে চাইলে আপনি ডিটি ব্যবহার করতে পারেন।


স্পষ্টকরণ: ক্লাস্টারিং, তবে প্রদত্ত ইনপুট ভেক্টরের চারপাশে একটি একক কে-আকারের ক্লাস্টার। এটি অগত্যা সত্য নয় যে সমস্ত বৈশিষ্ট্য অবশ্যই সংখ্যাসূচক হতে হবে। উদাহরণস্বরূপ, আপনি জ্যাকার্ডের সাদৃশ্যটি এমন কোনও দূরত্ব নির্ধারণ করতে ব্যবহার করতে পারেন যেখানে বৈশিষ্ট্যগুলি নামমাত্র।

10
আসলে, তারা উভয় তদারকি করা হয়। তত্ত্বাবধানের অর্থ হ'ল শিখার একটি লেবেলযুক্ত প্রশিক্ষণের সেটটিতে অ্যাক্সেস রয়েছে। নিরীক্ষণ করা অ্যালগরিদমগুলি ক্লাস্টারিংয়ের মতো কাজ করে, লেবেল পূর্বাভাস না।
জর্দান এ

1
আপনি আপনার কে-প্রতিবেশীদের বেশিরভাগের উপর ভিত্তি করে কেএনএন দিয়েও শ্রেণিবদ্ধ করতে পারেন
জেকেটারিনা কোকাতজুঝা

3
-1 knnএবং k-meansপৃথক পৃথক অ্যালগরিদম এবং এই উত্তরটি দুর্ভাগ্যক্রমে (এবং ভ্রান্তভাবে) এই দুটি পদ্ধতি মিস করে। knnগুপ্তচরবৃত্তির জন্য না তা নিরীক্ষণ করা হয় না বা ব্যবহৃত হয় না! প্রশ্ন
সেবনাগ

@ সেবনাগ, এটা কি বলা যায় যে সাই-কিট লার্নিংয়ের "নিরীক্ষণ করা নিকটবর্তী প্রতিবেশী" বিভাগটি সত্যই ছদ্মবেশে কে-মানে সম্পর্কে কথা বলছে? scikit-learn.org/stable/modules/neighbors.html মনে হচ্ছে যে বিভাগটি কোনও লেবেল জ্ঞান ছাড়াই ক্লাস্টারগুলি নির্ধারণ করার পরিবর্তে কিছু ধরণের দুরত্ব পরিমাপের সাথে ব্যবহার করেছে তবে এটি কে-এর মতো শোনাচ্ছে।
ফ্রিকস্টার

8

মত ক্লাসিফায়ার ডিসিশন বৃক্ষ, Bayesian, ব্যাক-প্রসারণ, সাপোর্ট ভেক্টর মেশিন বিষয়শ্রেণীতে অধীনে আসা "উৎসুক শিক্ষার্থী" কারণ তারা প্রথম একটি শ্রেণীবিভাগ মডেল নির্মান প্রশিক্ষণ ডেটা সেটটি আসলে থেকে একটি [অদৃশ্য] পর্যবেক্ষণ শ্রেণীভুক্ত সক্ষম হওয়ার আগে পরীক্ষা ডেটা সেটটি । জ্ঞাত মডেল এখন "উত্সাহী" (ক্ষুধার্ত পড়ুন) পূর্বে অদেখা পর্যবেক্ষণগুলিকে শ্রেণিবদ্ধ করার জন্য, তাই নাম।


কেএনএন-ভিত্তিক শ্রেণিবদ্ধকারী তবে কোনও শ্রেণিবদ্ধকরণের মডেল তৈরি করে না। এটি সরাসরি প্রশিক্ষণের উদাহরণগুলি (পর্যবেক্ষণ) থেকে শিখেছে। এটি শ্রেণিবদ্ধ করার জন্য একটি পরীক্ষা পর্যবেক্ষণ দেওয়ার পরে ডেটা প্রক্রিয়াকরণ শুরু করে। সুতরাং, কেএনএন "অলস লার্নার" পদ্ধতির বিভাগের অধীনে আসে ।

উপরোক্ত মূলগত পার্থক্যের ভিত্তিতে আমরা নিম্নলিখিতগুলি উপসংহার করতে পারি: -

  1. যেহেতু কেএনএন স্পট-এ-শেখার কাজ করে, তাই এটি ঘন ঘন ডেটাবেস লুকআপ প্রয়োজন, অতএব, গণনা ব্যয়বহুল হতে পারে। সিদ্ধান্তের শ্রেণির শ্রেণিবদ্ধকারীর জন্য এ জাতীয় লুকের প্রয়োজন নেই কারণ এতে মেমরির শ্রেণিবদ্ধকরণ মডেল প্রস্তুত।

  2. যেহেতু কেএনএন উদাহরণ ভিত্তিক শিক্ষাগ্রহণ করে, একটি সু-সুরযুক্ত কে নির্বিচারে জটিল সিদ্ধান্তের সীমানা সম্পন্ন জটিল সিদ্ধান্তের জায়গাগুলির মডেল করতে পারে, যা ডিসিশন ট্রিসের মতো অন্যান্য "আগ্রহী" শিক্ষার্থীরা সহজেই মডেল করে না।

  3. "উত্সাহী" শিক্ষার্থীরা ব্যাচগুলিতে কাজ করে, একযোগে একদল প্রশিক্ষণের পর্যবেক্ষণের মডেলিং করে। সুতরাং তারা বর্ধনশীল শিক্ষার জন্য উপযুক্ত নয়। তবে কেএনএন প্রাকৃতিকভাবে ইনক্রিমেন্টাল লার্নিং (ডেটা স্ট্রিম) সমর্থন করে কারণ এটি একটি উদাহরণ-ভিত্তিক লার্নার।

  4. আরও, কেএনএন শ্রেণিবদ্ধকারী পরীক্ষার ত্রুটির হারগুলি বায়েশিয়ান শ্রেণিবদ্ধ (সোনার মান) এর কাছাকাছি দেয়। আইএসএলআরে উদ্ধৃত হিসাবে :

বেইস ত্রুটির হার অপ্রতুল্য ত্রুটির সাথে মিল


4

সেবাস্তিয়ান রাশকার পাইথন মেশিন লার্নিং থেকে :

এই জাতীয় মেমরি-ভিত্তিক পদ্ধতির [কেএনএন] এর প্রধান সুবিধাটি হ'ল শ্রেণিবদ্ধকারীটি যখনই আমরা নতুন প্রশিক্ষণের ডেটা সংগ্রহ করি তত্ক্ষণাত মানিয়ে নিয়ে যায়। তবে, খারাপ দিকটি হ'ল নতুন নমুনাগুলিকে শ্রেণিবদ্ধ করার জন্য কম্পিউটেশনাল জটিলতা সবচেয়ে খারাপ পরিস্থিতিতে ট্রেনিং ডেটাসেটের নমুনার সংখ্যার সাথে রৈখিকভাবে বৃদ্ধি পায় — যদি না ডেটাসেটের খুব কম মাত্রা (বৈশিষ্ট্য) থাকে এবং দক্ষতার ডেটা ব্যবহার করে অ্যালগরিদম বাস্তবায়ন না করা হয় কাঠামো যেমন কেডি-ট্রি। জেএইচ ফ্রেডম্যান, জেএল বেন্টলি এবং আরএ ফিনকেল। লগারিদমিক প্রত্যাশিত সময়ে সেরা মিলগুলি খুঁজে পাওয়ার জন্য একটি অ্যালগরিদম। গাণিতিক সফ্টওয়্যার (টিএমএস), এসিএম লেনদেন (3MS), 3 (3): 209-2226, 1977. তদতিরিক্ত, প্রশিক্ষণের কোনও পদক্ষেপ জড়িত না হওয়ায় আমরা প্রশিক্ষণের নমুনাগুলি বাতিল করতে পারি না। এইভাবে, স্টোরেজ স্পেস একটি চ্যালেঞ্জ হয়ে উঠতে পারে যদি আমরা বড় ডেটাসেটের সাথে কাজ করি।

সিদ্ধান্ত গাছটি তবে নতুন উদাহরণগুলিকে দ্রুত শ্রেণিবদ্ধ করতে পারে। আপনি কেবল বুলিয়ান তুলনাগুলির একটি সিরিজ চালাচ্ছেন।


2

আমি যুক্ত করব যে সিদ্ধান্তের গাছগুলি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন উভয় কাজে ব্যবহার করা যেতে পারে। অন্যদিকে ডিটি ভবিষ্যদ্বাণী করেছেন স্বীকৃত উত্তরে একটি শ্রেণি শ্রেণিবিন্যাস গাছগুলি বর্ণনা করে আরও সুনির্দিষ্ট হবে যা প্রযুক্তিগতভাবে জেনেরিক ডি টি ধারণার একটি সাব টাইপ। একটি রেফারেন্স (নির্দিষ্ট প্রয়োগগুলি সম্পর্কে নীচের স্তরগুলিকে উপেক্ষা করে):
সিদ্ধান্ত গাছের ধরণ এখান থেকে: http://www.simafire.com/blog/bid/62482/2-main-differences-between-classization-and-regression-tree

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.