কোন ক্ষেত্রে সিদ্ধান্ত গাছ এবং অন্যান্য ক্ষেত্রে কেএনএন ব্যবহার করা ভাল?
কেন নির্দিষ্ট কিছু ক্ষেত্রে তাদের একটি ব্যবহার করবেন? এবং অন্য ক্ষেত্রে বিভিন্ন ক্ষেত্রে? (এর কার্যকারিতা দেখে, অ্যালগরিদমে নয়)
কারও সম্পর্কে কিছু ব্যাখ্যা বা রেফারেন্স আছে?
কোন ক্ষেত্রে সিদ্ধান্ত গাছ এবং অন্যান্য ক্ষেত্রে কেএনএন ব্যবহার করা ভাল?
কেন নির্দিষ্ট কিছু ক্ষেত্রে তাদের একটি ব্যবহার করবেন? এবং অন্য ক্ষেত্রে বিভিন্ন ক্ষেত্রে? (এর কার্যকারিতা দেখে, অ্যালগরিদমে নয়)
কারও সম্পর্কে কিছু ব্যাখ্যা বা রেফারেন্স আছে?
উত্তর:
তারা বিভিন্ন উদ্দেশ্যে পরিবেশন।
কেএনএন নিরীক্ষণযোগ্য, সিদ্ধান্ত গাছ (টিটি) তত্ত্বাবধানে রয়েছে। ( কেএনএন তত্ত্বাবধানে থাকা অবস্থায় কে-মানে নিরীক্ষণ করা হয়েছে, আমি মনে করি এই উত্তরটি কিছুটা বিভ্রান্তির সৃষ্টি করে। ) কেএনএন ক্লাস্টারিং, ডিটি শ্রেণিবদ্ধকরণের জন্য ব্যবহৃত হয়। ( উভয়ই শ্রেণিবদ্ধের জন্য ব্যবহৃত হয় ))
কেএনএন পাড়াগুলি নির্ধারণ করে, সুতরাং অবশ্যই একটি দূরত্বের মেট্রিক থাকতে হবে। এটি বোঝায় যে সমস্ত বৈশিষ্ট্যগুলি অবশ্যই সংখ্যাসূচক হতে হবে। দূরত্বের মেট্রিকগুলি বৈশিষ্ট্য এবং উচ্চ-মাত্রিক স্থানের মধ্যে বিভিন্ন স্কেল দ্বারা প্রভাবিত হতে পারে।
অন্যদিকে ডিটি, প্রদত্ত ইনপুট ভেক্টরের জন্য একটি শ্রেণির পূর্বাভাস দেয়। বৈশিষ্ট্যগুলি সংখ্যা বা নামমাত্র হতে পারে।
সুতরাং, আপনি যদি অনুরূপ উদাহরণ খুঁজতে চান তবে আপনি কেএনএন ব্যবহার করতে পারেন। আপনি উদাহরণগুলি শ্রেণিবদ্ধ করতে চাইলে আপনি ডিটি ব্যবহার করতে পারেন।
মত ক্লাসিফায়ার ডিসিশন বৃক্ষ, Bayesian, ব্যাক-প্রসারণ, সাপোর্ট ভেক্টর মেশিন বিষয়শ্রেণীতে অধীনে আসা "উৎসুক শিক্ষার্থী" কারণ তারা প্রথম একটি শ্রেণীবিভাগ মডেল নির্মান প্রশিক্ষণ ডেটা সেটটি আসলে থেকে একটি [অদৃশ্য] পর্যবেক্ষণ শ্রেণীভুক্ত সক্ষম হওয়ার আগে পরীক্ষা ডেটা সেটটি । জ্ঞাত মডেল এখন "উত্সাহী" (ক্ষুধার্ত পড়ুন) পূর্বে অদেখা পর্যবেক্ষণগুলিকে শ্রেণিবদ্ধ করার জন্য, তাই নাম।
কেএনএন-ভিত্তিক শ্রেণিবদ্ধকারী তবে কোনও শ্রেণিবদ্ধকরণের মডেল তৈরি করে না। এটি সরাসরি প্রশিক্ষণের উদাহরণগুলি (পর্যবেক্ষণ) থেকে শিখেছে। এটি শ্রেণিবদ্ধ করার জন্য একটি পরীক্ষা পর্যবেক্ষণ দেওয়ার পরে ডেটা প্রক্রিয়াকরণ শুরু করে। সুতরাং, কেএনএন "অলস লার্নার" পদ্ধতির বিভাগের অধীনে আসে ।
উপরোক্ত মূলগত পার্থক্যের ভিত্তিতে আমরা নিম্নলিখিতগুলি উপসংহার করতে পারি: -
যেহেতু কেএনএন স্পট-এ-শেখার কাজ করে, তাই এটি ঘন ঘন ডেটাবেস লুকআপ প্রয়োজন, অতএব, গণনা ব্যয়বহুল হতে পারে। সিদ্ধান্তের শ্রেণির শ্রেণিবদ্ধকারীর জন্য এ জাতীয় লুকের প্রয়োজন নেই কারণ এতে মেমরির শ্রেণিবদ্ধকরণ মডেল প্রস্তুত।
যেহেতু কেএনএন উদাহরণ ভিত্তিক শিক্ষাগ্রহণ করে, একটি সু-সুরযুক্ত কে নির্বিচারে জটিল সিদ্ধান্তের সীমানা সম্পন্ন জটিল সিদ্ধান্তের জায়গাগুলির মডেল করতে পারে, যা ডিসিশন ট্রিসের মতো অন্যান্য "আগ্রহী" শিক্ষার্থীরা সহজেই মডেল করে না।
"উত্সাহী" শিক্ষার্থীরা ব্যাচগুলিতে কাজ করে, একযোগে একদল প্রশিক্ষণের পর্যবেক্ষণের মডেলিং করে। সুতরাং তারা বর্ধনশীল শিক্ষার জন্য উপযুক্ত নয়। তবে কেএনএন প্রাকৃতিকভাবে ইনক্রিমেন্টাল লার্নিং (ডেটা স্ট্রিম) সমর্থন করে কারণ এটি একটি উদাহরণ-ভিত্তিক লার্নার।
আরও, কেএনএন শ্রেণিবদ্ধকারী পরীক্ষার ত্রুটির হারগুলি বায়েশিয়ান শ্রেণিবদ্ধ (সোনার মান) এর কাছাকাছি দেয়। আইএসএলআরে উদ্ধৃত হিসাবে :
বেইস ত্রুটির হার অপ্রতুল্য ত্রুটির সাথে মিল
সেবাস্তিয়ান রাশকার পাইথন মেশিন লার্নিং থেকে :
এই জাতীয় মেমরি-ভিত্তিক পদ্ধতির [কেএনএন] এর প্রধান সুবিধাটি হ'ল শ্রেণিবদ্ধকারীটি যখনই আমরা নতুন প্রশিক্ষণের ডেটা সংগ্রহ করি তত্ক্ষণাত মানিয়ে নিয়ে যায়। তবে, খারাপ দিকটি হ'ল নতুন নমুনাগুলিকে শ্রেণিবদ্ধ করার জন্য কম্পিউটেশনাল জটিলতা সবচেয়ে খারাপ পরিস্থিতিতে ট্রেনিং ডেটাসেটের নমুনার সংখ্যার সাথে রৈখিকভাবে বৃদ্ধি পায় — যদি না ডেটাসেটের খুব কম মাত্রা (বৈশিষ্ট্য) থাকে এবং দক্ষতার ডেটা ব্যবহার করে অ্যালগরিদম বাস্তবায়ন না করা হয় কাঠামো যেমন কেডি-ট্রি। জেএইচ ফ্রেডম্যান, জেএল বেন্টলি এবং আরএ ফিনকেল। লগারিদমিক প্রত্যাশিত সময়ে সেরা মিলগুলি খুঁজে পাওয়ার জন্য একটি অ্যালগরিদম। গাণিতিক সফ্টওয়্যার (টিএমএস), এসিএম লেনদেন (3MS), 3 (3): 209-2226, 1977. তদতিরিক্ত, প্রশিক্ষণের কোনও পদক্ষেপ জড়িত না হওয়ায় আমরা প্রশিক্ষণের নমুনাগুলি বাতিল করতে পারি না। এইভাবে, স্টোরেজ স্পেস একটি চ্যালেঞ্জ হয়ে উঠতে পারে যদি আমরা বড় ডেটাসেটের সাথে কাজ করি।
সিদ্ধান্ত গাছটি তবে নতুন উদাহরণগুলিকে দ্রুত শ্রেণিবদ্ধ করতে পারে। আপনি কেবল বুলিয়ান তুলনাগুলির একটি সিরিজ চালাচ্ছেন।
আমি যুক্ত করব যে সিদ্ধান্তের গাছগুলি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন উভয় কাজে ব্যবহার করা যেতে পারে। অন্যদিকে ডিটি ভবিষ্যদ্বাণী করেছেন স্বীকৃত উত্তরে একটি শ্রেণি শ্রেণিবিন্যাস গাছগুলি বর্ণনা করে আরও সুনির্দিষ্ট হবে যা প্রযুক্তিগতভাবে জেনেরিক ডি টি ধারণার একটি সাব টাইপ। একটি রেফারেন্স (নির্দিষ্ট প্রয়োগগুলি সম্পর্কে নীচের স্তরগুলিকে উপেক্ষা করে):
এখান থেকে: http://www.simafire.com/blog/bid/62482/2-main-differences-between-classization-and-regression-tree