এলোমেলো বনগুলিতে সান্নিধ্য বলতে কী বোঝায়?


13

আমি এলোমেলো বনগুলিতে নৈকট্য শব্দটি জুড়ে এসেছি। তবে আমি বুঝতে পারি না এলোমেলো বনগুলিতে এটি কী করে। শ্রেণিবিন্যাসের জন্য এটি কীভাবে সহায়তা করে?

উত্তর:


13

"নৈকট্য" শব্দের অর্থ জোড় জোড়ের মধ্যে "ঘনিষ্ঠতা" বা "নৈকট্য"।

প্রতিটি জোড়া কেস / পর্যবেক্ষণ / নমুনা পয়েন্টের জন্য প্রক্সিমিটি গণনা করা হয়। দুটি গাছ যদি একটি গাছের মাধ্যমে একই টার্মিনাল নোড দখল করে তবে তাদের নৈকট্য এক এক করে বাড়িয়ে দেওয়া হয়েছে। সমস্ত গাছের সঞ্চালনের শেষে, গাছগুলির সংখ্যা দ্বারা ভাগ করে নৈকট্যগুলি স্বাভাবিক করা হয়। প্রক্সিমিটিগুলি অনুপস্থিত তথ্য প্রতিস্থাপনে, বহিরাগতদের সনাক্ত করতে এবং তথ্যের আলোকসজ্জা নিম্ন-মাত্রিক দৃষ্টিভঙ্গি তৈরিতে ব্যবহৃত হয়।

Proximities

সান্নিধ্যগুলি মূলত একটি এনএক্সএন ম্যাট্রিক্স গঠন করেছিল। একটি গাছ বড় হওয়ার পরে, গাছের নীচে প্রশিক্ষণ এবং oob উভয়ই ডেটা রাখুন। কেস এবং এন একই টার্মিনাল নোডে থাকলে তাদের নৈকট্য এক এক করে বাড়িয়ে দেয়। শেষে, গাছের সংখ্যা দ্বারা ভাগ করে নৈকট্যগুলি স্বাভাবিক করুন।

ব্যবহারকারীরা উল্লেখ করেছেন যে বড় ডেটা সেট সহ, তারা দ্রুত মেমরিতে কোনও এনএক্সএন ম্যাট্রিক্স ফিট করতে পারে না। একটি পরিবর্তন প্রয়োজনীয় মেমরির আকারকে এনএক্সটি-তে হ্রাস করেছে যেখানে টি বনের গাছের সংখ্যা। গণনা-নিবিড় স্কেলিং এবং পুনরুক্তি অনুপস্থিত মান প্রতিস্থাপনের গতি বাড়ানোর জন্য, ব্যবহারকারীকে প্রতিটি ক্ষেত্রে কেবলমাত্র nrnn বৃহত্তম নৈকট্য ধরে রাখার বিকল্প দেওয়া হয়।

যখন একটি পরীক্ষার সেট উপস্থিত থাকে, প্রশিক্ষণ সেটের প্রতিটি মামলার সাথে পরীক্ষা সংস্থার প্রতিটি মামলার সান্নিধ্যগুলিও গণনা করা যায়। অতিরিক্ত কম্পিউটিংয়ের পরিমাণ মাঝারি।

উক্তি: https://www.stat.berkeley.edu/~breiman/RandomForests/cc_home.htm


"এনআরএনএন" কী বোঝায়? আমি অ্যাডেল ক্যাটলার এর (বা সম্ভবত ব্রেইমানের হিসাবে আমি বলতে পারি না কে এখানে কী লেখছে) আর আর এনআরএন কোথায় সংজ্ঞায়িত করলাম তা খুঁজে পাচ্ছি না। (এটি খুব ভাল একটি লিনিয়ার বীজগণিত শব্দ হতে পারে যার সাথে আমি অপরিচিত হয়েছি
ট্যানার স্ট্রানক

nrnn = নিকটবর্তী গণনা করার জন্য নিকটতম প্রতিবেশীর সংখ্যা। সূত্র: math.usu.edu/adele/RandomForests/ENAR.pdf পৃষ্ঠা 161
ক্লম্বার্ড

0

নোট করুন যে স্ট্যাটিস্টিকাল লার্নিং এর উপাদানগুলির লেখকরা বলেছেন যে "এলোমেলো বনের জন্য প্রক্সিমিটি প্লটগুলি প্রায়শই একই রকম দেখতে লাগে, তথ্যের ভিত্তিতে যা তাদের ইউটিলিটি সম্পর্কে সন্দেহ পোষণ করে। তাদের স্টার শেপ থাকে, ক্লাস প্রতি এক বাহু, যা আরও বেশি শ্রেণিবিন্যাসের পারফরম্যান্সের উন্নতি উচ্চারণ করে "" (পি 595)

তবে আমি মনে করি যে এই লেখকরা এলোমেলো বনগুলি যেভাবে হারিয়ে যাওয়া তথ্যের সাথে এতটা व्यवहार করে সেগুলি উল্লেখ করেনি (যদিও তারা বইতে গাছের সাথে আগে হারিয়ে যাওয়া তথ্য উল্লেখ করেছেন); সম্ভবত লেখক শুধু যতটা RFs এই দৃষ্টিভঙ্গি যার ফলে ইন্দ্রিয় বই বিবেচনা করা হয় হাইলাইট করা হয়নি বিরাট এবং এর তথ্য অনেক আছে অনেক মেশিন লার্নিং বিষয় / কৌশল। যাইহোক, আমি মনে করি না যে প্লটগুলি কোনও আরএফ এবং ডেটা সেটের জন্য অনুরূপ আকার দেয় তবে সাধারণভাবে আরএফ সম্পর্কে নেতিবাচক কোনও কিছু থাকে। উদাহরণস্বরূপ, লিনিয়ার রিগ্রেশন মূলত সর্বদা একই দেখায় তবে কোন পয়েন্টটি রেখার নিকটে অবস্থিত এবং কোনটি লিনিয়ার রিগ্রেশনের দৃষ্টিকোণ থেকে বহিরাগত বলে মনে হয় তা জানা সার্থক। সুতরাং ... সান্নিধ্য প্লটগুলির ইউটিলিটি সম্পর্কে তাদের মন্তব্য আমার কাছে বোধগম্য নয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.