গিনি সহগ বনাম গিনি অপরিষ্কার - সিদ্ধান্ত গাছ


25

সমস্যা সিদ্ধান্ত গাছের বিল্ডিং বোঝায়। উইকিপিডিয়া অনুসারে ' গিনি সহগ ' কে ' গিনি অপূর্ণতা ' দিয়ে বিভ্রান্ত করা উচিত নয় । তবে সিদ্ধান্ত গাছ তৈরি করার সময় উভয় ব্যবস্থা ব্যবহার করা যেতে পারে - আইটেমগুলির সেট বিভক্ত করার সময় এগুলি আমাদের পছন্দগুলিকে সমর্থন করতে পারে।

1) 'গিনি অপরিষ্কার' - এটি একটি মান-সিদ্ধান্ত-গাছ বিভাজক মেট্রিক (উপরের লিঙ্কে দেখুন);

2) 'গিনি সহগ' - প্রতিটি বিভাজক এওসি মানদণ্ডের ভিত্তিতে মূল্যায়ন করা যেতে পারে। প্রতিটি বিভক্ত দৃশ্যের জন্য আমরা একটি আরওসি বক্ররেখা এবং গণনা এউসি মেট্রিক তৈরি করতে পারি। উইকিপিডিয়া এউসি = (গিনিকফ + 1) / 2 অনুসারে;

প্রশ্ন হ'ল: এই দুটি পদক্ষেপই কি সমান? একদিকে, আমাকে জানানো হয়েছে যে গিনি সহগ গিনি অপরিষ্কারের সাথে বিভ্রান্ত হওয়া উচিত নয়। অন্যদিকে, এই দুটি ব্যবস্থা একই জিনিস করতে ব্যবহার করা যেতে পারে - সিদ্ধান্তের গাছের বিভাজনের গুণমান নির্ধারণ করে।


আমি এই সংজ্ঞাটির সন্ধান করতে এসেছি: en.wikedia.org/wiki/Decision_tree_learning#Gini_impurity
মার্টিন থোমা

উত্তর:


28

না, তাদের নাম সত্ত্বেও তারা নয় সমতুল্য বা অনুরূপ যে এমনকি।

  • গিনি অপরিষ্কার হ'ল ভুল শ্রেণিবিন্যাসের একটি পরিমাপ, যা বহুজাতিক শ্রেণিবদ্ধ প্রসঙ্গে প্রযোজ্য।
  • গিনি সহগ বাইনারি শ্রেণিবদ্ধকরণের জন্য প্রযোজ্য এবং এমন একটি শ্রেণিবদ্ধ প্রয়োজন যা কোনও ধরণের ধনাত্মক শ্রেণিতে থাকার সম্ভাবনা অনুসারে উদাহরণগুলি র‌্যাঙ্ক করতে পারে।

উভয়ই কিছু ক্ষেত্রে প্রয়োগ করা যেতে পারে তবে তারা বিভিন্ন জিনিসের জন্য পৃথক ব্যবস্থা। অপরিচ্ছন্নতা হ'ল সাধারণভাবে সিদ্ধান্ত গাছগুলিতে ব্যবহৃত হয় ।


7

আমি যথাক্রমে ইউনিট 1 এবং 3 ইউনিটের সম্পদ সহ দুটি লোক এ এবং বি এর সাথে ডেটার উদাহরণ গ্রহণ করেছি। উইকিপিডিয়া = 1 অনুযায়ী গিনি অপরিষ্কারতা - [(1/4)) 2 + (3/4) ^ 2] = 3/8

উইকিপিডিয়া অনুসারে গিনি গুণফল নীচের গ্রাফের নীলের রেখার নীচে মোট ক্ষেত্রের সাথে লাল এবং নীল লাইনের মধ্যবর্তী ক্ষেত্রের অনুপাত হবে

এখানে চিত্র বর্ণনা লিখুন

লাল রেখার নীচে অঞ্চলটি 1/2 + 1 + 3/2 = 3

নীল লাইনের নীচে মোট অঞ্চল = 4 4

সুতরাং গিনি সহগ = 3/4

স্পষ্টতই দুটি সংখ্যা পৃথক। আমি আনুপাতিক কিনা তা দেখতে আরও কেস পরীক্ষা করে দেখব বা সঠিক সম্পর্ক আছে কিনা এবং উত্তরটি সম্পাদনা করব।

সম্পাদনা: আমি অন্যান্য সংমিশ্রণের জন্যও পরীক্ষা করে দেখেছি, অনুপাত স্থির নয়। নীচে আমি চেষ্টা করেছি এমন কয়েকটি সংমিশ্রণের একটি তালিকা রয়েছে। এখানে চিত্র বর্ণনা লিখুন


কী ব্যাখ্যা !!
আউটিলার

0

আমি মনে করি তারা উভয়ই একই ধারণার প্রতিনিধিত্ব করে।

শ্রেণিবদ্ধ গাছগুলিতে, গিনি সূচকটি কোনও ডেটা পার্টিশনের অপরিষ্কার গণনা করতে ব্যবহৃত হয়। সুতরাং সমমান সম্ভাবনা সহ 4 টি শ্রেণীর সমন্বয়ে ডেটা পার্টিশন ডি অনুমান করুন। তারপরে গিনি সূচক (গিনি অপরিষ্কার) হবে: গিনি (ডি) = 1 - (0.25 ^ 2 + 0.25 ^ 2 + 0.25 ^ 2 + 0.25 ^ 2)

কার্টে আমরা বাইনারি বিভক্ত করি perform সুতরাং গিনি সূচকটি ফলাফলকারী পার্টিশনের ওজনযুক্ত যোগফল হিসাবে গণনা করা হবে এবং আমরা ক্ষুদ্রতম গিনি সূচকের সাথে বিভাজনটি নির্বাচন করি।

সুতরাং গিনি অপরিষ্কারতা (গিনি সূচক) এর ব্যবহার বাইনারি পরিস্থিতিতে সীমাবদ্ধ নয়।

গিনি অপরিষ্কারের জন্য আরেকটি শব্দ হ'ল গিনি গুণাগুণ যা আয় বন্টনের পরিমাপ হিসাবে সাধারণত ব্যবহৃত হয়।


3
গিনি সহগ গিনি অপরিষ্কার নয়। প্রশ্নের লিঙ্কগুলি দেখুন
সান ওউইন

2
উইকিপিডিয়া সর্বদা তথ্যের নির্ভরযোগ্য উত্স নয় :-)
পাসমড টুরিং

2
অবশ্যই। এটি অন্য কোথাও সন্ধান করুন: mathworld.wolfram.com/GiniCoeype.html আপনাকে গিনি সহগ = গিনি অপূর্ণতা বলে কী মনে করে?
শন ওভেন

: এটা দেখুন আপ books.google.de/...
Pasmod টুরিং

1
আমি মনে করি আমরা সিদ্ধান্ত গাছ সম্পর্কে কথা বলছি। তাই আমরা মেশিন লার্নিংয়ের ক্ষেত্রে! দয়া করে প্রশ্নটি আরও মনোযোগ সহকারে পড়ুন
পাসমড টুরিং
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.