আমি শ্রেণিবদ্ধকরণ এবং রিগ্রেশন গাছগুলি অধ্যয়ন করছি এবং বিভক্ত অবস্থানের জন্য অন্যতম একটি পদক্ষেপ হ'ল জিআইএনআই স্কোর।
এখন আমি দুটি বিভক্তির মধ্যে একই তথ্যের সম্ভাবনা অনুপাতের লগ শূন্য হলে সর্বাধিক বিভক্ত অবস্থান নির্ধারণ করতে অভ্যস্ত, যার অর্থ সদস্যতার সম্ভাবনাও সমান সম্ভাবনা।
আমার অন্তর্নিহিততা বলছে যে কোনও না কোনও সংযোগের অবশ্যই সংযোগ থাকতে হবে, জিআইএনআইয়ের একটি গাণিতিক তথ্যের (শ্যানন) তত্ত্বের একটি ভাল ভিত্তি থাকতে হবে তবে আমি নিজে জিনিকে খুব ভালভাবে বুঝতে পারি না যে এই সম্পর্কটি নিজেকে আবিষ্কার করতে পারে।
প্রশ্নাবলী:
- বিভাজনের জন্য একটি পরিমাপ হিসাবে জিনি অপরিষ্কার স্কোরের "প্রথম নীতিগুলি" কী কী?
- জিআইএনআই স্কোর কীভাবে সম্ভাবনা অনুপাত বা অন্যান্য তথ্য-তাত্ত্বিক মৌলিক লগগুলির সাথে সম্পর্কিত (শ্যানন এন্ট্রপি, পিডিএফ , এবং ক্রস এনট্রপি সেগুলির অংশ)?
তথ্যসূত্র:
- ওজনযুক্ত গিনি মানদণ্ড কীভাবে সংজ্ঞায়িত হয়?
- শ্রেণিবদ্ধকরণ এবং রিগ্রেশন গাছের পিছনে গণিত
- http://www.cs.put.poznan.pl/jstefanowski/sed/DM-5-newtrees.pdf
(যুক্ত) - http://www.ibe.med.uni-muenchen.de/organisation/mitarbeiter/020_professuren/boulesteix/pdf/gini.pdf
- https://www.youtube.com/watch?v=UMtBWQ2m04g
- http://www.ius-migration.ch/files/content/sites/imi/files/shared/documents/papers/Gini_index_fulltext.pdf
- /programming/4936788/decision-tree-learning-and-impurity
শ্যাননের এন্ট্রপি বর্ণনা করা হয়েছে:
এটি আমরা যে বহুবিধ ক্ষেত্রে পেয়েছি তাতে বাড়ানো:
শর্তসাপেক্ষ এন্ট্রপি নিম্নলিখিত হিসাবে সংজ্ঞায়িত করা হয়:
সম্ভাবনার অনুপাতের লগটি হঠাৎ পরিবর্তন সনাক্তকরণের জন্য ব্যবহৃত হয় এবং এগুলি ব্যবহার করে উদ্ভূত হয়। (আমার সামনে উদ্দীপনা নেই))
জিনি অপরিষ্কার:
- জিনি অপরিষ্কারের সাধারণ রূপটি হ'ল
থটস:
- অপরিষ্কারের একটি পরিমাপে বিভক্ত করা হয়। উচ্চ "বিশুদ্ধতা" সম্ভবত কম এন্ট্রপির সমান। পদ্ধতির সম্ভবত এনট্রপি মিনিমাইজেশনের সাথে সম্পর্কিত।
- সম্ভবত এটি অনুমান করা হয় যে ভিত্তি বিতরণ একরকম, বা সম্ভবত হাতে-তরঙ্গী সহ গাউসিয়ান। তারা সম্ভবত বিতরণের মিশ্রণ তৈরি করছে।
- আমি ভাবছি শেওহার্ট চার্ট ডেরাইভেশন যদি এখানে প্রয়োগ করতে পারে?
- জিআইএনআই অপরিচ্ছন্নতা 2 টি পরীক্ষার, এবং একটি সাফল্যের দ্বিপদী বিতরণের জন্য সম্ভাব্যতা ঘনত্ব ফাংশনের অবিচ্ছেদ্য বলে মনে হচ্ছে।
(অতিরিক্ত)
- ফর্মটি বিটা-বাইনোমিয়াল বিতরণের সাথেও সামঞ্জস্যপূর্ণ যা হাইপারজমেট্রিক বিতরণের আগে সম্মিলিত। হাইপারজেমেট্রিক পরীক্ষাগুলি প্রায়শই কোন নমুনায় প্রতিনিধিত্ব করা হয় বা কোনটির নিচে প্রদর্শিত হয় তা নির্ধারণ করতে ব্যবহৃত হয় are ফিশারের সঠিক পরীক্ষার সাথে একটি সম্পর্কও রয়েছে, যা কিছু হোক না কেন (স্বত্বে নোট করুন, এ সম্পর্কে আরও জানুন)।
সম্পাদনা: আমার সন্দেহ আছে যে জিনির একটি ফর্ম রয়েছে যা ডিজিটাল যুক্তি এবং / অথবা আরবি-ট্রিগুলির সাথে খুব ভালভাবে কাজ করে। আমি আশা করি এই শরতে একটি শ্রেণিক প্রকল্পে এটি অন্বেষণ করব।