ক্লাসগুলি ভালভাবে বিচ্ছিন্ন হয়ে গেলে লজিস্টিক রিগ্রেশনটির জন্য প্যারামিটারের অনুমানগুলি আশ্চর্যজনকভাবে অস্থির হয়। গুণাগুণগুলি অনন্ত যেতে পারে। এলডিএ এই সমস্যায় ভুগছে না।
যদি কোভেরিয়েট মান থাকে যা বাইনারি ফলাফলের সঠিকভাবে পূর্বাভাস দিতে পারে তবে লজিস্টিক রিগ্রেশন, অর্থাৎ ফিশার স্কোরিংয়ের অ্যালগোরিদম এমনকি রূপান্তরিত করে না। আপনি যদি আর বা এসএএস ব্যবহার করে থাকেন তবে আপনি একটি সতর্কতা পাবেন যে শূন্যের সম্ভাবনাগুলি গণনা করা হয়েছিল এবং অ্যালগরিদম ক্র্যাশ হয়েছে। এটি নিখুঁত পৃথকীকরণের চূড়ান্ত ক্ষেত্রে তবে ডেটা কেবলমাত্র একটি দুর্দান্ত ডিগ্রীতে পৃথক করা হয় এবং নিখুঁতভাবে না হলেও সর্বাধিক সম্ভাবনা অনুমানকারী উপস্থিত নাও হতে পারে এবং এটি উপস্থিত থাকলেও অনুমানগুলি নির্ভরযোগ্য নয়। ফলস্বরূপ ফিটটি মোটেই ভাল নয়। এই সাইটে বিচ্ছেদের সমস্যা নিয়ে কাজ করার জন্য অনেকগুলি থ্রেড রয়েছে তাই সর্বদা এক নজরে দেখুন।
বিপরীতে, ফিশারের বৈষম্যমূলক আচরণের সাথে প্রায়শই অনুমানের সমস্যার মুখোমুখি হয় না। এটি এখনও ঘটতে পারে যদি কোভারিয়েন্স ম্যাট্রিক্সের মধ্যে বা এর মধ্যে হয় তবে একক হয় তবে এটি একটি বিরল উদাহরণ। প্রকৃতপক্ষে, যদি সম্পূর্ণ বা আধা-সম্পূর্ণ বিচ্ছেদ হয় তবে সমস্ত ভাল কারণ বৈষম্যমূলক সফল হওয়ার সম্ভাবনা বেশি।
এটিও উল্লেখযোগ্য যে জনপ্রিয় বিশ্বাসের বিপরীতে এলডিএ কোনও বিতরণ অনুমানের ভিত্তিতে নয়। আমাদের কেবল স্পষ্টতই জনসংখ্যার কোভরিয়েন্স ম্যাট্রিক্সের সমতা প্রয়োজন কারণ পোলড অনুমানকারী কোভেরিয়েন্স ম্যাট্রিক্সের মধ্যে ব্যবহার করা হয়। স্বাভাবিকতার অতিরিক্ত অনুমান, সমান পূর্বের সম্ভাব্যতা এবং ভুল শ্রেণিবদ্ধকরণ ব্যয়ের অধীনে, এলডিএ এই অর্থে সর্বোত্তম যে এটি ভুল-শ্রেণিবদ্ধকরণ সম্ভাবনা হ্রাস করে।
এলডিএ কীভাবে নিম্ন-মাত্রিক দর্শন দেয়?
দুটি জনসংখ্যা এবং দুটি ভেরিয়েবলের ক্ষেত্রে এটি দেখতে আরও সহজ। এই ক্ষেত্রে এলডিএ কীভাবে কাজ করে তার চিত্রিত উপস্থাপনা এখানে। মনে রাখবেন যে আমরা ভেরিয়েবলগুলির লিনিয়ার সংমিশ্রণগুলি সন্ধান করছি যা বিচ্ছিন্নতা সর্বাধিক করে তোলে।
অতএব ডেটা ভেক্টরটির জন্য অনুমান করা হয় যার দিকনির্দেশ এই বিচ্ছেদটি আরও ভালভাবে অর্জন করে। আমরা কীভাবে আবিষ্কার করি যে ভেক্টরটি লিনিয়ার বীজগণিতের একটি আকর্ষণীয় সমস্যা, আমরা মূলত একটি রেলেইগ ভাগফলকে সর্বাধিক করে তুলি তবে আসুন এখনই এটিকে একপাশে রেখে দিন। যদি সেই ভেক্টরের উপর ডেটা প্রজেক্ট করা হয়, তবে মাত্রাটি দুটি থেকে এক থেকে কমে গেছে।
পিছ মিনিট ( ছ- 1 , পি )
যদি আপনি আরও ভাল বা কনস নামকরণ করতে পারেন, এটি দুর্দান্ত।
নিম্ন-মাত্রিক প্রতিনিধিত্ব তবুও ত্রুটিগুলি ব্যতীত আসে না, সবচেয়ে গুরুত্বপূর্ণ হ'ল অবশ্যই তথ্য হারাতে। ডেটা রৈখিকভাবে পৃথকভাবে পৃথক করার সময় এটি কোনও সমস্যার কম হয় তবে সেগুলি না হলে তথ্যের ক্ষয়ক্ষতি যথেষ্ট হতে পারে এবং শ্রেণিবদ্ধী খুব খারাপ আচরণ করতে পারে।
এমন কিছু ঘটনাও ঘটতে পারে যেখানে কোভেরিয়েন্স ম্যাট্রিক্সের সাম্যতা একটি স্থায়ী ধারণা নাও হতে পারে। আপনি এটি নিশ্চিত করার জন্য একটি পরীক্ষা নিযুক্ত করতে পারেন তবে এই পরীক্ষাগুলি স্বাভাবিকতা থেকে বিদায় নেওয়ার পক্ষে অত্যন্ত সংবেদনশীল তাই আপনার এই অতিরিক্ত অনুমান করা এবং এটির জন্য পরীক্ষাও করা দরকার। যদি এটিতে পাওয়া যায় যে অসম কোভেরিয়েন্স ম্যাট্রিক্সের সাথে জনসংখ্যা স্বাভাবিক থাকে তবে পরিবর্তে একটি চতুর্ভুজ শ্রেণিবিন্যাসের নিয়ম ব্যবহার করা যেতে পারে (কিউডিএ) তবে আমি দেখতে পাচ্ছি যে এটি একটি বরং বিশ্রী নিয়ম, উচ্চ মাত্রায় বিপরীতে উল্লেখ করার জন্য নয়।
সামগ্রিকভাবে, এলডিএর প্রধান সুবিধা হ'ল একটি সুস্পষ্ট সমাধানের উপস্থিতি এবং এর গণ্য সুবিধার যা এসভিএম বা নিউরাল নেটওয়ার্কগুলির মতো আরও উন্নত শ্রেণিবিন্যাস কৌশলগুলির ক্ষেত্রে নয়। আমরা যে মূল্য দিচ্ছি তা হ'ল অনুমানের সেট যা লিনিয়ার বিচ্ছিন্নতা এবং সমবায় ম্যাট্রিক্সের সমতা।
আশাকরি এটা সাহায্য করবে.
সম্পাদনা : আমি আমার দাবি সন্দেহ করি যে এলডিএ যে নির্দিষ্ট ক্ষেত্রে উল্লেখ করেছি সেগুলি সম্পর্কে সমবায় ম্যাট্রিক্সের সাম্যতা ব্যতীত অন্য কোনও বিতরণী অনুমানের প্রয়োজন নেই, আমাকে ডাউনওয়েতে ব্যয় করেছে। তবুও এটি কম সত্য নয় তবে আমাকে আরও নির্দিষ্ট করে তুলুন।
এক্স¯আমি, i = 1 , 2 এসpooled
সর্বোচ্চএকটি( ক)টিএক্স¯1- কটিএক্স¯2)2একটিটিএসpooledএকটি= সর্বাধিকএকটি( ক)টিd )2একটিটিএসpooledএকটি
এই সমস্যার সমাধান (একটি ধ্রুবক পর্যন্ত) দেখানো যেতে পারে
a = এস- 1pooledd = এস- 1pooled( এক্স¯1- এক্স¯2)
এটি আপনি যে এলডিএর স্বাভাবিকতা, সমান কোভেরিয়েন্স ম্যাট্রিক্স, বিযুক্তি ব্যয় এবং পূর্বের সম্ভাব্যতার অনুমানের অধীনে সমান, তাই না? তবে হ্যাঁ, এখন যে আমরা ছাড়া নি স্বাভাবিক বাঁধলাম।
কোভারিয়েন্স ম্যাট্রিক্স সত্যই সমান না হলেও, সমস্ত সেটিংসে উপরের বৈষম্যমূলক ব্যবহার থেকে আপনাকে বিরত করার কিছুই নেই। এটি ভুলবিত্তের প্রত্যাশিত ব্যয়ের (ইসিএম) বিবেচনায় অনুকূল নাও হতে পারে তবে এটি তদারকি করা তত্ত্বাবধান হয় যাতে আপনি সর্বদা হোল্ড-আউট পদ্ধতি ব্যবহার করে এর কার্যকারিতা মূল্যায়ন করতে পারেন।
তথ্যসূত্র
বিশপ, প্যাটার্ন স্বীকৃতির জন্য ক্রিস্টোফার এম নিউরাল নেটওয়ার্কগুলি। অক্সফোর্ড বিশ্ববিদ্যালয় প্রেস, 1995।
জনসন, রিচার্ড আর্নল্ড, এবং ডিন ডব্লিউ। উইচারন hern মাল্টিভারিয়েট পরিসংখ্যান বিশ্লেষণ প্রয়োগ করা হয়েছে। ভোল। 4. এনগলউড ক্লিফস, এনজে: প্রিন্টাইস হল, 1992 1992