লজিস্টিক রিগ্রেশন বনাম এলডিএ দ্বি-শ্রেণীর শ্রেণিবদ্ধ হিসাবে


36

আমি লিনিয়ার বৈষম্যমূলক বিশ্লেষণ এবং লজিস্টিক রিগ্রেশন মধ্যে পরিসংখ্যানগত পার্থক্য প্রায় আমার মাথা মোড়ানো চেষ্টা করছি । আমার বোধগম্যটি কি ঠিক যে, দুটি শ্রেণির শ্রেণিবদ্ধকরণ সমস্যার জন্য, এলডিএ দুটি সাধারণ ঘনত্বের ফাংশন (প্রতিটি শ্রেণীর জন্য একটি) পূর্বাভাস দেয় যা একটি লিনিয়ার সীমানা তৈরি করে যেখানে তারা ছেদ করে, যেখানে লজিস্টিক রিগ্রেশন কেবলমাত্র দুটি শ্রেণির মধ্যে লগ-বিজোড় ফাংশনটির পূর্বাভাস দেয়, যা একটি সীমানা তৈরি করে কিন্তু প্রতিটি শ্রেণীর জন্য ঘনত্বের কার্যগুলি গ্রহণ করে না?


একই ধরণের প্রশ্ন stats.stackexchange.com/q/14697/3277
ttnphns

সম্পর্কিত সম্পর্কিত উত্তর, stats.stackexchange.com/a/31466/3277
ttnphns

উত্তর:


35

আমার কাছে মনে হচ্ছে আপনি ঠিক আছেন। লজিস্টিক রিগ্রেশন প্রকৃতপক্ষে ভবিষ্যদ্বাণী ভেরিয়েবলের স্পেসে কোনও নির্দিষ্ট আকারের ঘনত্বগুলি গ্রহণ করে না, তবে এলডিএ তা করে। সংক্ষেপে দুটি বিশ্লেষণের মধ্যে কিছু পার্থক্য এখানে দেওয়া হল।

বাইনারি লজিস্টিক রিগ্রেশন (বিএলআর) বনাম লিনিয়ার বৈষম্য বিশ্লেষণ (২ টি গ্রুপ সহ: ফিশারের এলডিএ নামেও পরিচিত):

  • বিএলআর : সর্বাধিক সম্ভাবনার অনুমানের ভিত্তিতে। এলডিএ : স্বল্প স্কোয়ারের অনুমানের ভিত্তিতে; বাইনারি পূর্বাভাসের সাথে লিনিয়ার রিগ্রেশন সমতুল্য (গুণফলগুলি সমানুপাতিক এবং আর-বর্গক্ষেত্র = 1-উইলকের ল্যাম্বদা)।

  • বিএলআর : তাত্ক্ষণিকভাবে সম্ভাব্যতা (গ্রুপের সদস্যপদ) নির্ধারণ করে (পূর্বাভাসটি নিজেই সম্ভাবনা হিসাবে গ্রহণ করা হয়, পর্যবেক্ষণ করা হয়) এবং শর্তসাপেক্ষে। এলডিএ : মধ্যবর্তীভাবে সম্ভাব্যতার প্রাক্কলন করে (পূর্বাভাসটিকে বিন্যস্ত ধারাবাহিক পরিবর্তনশীল হিসাবে চিহ্নিত করা হয়, বৈষম্যমূলক) শ্রেণিবদ্ধ ডিভাইসের মাধ্যমে (যেমন নিষ্পাপ বায়েস) শর্তযুক্ত এবং প্রান্তিক তথ্য উভয়ই ব্যবহার করে।

  • বিএলআর : স্কেল স্তর এবং ভবিষ্যদ্বাণীকারীদের মধ্যে বিতরণের ফর্মের তুলনায় এতটা সুস্পষ্ট নয়। এলডিএ : প্রাক্কলনকারীরা মাল্টিভারিয়েট স্বাভাবিক বিতরণের সাথে অন্তর্বর্তী স্তর বাঞ্ছনীয়।

  • বিএলআর : ভবিষ্যদ্বাণীকারীদের মধ্যে গ্রুপ-কোভেরিয়েন্স ম্যাট্রিক্স সম্পর্কে কোনও প্রয়োজনীয়তা নেই। এলডিএ : গ্রুপের কোভেরিয়েন্স ম্যাট্রিকগুলি জনসংখ্যার ক্ষেত্রে অভিন্ন হওয়া উচিত ident

  • এনএন

  • বিএলআর : বিদেশিদের কাছে তেমন সংবেদনশীল নয়। এলডিএ : বহিরাগতদের কাছে বেশ সংবেদনশীল।

  • বিএলআর : তরুণ পদ্ধতি। এলডিএ : পুরানো পদ্ধতি।

  • বিএলআর : সাধারণত পছন্দসই, কারণ কম এক্সিজেন্ট / বেশি মজবুত। এলডিএ : এর সমস্ত প্রয়োজনীয়তা পূরণের সাথে সাথে প্রায়শই বিএলআর থেকে ভাল শ্রেণিবদ্ধ করা হয় (ততক্ষণে অ্যাসিম্পটোটিক আপেক্ষিক দক্ষতা 3/2 সময় বেশি)।


21

আমাকে @ttnphns সুন্দর তালিকায় কিছু পয়েন্ট যুক্ত করতে দিন:

  • এলডিএর উত্তরোত্তর শ্রেণীর সদস্যতার সম্ভাবনা নিয়ে বেইস ভবিষ্যদ্বাণীটিও একটি লজিস্টিক বক্ররেখা অনুসরণ করে।
    [এফ্রন, বি। সাধারণ বৈষম্যমূলক বিশ্লেষণের তুলনায় লজিস্টিক রিগ্রেশনের দক্ষতা, জে এম স্ট্যাট এসোসিয়েশন, 70, 892-898 (1975)]

  • যদিও সেই কাগজটি দেখায় যে এলডিএর অনুমানগুলি পূরণ করা হলে এলডিএর তুলনামূলক দক্ষতা এলআর তুলনায় উচ্চতর (রেফারেন্স: উপরের ইফ্রন পেপার, @tthnps এর শেষ পয়েন্ট), বাস্তবে পরিসংখ্যানগত শিক্ষার উপাদানগুলির অনুসারে কোনও পার্থক্য খুব কমই রয়েছে।
    [হাস্টি, টি। এবং তিবশিরানী, আর। এবং ফ্রেডম্যান, জে স্ট্যাটিস্টিকাল লার্নিং এর উপাদানসমূহ; ডেটা মাইনিং, ইনফারেন্স এবং প্রেডিকশন স্প্রিঞ্জার ভার্লাগ, নিউ ইয়র্ক, ২০০৯]

  • এলডিএর যে অপেক্ষাকৃত দক্ষতা বৃদ্ধি পেয়েছে বেশিরভাগ ক্ষেত্রে অ্যাসিম্পটোটিক ক্ষেত্রে ঘটে যেখানে পরম ত্রুটি কার্যতভাবে ততটা উপেক্ষিত না।
    [হ্যারেল, এফই এবং লি, কেএল বৈচিত্র্যময় স্বাভাবিকতার অধীনে বৈষম্যমূলক বিশ্লেষণ এবং লজিস্টিক রিগ্রেশন বৈষম্যের একটি তুলনা, বায়োস্টাটিস্টিক্স: বায়োমেডিক্যাল, জনস্বাস্থ্য ও পরিবেশ বিজ্ঞানের পরিসংখ্যান, ৩৩৩-৩৩৩ (১৯৮৫)।]

  • যদিও আমি অনুশীলনে উচ্চ মাত্রিক ছোট নমুনা আকারের পরিস্থিতিগুলির মুখোমুখি হয়েছি যেখানে এলডিএ উচ্চতর বলে মনে হয় (বহুভিত্তিক স্বাভাবিকতা এবং সমান কোভেরিয়েন্স ম্যাট্রিক্স অনুমান উভয়ই দৃশ্যমানভাবে পূরণ হয়নি)।
    [ বেলাইটস, সি .; গিজার, কে।; কির্ছ, এম ;; সোবোটকা, এসবি; শ্যাকার্ট, জি। ও সালজার, আর। রমন অ্যাস্ট্রোকাইটোমা টিস্যুগুলির বর্ণালী গ্রেডিং: নরম রেফারেন্স তথ্য ব্যবহার করে Anal, অ্যানাল বায়ানাল কেম, 400, 2801-2816 (2011)। ডিওআই: 10.1007 / s00216-011-4985-4 ]

  • তবে মনে রাখবেন যে আমাদের কাগজে এলআর সম্ভবত সমস্যাটির সাথে লড়াই করছে যা (কাছাকাছি) নিখুঁত পৃথকীকরণের সাথে দিকনির্দেশগুলি খুঁজে পেতে পারে with অন্যদিকে এলডিএ কম মারাত্মকভাবে অত্যধিক মানানসই হতে পারে।

  • এলডিএর জন্য বিখ্যাত অনুমানগুলি কেবল অনুকূলতা প্রমাণের জন্য প্রয়োজন। যদি সেগুলি পূরণ না করা হয়, তবে পদ্ধতিটি এখনও ভাল উত্তরাধিকারী হতে পারে।

  • একটি পার্থক্য যা অনুশীলনে আমার পক্ষে গুরুত্বপূর্ণ কারণ আমি মাঝে মাঝে / ঘন ঘন ঘন ঘন ঘন শ্রেণিবদ্ধকরণের সমস্যাগুলি দেখা করি তা প্রকৃতপক্ষে স্পষ্টত শ্রেণিবদ্ধকরণের সমস্যা নয়: এলআর সহজেই ডেটা দিয়ে সম্পন্ন করা যেতে পারে যেখানে রেফারেন্সের মধ্যবর্তী স্তরের সদস্যপদ রয়েছে। সর্বোপরি, এটি একটি রিগ্রেশন কৌশল।
    [উপরে লিঙ্কযুক্ত কাগজ দেখুন]

  • আপনি বলতে পারেন যে এলআর ক্লাসের সীমানার কাছাকাছি উদাহরণগুলিতে এলডিএর চেয়ে বেশি মনোনিবেশ করে এবং বিতরণগুলির "পিছনে" মামলাগুলিকে অবহেলা করে।

  • এটি এলডিএর তুলনায় কেন বহিরাগতদের কাছে (যেমন পিছনের দিকে) কম সংবেদনশীল তাও এটি ব্যাখ্যা করে।

  • (সমর্থন ভেক্টর মেশিনগুলি এমন একটি শ্রেণিবদ্ধ হবে যা এই দিকটি একেবারে শেষ দিকে চলে যায়: এখানে সীমান্তে থাকা মামলাগুলি বাদ দিয়ে সবকিছুই অবহেলা করা হয়)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.