লজিস্টিক রিগ্রেশন মধ্যে ওও (প্রমাণের ওজন) দ্বারা পরিবর্তনীয় প্রতিস্থাপন


14

এটি একটি অনুশীলন বা পদ্ধতি যা আমার কয়েকজন সহকর্মী অনুসরণ করে regarding লজিস্টিক রিগ্রেশন মডেলটি তৈরি করার সময় আমি দেখেছি লোকেরা শ্রেণিবদ্ধ ভেরিয়েবলগুলি (বা ধ্রুবক ভেরিয়েবলগুলি যা বাইন হয়) তাদের নিজ নিজ ওজনের প্রমাণ (ওও) দিয়ে প্রতিস্থাপন করে। অনুমিত এবং নির্ভরশীল ভেরিয়েবলের মধ্যে মনোটোনিক সম্পর্ক স্থাপনের জন্য এটি করা হয় বলে মনে করা হয় । এখন যতদূর আমি বুঝতে পারি, একবার মডেলটি তৈরি হয়ে গেলে সমীকরণের ভেরিয়েবলগুলি ডেটাসেটের ভেরিয়েবল নয়। বরং সমীকরণের ভেরিয়েবলগুলি এখন নির্ভরশীল ভেরিয়েবলকে আলাদা করার ক্ষেত্রে ভেরিয়েবলের গুরুত্ব বা ওজনের ধরণের !

আমার প্রশ্ন: আমরা এখন মডেল বা মডেল সহগগুলি কীভাবে ব্যাখ্যা করব? উদাহরণস্বরূপ নিম্নলিখিত সমীকরণের জন্য:

log(p1p)=β0+β1x1

আমরা বলতে পারি হল ভেরিয়েবল এক্স 1 এর 1 ইউনিট বৃদ্ধির জন্য বিজোড়ের অনুপাতের তুলনামূলক বৃদ্ধিexp(β1) x1

তবে যদি ভেরিয়েবলটি তার ওওউ দ্বারা প্রতিস্থাপিত হয়, তবে তার ব্যাখ্যাটি পরিবর্তিত হবে: ভেরিয়েবলের ইম্পোর্ট / ওজনে 1 ইউনিট বৃদ্ধির জন্য বিজোড়ের অনুপাতের তুলনামূলক বৃদ্ধি

আমি ইন্টারনেটে এই অনুশীলনটি দেখেছি, তবে কোথাও এই প্রশ্নের উত্তর পাই না। এই সম্প্রদায়ের এই লিঙ্কটি নিজেই কিছুটা অনুরূপ প্রশ্নের সাথে সম্পর্কিত যেখানে কেউ লিখেছেন:

ওও বৈষম্যের অনুপাতের প্রাকৃতিক লোগারিদমের সাথে একটি লিনিয়ার সম্পর্ক প্রদর্শন করে যা লজিস্টিক রিগ্রেশনে নির্ভরশীল পরিবর্তনশীল। সুতরাং, যখন আমরা ভেরিয়েবলের আসল মানগুলির পরিবর্তে ওওউ ব্যবহার করি তখন মডেল অপব্যবহারের প্রশ্নটি লজিস্টিক রিগ্রেশনে উত্থিত হয় না।

তবে আমি এখনও এর ব্যাখ্যা পাই না। আমি কী অনুপস্থিত তা বুঝতে দয়া করে আমাকে সহায়তা করুন।


exp(β1)x1x1

β0

প্রতিক্রিয়াগুলি হল p / (1-p), সুতরাং p (x) = exp (𝛽0 + 𝛽1x) এবং p (x + 1) = exp (𝛽0 + 𝛽1x + 𝛽1) নোট করুন যে পি (x + 1) = এক্সপ্রেস (𝛽0 + 𝛽1x) এক্সপ্রেস (𝛽1) এবং অবশেষে বিজোড় অনুপাত পি (x + 1) / পি (এক্স) = এক্সপ্রেস (𝛽1) হিসাবে বলা হয়েছে stats.stackexchange.com/users/7290/gung
hwrd

উত্তর:


12

ওও পদ্ধতিতে দুটি ধাপ রয়েছে:

1 - কয়েকটি বিভাগে বিভক্ত (একটানা) ভেরিয়েবল বা গ্রুপে (একটি বিচ্ছিন্ন) ভেরিয়েবলকে কয়েকটি বিভাগে বিভক্ত করা (এবং উভয় ক্ষেত্রেই আপনি ধরে
নিলেন যে একটি বিভাগের সমস্ত পর্যবেক্ষণ নির্ভরশীল ভেরিয়েবলের উপর "একই" প্রভাব ফেলেছে) 2 - ওও গণনা করতে প্রতিটি বিভাগের জন্য মান (তারপরে মূল এক্স মানগুলি ওউ মানগুলি দ্বারা প্রতিস্থাপিত হবে)

ওও রূপান্তরটির তিনটি ইতিবাচক প্রভাব রয়েছে:
1) এটি একটি স্বতন্ত্র ভেরিয়েবলকে রূপান্তর করতে পারে যাতে এটি নির্ভরশীল ভেরিয়েবলের সাথে একঘেয়ে সম্পর্ক স্থাপন করে। প্রকৃতপক্ষে এটি এর চেয়ে আরও বেশি কিছু করে - একজাতীয় সম্পর্ককে সুরক্ষিত করার জন্য এটি কোনও আদেশকৃত পরিমাপের (উদাহরণস্বরূপ 1,2,3,4 ...) এটি "পুনরুদ্ধার" করার পক্ষে যথেষ্ট তবে ওও রূপান্তর আসলে "লজিস্টিক" বিভাগগুলিকে অর্ডার করে "স্কেল যা লজিস্টিক রিগ্রেশনের জন্য প্রাকৃতিক
2) অনেকগুলি (স্পর্শযুক্ত জনবহুল) বিচ্ছিন্ন মানগুলির সাথে ভেরিয়েবলগুলির জন্য এগুলি বিভাগগুলিতে ভাগ করা যায় (ঘন জনবহুল) এবং ওও সমগ্র বিভাগের জন্য তথ্য প্রকাশ করতে ব্যবহার করা যেতে পারে
3) নির্ভরশীল ভেরিয়েবলের উপর প্রতিটি বিভাগের (অবিচ্ছিন্ন) প্রভাবটি কেবল বিভাগের মধ্যে এবং ভেরিয়েবলের সাথে তুলনা করা যেতে পারে কারণ ওউ মানকৃত মান (উদাহরণস্বরূপ আপনি বিবাহিত ব্যক্তির ওউকে ম্যানুয়াল কর্মীদের ওওয়ের সাথে তুলনা করতে পারেন)


এটিতেও ( কমপক্ষে) তিনটি ত্রুটি রয়েছে: ১) কয়েকটি বিভাগে বিনিংয়ের কারণে তথ্য হ্রাস (প্রকরণ)
2) এটি একটি "অবিবাহিত" পরিমাপ তাই এটি স্বাধীন ভেরিয়েবলের মধ্যে সম্পর্ককে বিবেচনা করে না
3) এটি সহজ বিভাগগুলি কীভাবে তৈরি করা হয় তার অনুসারে ভেরিয়েবলের প্রভাব হস্তান্তর (ওভারফিট) ip

প্রচলিতভাবে, রিগ্রেশন-এর বিটাগুলি (যেখানে x ওও দ্বারা প্রতিস্থাপিত হয়েছে) প্রতি সেখাকে ব্যাখ্যা করা হয় না তবে "স্কোর" পাওয়ার জন্য ওওয়ের সাথে বহুগুণ হয় (উদাহরণস্বরূপ পরিবর্তনশীল "বৈবাহিক স্থিতির জন্য বিটা" ওউ'র সাথে গুণ করা যায়) বিবাহিত ব্যক্তিদের স্কোর দেখতে "বিবাহিত লোক" গোষ্ঠী; পরিবর্তনশীল "পেশার" জন্য বিটা ম্যানুয়াল কর্মীদের স্কোর দেখতে "ম্যানুয়াল কর্মীদের" ওউ দ্বারা গুণিত করা যেতে পারে then আপনি এই দুটি স্কোর যোগফল এবং ফলাফলের উপর প্রভাব কত দেখুন)। স্কোর যত বেশি, 1 এর সমান ফলাফলের সম্ভাবনা তত বেশি।


1
(+1) ভবিষ্যদ্বাণীকে প্রতিক্রিয়াটির সাথে একঘেয়েত সম্পর্ক রাখার পুনরুদ্ধার করা কেন একটি সুবিধা?
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

1
@ স্কোর্টচি আমি একটি উদাহরণটি ভাবতে পারি - স্বাধীন পরিবর্তনশীলটি মানুষের উচ্চতা (সেমি মাপা হয়), লোকেরা সুন্দর পোশাকের জন্য কেনাকাটা করতে চলেছে, নির্ভরশীল পরিবর্তনশীলটি বাইনারি ইভেন্ট হতে পারে - তারা উপযুক্ত এবং আরামদায়ক পোশাক কিনতে পারে বা না পারে কিনা whether স্পষ্টতই খুব ছোট এবং খুব লম্বা লোকদের উপযুক্ত পোশাক কিনতে অসুবিধা হবে, যখন মাঝখানে লোকেরা খুব সহজেই এটি করতে পারত।
সাধারণের

1
লোকেরা সাধারণত ভবিষ্যদ্বাণীকারীদের নন-মনোটোনিক রূপান্তর ব্যবহার করে না - যাইহোক অভিজ্ঞতামূলক মডেলিংয়ে নয়। মিথস্ক্রিয়া অন্তর্ভুক্ত শর্তসাপেক্ষে অ-মনোোটোনিক সম্পর্ক সরিয়ে বা পরিচয় করিয়ে দিতে পারে, যেমন অন্যান্য ভবিষ্যদ্বাণীকারীদেরও অন্তর্ভুক্ত। তবে বহিরাগত বা স্প্লাইন ভিত্তিক ক্রিয়াকলাপের সাথে একজন ভবিষ্যদ্বাণীকে প্রতিনিধিত্ব করা তাদের জন্য অনুমতি দেওয়ার সহজ সরল উপায়; & অন্যটি এটি বিন্যস্ত করছে এবং এরপরে উদাহরণস্বরূপ রেফারেন্স-লেভেল কোডিং ব্যবহার করে শ্রেণিবদ্ধ হিসাবে আচরণ করছে। সর্বশেষে, অন্ততপক্ষে, এই ওউ রূপান্তর চেয়ে যথেষ্ট সহজ; কেউই ক্ষয়ক্ষতি ভাগ করে না ...
স্কোর্তচি - মনিকা পুনরায় স্থাপন করুন

1
... প্রতিক্রিয়া শর্তাবলী একটি ভবিষ্যদ্বাণী সংজ্ঞায়িত থেকে অনুমান এবং ব্যাখ্যাযোগ্যতা; প্রান্তিক সম্পর্ক একঘেয়ে (বা বিপরীত) হলেও এমনকি সমস্ত অ-একঘেয়েমিক শর্তসাপেক্ষ সম্পর্ককে মডেল করার অনুমতি দেয়। আমি মনে করি আমি যা পাচ্ছি তা হ'ল ওও রূপান্তরটি আমার কাছে সমস্যার সন্ধানের সমাধান বলে মনে হচ্ছে। এমন একটি শ্রেণির পরিস্থিতি রয়েছে যেখানে এটি আরও বহুল ব্যবহৃত পদ্ধতির চেয়ে আরও ভাল পূর্বাভাস দেয়? - যদিও আপনি এখানে উত্তর দিয়েছেন তার কাছে এটি আলাদা প্রশ্ন (সম্ভবত stats.stackexchange.com/q/166816/17230 )।
স্কর্চচি - মনিকা পুনরায় ইনস্টল করুন

আপনার যদি ইতিমধ্যে শ্রেণিবদ্ধ ডেটা থাকে তবে কী হবে? তাহলে কি একমাত্র সুবিধা "একঘেয়ে সম্পর্ক স্থাপন করা"? মনে হচ্ছে দুর্ভোগ সমালোচনা উপাদান মত binning প্রক্রিয়ায় আসলে
information_interchange

7

লজিস্টিক রিগ্রেশনে ডাব্লুএইউই ব্যবহার করার যুক্তি হ'ল যা কখনও কখনও সেমি-নাইভ বায়সিয়ান ক্লাসিফায়ার (এসএনবিসি) নামে পরিচিত। এই ব্লগ পোস্টটির শুরুটি জিনিসগুলি বেশ ভালভাবে ব্যাখ্যা করে: http://multithreaded.stitchfix.com/blog/2015/08/13/ight-of-evidence/

মডেলটির বিটা প্যারামিটারগুলি হ'ল অন্যান্য ভবিষ্যদ্বাণীকের উপস্থিতির কারণে প্রতিটি নিখুঁত প্রভাব (ওরফ-অফ-প্রুফফুলি) এর রৈখিক পক্ষপাত এবং তাদের উপস্থিতির কারণে নির্দিষ্ট ভবিষ্যদ্বাণীকের লগ প্রতিক্রিয়ায় রৈখিক পরিবর্তন হিসাবে ব্যাখ্যা করা যেতে পারে অন্যান্য ভবিষ্যদ্বাণীকারী।


1

ওয়েট অব এভিডেন্স (ওও) পরিবর্তনশীল রূপান্তর ও নির্বাচন সঞ্চালনের শক্তিশালী কৌশল। ভাল বনাম খারাপ গ্রাহকদের পৃথকীকরণ পরিমাপের জন্য এটি ক্রেডিট স্কোরিংয়ে ব্যাপকভাবে ব্যবহৃত হয় vari (পরিবর্তনশীল)। সুবিধাগুলি :: - অনুপস্থিত মানগুলি পরিচালনা করে হ্যান্ডলগুলি আউটলিয়ারদের হ্যান্ডলগুলি ট্রান্সফর্মেশন বিতরণের লগরিদমিক মানের উপর ভিত্তি করে। সঠিক বিন্ন কৌশলটি ব্যবহার করে ডামি ভেরিয়েবলের প্রয়োজন হয় না এটি বিটিডব্লিউটি স্বতন্ত্র ও নির্ভরশীল সংস্থার সম্পর্ক স্থাপন করতে পারে।

mono_bin () = সংখ্যার ভেরিয়েবলের জন্য ব্যবহৃত। চর_বিন () = অক্ষর ভেরিয়েবলের জন্য ব্যবহৃত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.