পি এর ক্ষেত্রে লজিস্টিক রিগ্রেশন সম্পর্কিত আপেক্ষিক পরিবর্তনশীল তাত্পর্যকে কীভাবে মাপ করবেন?


11

মনে করুন কোনও অনলাইন ক্রেতা কোনও পণ্য ক্রয় করবেন কিনা তা ভবিষ্যদ্বাণী করার জন্য কোনও লজিস্টিক রিগ্রেশন মডেল ব্যবহার করা হয়েছে (ফলাফল: ক্রয়), তিনি অনলাইন বিজ্ঞাপনগুলির একটি সেট ক্লিক করার পরে (ভবিষ্যদ্বাণীকারী: অ্যাড 1, অ্যাড 2 এবং অ্যাড 3)।

ফলাফলটি বাইনারি ভেরিয়েবল: 1 (ক্রয়কৃত) বা 0 (পূর্বচর্চা নয়)। ভবিষ্যদ্বাণীকারীরাও বাইনারি ভেরিয়েবল: 1 (ক্লিক করা) বা 0 (ক্লিক করা হয়নি)। সুতরাং সমস্ত পরিবর্তনশীল একই স্কেল হয়।

যদি অ্যাড 1, অ্যাড 2 এবং অ্যাড 3 এর ফলাফলযুক্ত সহগগুলি 0.1, 0.2, এবং 03 হয় তবে আমরা উপসংহারে আসতে পারি যে অ্যাড 3 অ্যাড 2 এর চেয়ে বেশি গুরুত্বপূর্ণ, এবং অ্যাড 2 অ্যাড 1 এর চেয়ে বেশি গুরুত্বপূর্ণ more তদ্ব্যতীত, সমস্ত ভেরিয়েবলগুলি একই স্কেলে হয়, তাই মানকযুক্ত এবং মানহীন মানের গুণাগুণ একই হওয়া উচিত এবং আমরা আরও উপসংহারে পৌঁছে যেতে পারি যে লগাইট (লগ-প্রতিক্রিয়া) স্তরের প্রভাবের দিক থেকে অ্যাড 2 এর চেয়ে দ্বিগুণ গুরুত্বপূর্ণ Ad

তবে অনুশীলনে আমরা পি (ক্রয়ের সম্ভাবনা) স্তরের দিক দিয়ে ভেরিয়েবলগুলির আপেক্ষিক গুরুত্বের তুলনা এবং ব্যাখ্যা কীভাবে করা যায় সে সম্পর্কে আরও যত্নশীল, লগিট (লগ-প্রতিক্রিয়া) নয়।

সুতরাং প্রশ্নটি হল: পি এর ক্ষেত্রে এই ভেরিয়েবলগুলির আপেক্ষিক গুরুত্বকে প্রমাণ করার জন্য কোনও পন্থা রয়েছে কি?


আমি এই নিবন্ধটি দরকারী বলে মনে করি। এটি ছয়টি পৃথক পদ্ধতির বর্ণনা করে যা প্রতিটি পদ্ধতির সাথে যুক্ত প্রসেস এবং কনসগুলির সাথে একটি লজিস্টিক রিগ্রেশন মডেল থেকে প্রেডিক্টর গুরুত্ব সংজ্ঞায়িত করতে ব্যবহার করা যেতে পারে।
গ্যাচস

উত্তর:


5

লিনিয়ার মডেলগুলির জন্য আপনি প্রতিটি মডেল প্যারামিটারের জন্য টি-পরিসংখ্যানের পরম মান ব্যবহার করতে পারেন।

এছাড়াও, আপনি এলোমেলো ফোরস্টের মতো কিছু ব্যবহার করতে পারেন এবং বৈশিষ্ট্য আমদানির খুব সুন্দর একটি তালিকা পেতে পারেন।

যদি আপনি আর চেক আউট ব্যবহার করেন ( http://care.r-forge.r-project.org/varimp.html ), আপনি যদি পাইথন ব্যবহার করেন ( http://scikit-learn.org/stable/auto_ex উদাহরণ / সেনসাম্বল / স্প্লট_ফরোস্ট_মোপারটেন্সস html#example-ensemble-plot- ফরেস্ট-ইম্পোর্ট্যান্স- জিপি )

সম্পাদনা করুন:

যেহেতু লগইটের এটি করার সরাসরি কোনও উপায় নেই আপনি প্রতিটি অনুমানকারীর জন্য একটি আরওসি বক্ররেখা ব্যবহার করতে পারেন।

শ্রেণিবিন্যাসের জন্য, প্রতিটি ভবিষ্যদ্বাণীকের উপর আরওসি বক্ররেখা বিশ্লেষণ পরিচালিত হয়। দুটি শ্রেণির সমস্যার জন্য, ক্লাসের পূর্বাভাস দেওয়ার জন্য ভবিষ্যদ্বাণীকারী ডেটাতে একটি সিরিজ কাট অফস প্রয়োগ করা হয়। সংবেদনশীলতা এবং নির্দিষ্টতা প্রতিটি কাট অফের জন্য গণনা করা হয় এবং আরওসি বক্ররেখা গণনা করা হয়। ট্রপিজয়েডাল নিয়মটি আরওসি বক্ররেখার অধীনে অঞ্চলটি গণনা করতে ব্যবহৃত হয়। এই অঞ্চলটি পরিবর্তনশীল গুরুত্বের পরিমাপ হিসাবে ব্যবহৃত হয়

এটি আর-তে কীভাবে কাজ করে তার একটি উদাহরণ:

library(caret)
mydata <- data.frame(y = c(1,0,0,0,1,1),
                 x1 = c(1,1,0,1,0,0),
                 x2 = c(1,1,1,0,0,1),
                 x3 = c(1,0,1,1,0,0))

fit <- glm(y~x1+x2+x3,data=mydata,family=binomial())
summary(fit)

varImp(fit, scale = FALSE)

1
আপনার উত্তর দেওয়ার জন্য ধন্যবাদ! হ্যাঁ লিনিয়ার মডেল এবং এলোমেলো বনের জন্য এটি সহজ, লজিস্টিক রিগ্রেশন ক্ষেত্রে এটি কীভাবে করা যায় আপনার কোনও ধারণা আছে? অনেক ধন্যবাদ!
xyhzc

উপরে সম্পাদনা দেখুন।
মাইক 1886

দেখে মনে হচ্ছে অনুপাত-স্তর তুলনা সম্পর্কে প্রশ্নের এখনও উত্তর দেওয়া হয়নি। এমনকি যদি আমরা জানি যে AUC কেবলমাত্র x2 এবং .9 মাত্র x2 ব্যবহার করে, বলুন, আমরা খুব কমই বলতে পারি যে x2 এর গুরুত্ব তাই 50% বেশি। এবং, আমি মনে করি, এটি (1 - 10% / 40%) = 75% বেশি। আমরা কেবল সংবেদনশীলতা বা সুনির্দিষ্টতা ব্যবহার করে সাদৃশ্যপূর্ণ কিছু করতে পারি না। ওয়াল্ড পরিসংখ্যানগুলির প্রয়োগযোগ্যতা সম্পর্কে আমার এখানে সন্দেহ আছে। সর্বাধিক সহায়ক হতে পারে মানযুক্ত গুণাগুণগুলির ব্যাখ্যা (স্কট মেনার্ডের অনলাইন বইটি দেখুন)।
Rolando2

ধন্যবাদ রোল্যান্ডো 2! এই প্রশ্নের ভেরিয়েবলগুলি একই মেট্রিক্সের সমস্ত পদক্ষেপ, সুতরাং মানক এবং মানহীন মানফলকগুলি একই হওয়া উচিত। তদ্ব্যতীত, যদিও আমরা লজিট (লগ-প্রতিক্রিয়া) স্তরে ভেরিয়েবলগুলি তুলনা করতে প্রমিত মানের সহগ ব্যবহার করতে পারি, তবে কীভাবে আমরা পি-তে ভেরিয়েবলগুলি ব্যাখ্যা করতে পারি (এক্ষেত্রে অনলাইন ক্রেতাদের কেনার সম্ভাবনা)? অনেক ধন্যবাদ!
xyhzc

1
আমি প্রশ্নের উত্তর দেখতে পাচ্ছি না।
হ্যালো ওয়ার্ল্ড

4

যেহেতু আপনি সম্ভাব্যতার স্কেলটির জন্য বিশেষভাবে ব্যাখ্যা চেয়েছিলেন: লজিস্টিক রিগ্রেশনে, সাফল্যের আনুমানিক সম্ভাবনা দেওয়া হয়

π^(x)=exp(β0+βx)1+exp(β0+βx)

β0βx

exp(0.1)1+exp(0.1)=0.52

একজন ব্যক্তি যিনি কেবল বিজ্ঞাপন 3 ক্লিক করেছেন:

exp(0.3)1+exp(0.3)=0.57

তবে, যদি ব্যক্তি বিজ্ঞাপন 1 বা বিজ্ঞাপন 3 ক্লিক করে তবে বিজ্ঞাপন 2 (যদি এটি প্লাজুবিলের দৃশ্য হয়) তবে সম্ভাবনাগুলি হয়ে যায়

exp(0.1+0.2)1+exp(0.1+0.2)=0.57

exp(0.3+0.2)1+exp(0.3+0.2)=0.62

এই ক্ষেত্রে সম্ভাবনার পরিবর্তনটি উভয়ই 0.05, তবে সাধারণত স্তরগুলির বিভিন্ন সংমিশ্রণের জন্য এই পরিবর্তনটি এক রকম হয় না। (আপনি উদাহরণস্বরূপ উপরের মত একই পদ্ধতির ব্যবহার করে তবে সহগ: 0.1, 1.5, 0.3 ব্যবহার করতে পারেন তবে এটি সহজেই দেখতে পাবেন)) সুতরাং, সম্ভাব্যতার স্কেলটিতে একটি ভেরিয়েবলের গুরুত্ব অন্যান্য ভেরিয়েবলগুলির পর্যবেক্ষণ স্তরের উপর নির্ভরশীল। এটি সম্ভাব্যতার স্কেলে একটি নিখুঁত, পরিমাণগত পরিবর্তনশীল গুরুত্ব পরিমাপের সাথে সামনে আসতে শক্ত (অসম্ভব?) করতে পারে।


তোমার ব্যাখ্যার জন্য ধন্যবাদ! তাহলে আপনি কি জানেন যে ভবিষ্যদ্বাণীকারীদের আপেক্ষিক গুরুত্বকে প্রমাণ করার জন্য কোনও অপ্রত্যক্ষ পদ্ধতি আছে? মাইক 1886 তার উত্তরে "আরওসি বক্ররেখা বিশ্লেষণ" উল্লেখ করেছে তবে রোল্যান্ডো 2 দ্বারা উল্লিখিত কিছু সমস্যা রয়েছে। অনেক ধন্যবাদ!
xyhzc
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.