একটি ভেরিয়েবলকে শ্রেণিবদ্ধকরণ এটিকে তুচ্ছ থেকে তাৎপর্যপূর্ণ করে তোলে


17

আমার কাছে একটি সাংখ্যিক পরিবর্তনশীল রয়েছে যা মাল্টিভারিয়েট লজিস্টিক রিগ্রেশন মডেলটিতে তাত্পর্যপূর্ণ নয় turns যাইহোক, যখন আমি এটিকে দলগুলিতে শ্রেণিবদ্ধ করি, হঠাৎ এটি তাৎপর্যপূর্ণ হয়ে ওঠে। এটি আমার কাছে অত্যন্ত স্ব-স্বজ্ঞাত: যখন কোনও ভেরিয়েবলকে শ্রেণিবদ্ধকরণ করা হয়, তখন আমরা কিছু তথ্য ছেড়ে দেই।

এটা কিভাবে হতে পারে?

উত্তর:


25

এর একটি সম্ভাব্য ব্যাখ্যা হ'ল আপনার ফলাফল এবং ভবিষ্যদ্বাণীকের মধ্যে সম্পর্কের ক্ষেত্রে অলংকার্যতা।

এখানে একটি ছোট উদাহরণ। আমরা একটি পূর্বাভাসকারী ব্যবহার করি যা [-1,1] তে অভিন্ন । ফলাফল যাই হোক, না সুসংগত predictor উপর নির্ভর করে, কিন্তু উপর বর্গ 'সত্য' জন্য উভয় সম্ভাবনা বেশি হয়: predictor এর এক্স-1 এবং এক্স1 জন্য, কিন্তু কম সম্ভবত এক্স0 । এই ক্ষেত্রে, একটি রৈখিক মডেল তুচ্ছ হয়ে উঠবে, তবে ভবিষ্যদ্বাণীকে অন্তরগুলিতে কাটা এটি তাৎপর্যপূর্ণ করে তোলে।

> set.seed(1)
> nn <- 1e3
> xx <- runif(nn,-1,1)
> yy <- runif(nn)<1/(1+exp(-xx^2))
> 
> library(lmtest)
> 
> model_0 <- glm(yy~1,family="binomial")
> model_1 <- glm(yy~xx,family="binomial")
> lrtest(model_1,model_0)
Likelihood ratio test

Model 1: yy ~ xx
Model 2: yy ~ 1
  #Df  LogLik Df  Chisq Pr(>Chisq)
1   2 -676.72                     
2   1 -677.22 -1 0.9914     0.3194
> 
> xx_cut <- cut(xx,c(-1,-0.3,0.3,1))
> model_2 <- glm(yy~xx_cut,family="binomial")
> lrtest(model_2,model_0)
Likelihood ratio test

Model 1: yy ~ xx_cut
Model 2: yy ~ 1
  #Df  LogLik Df  Chisq Pr(>Chisq)  
1   3 -673.65                       
2   1 -677.22 -2 7.1362    0.02821 *
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

তবে এর অর্থ এই নয় যে ভবিষ্যদ্বাণীকে বিবেচনা করা সেরা পদ্ধতির best (এটি কখনই হয় না)) বা অনুরূপ ব্যবহার করে অরৈখিকতার মডেল করা আরও ভাল ।


এমন কিছু উদাহরণ রয়েছে যেখানে বিবেচনাধারা বোধগম্য হয়? উদাহরণস্বরূপ, যদি আপনার একটি নির্দিষ্ট প্রান্তিক (যেমন 18 বছর বয়স) থাকে তবে ফলাফলের ক্ষেত্রে বাইনারি স্যুইচ ঘটে। 18+ রেঞ্জের সংখ্যাসূচক বয়সটি উল্লেখযোগ্য নাও হতে পারে তবে বাইনারি বয়স> 18 উল্লেখযোগ্য হতে পারে?
আজরহাইট

3
@ আজরওয়াইট: এটি মাঠে নির্ভর করে। যে কোনও জায়গায় থ্রেশহোল্ডগুলি আইন বিবেচনার সাথে কোড করে দেওয়া অর্থবোধ করতে পারে। উদাহরণস্বরূপ, আপনি যদি ভোটদানের আচরণের মডেল করেন তবে 18 বছর বয়সে কেউই ভোট দেওয়ার পক্ষে আসলেই উপযুক্ত কিনা তা খতিয়ে দেখার অর্থ বোধ করা হচ্ছে Similarly একইভাবে, জার্মানিতেও আপনার যানবাহন ট্যাক্স আপনার ইঞ্জিনের স্থানচ্যূতকরণের উপর নির্ভর করে এবং 1700, 1800, 1900, ... সিমি , এত সুন্দর যে সমস্ত গাড়ির 1699, 1799, ... সিসিএম (স্ব-বিবেচনার ধরণের) এর স্থানচ্যুতি রয়েছে। জীববিজ্ঞান, চিকিত্সা, মনোবিজ্ঞান ইত্যাদির মতো প্রাকৃতিক বিজ্ঞানগুলিতে, আমি এমন একটি উদাহরণ খুঁজে পাওয়ার জন্য সংগ্রাম করি যেখানে বিবেচনার দ্বারা বোঝা যায়।
এস। কোলাসা - মনিকা 20'19

7

এর একটি সম্ভাব্য উপায় হ'ল যদি সম্পর্কটি স্বতন্ত্রভাবে অনৈখিক হয়। এটি কী ঘটছে তা সত্যই ব্যাখ্যা করে কিনা তা (বিশদের অভাবে দেওয়া) বলা সম্ভব নয়।

আপনি নিজের জন্য পরীক্ষা করতে পারেন। প্রথমত, আপনি নিজের হিসাবে ভেরিয়েবলের জন্য একটি যুক্ত ভেরিয়েবল প্লট করতে পারেন এবং আপনি মডেলের ফ্যাক্টর-সংস্করণে লাগানো প্রভাবগুলিও প্লট করতে পারেন। যদি ব্যাখ্যাটি সঠিক হয় তবে উভয়েরই একটি স্বতন্ত্রভাবে ননলাইনার প্যাটার্নটি দেখতে হবে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.