লিনিয়ার রিগ্রেশন-এ লোগারিথ্মিকভাবে রূপান্তরিত সহগগুলি কীভাবে ব্যাখ্যা করবেন?


10

আমার অবস্থাটি হ'ল:

আমার কাছে 1 ধারাবাহিক নির্ভরশীল এবং 1 ধারাবাহিক প্রেডিকটর ভেরিয়েবল রয়েছে যা আমি সাধারণ রৈখিক প্রতিরোধের জন্য তাদের অবশিষ্টাংশগুলিকে স্বাভাবিক করার জন্য লোগারিথ্মিকভাবে পরিবর্তিত করেছি।

আমি কীভাবে এই রূপান্তরিত ভেরিয়েবলগুলিকে তাদের মূল প্রসঙ্গে সংযুক্ত করতে পারি তার জন্য যে কোনও সহায়তার প্রশংসা করব।

২০১০ সালে শিক্ষার্থীরা যে দিনগুলিতে যে দিনগুলি মিস করেছিল তার সংখ্যার উপর ভিত্তি করে ২০১১ সালে স্কুল যে দিনগুলি মিস করেছিল, তার অনুমানের জন্য আমি একটি লিনিয়ার রিগ্রেশন ব্যবহার করতে চাই Most বেশিরভাগ ছাত্র-ছাত্রীরা 0 দিন মিস করে বা মাত্র কয়েকদিনের মধ্যে ডেটা ইতিবাচকভাবে বাম দিকে আঁকানো হয়। সুতরাং, লিনিয়ার রিগ্রেশন ব্যবহারের জন্য রূপান্তর প্রয়োজন।

আমি উভয় ভেরিয়েবলের জন্য লগ 10 (ভ্যার + 1) ব্যবহার করেছি (0 দিনের স্কুল মিস করা শিক্ষার্থীদের জন্য আমি +1 ব্যবহার করেছি)। আমি রিগ্রেশন ব্যবহার করছি কারণ আমি শ্রেণীগত কারণগুলিতে - লিঙ্গ / জাতিগত ইত্যাদিও যুক্ত করতে চাই।

আমার সমস্যাটি হ'ল:

আমি যে শ্রোতাদের কাছে ফিরে যেতে চাইছি তারা লগ 10 (y) = লগ (ধ্রুবক) + লগ (ভার 2) এক্স (এবং স্পষ্টতই আমিও করি না) বুঝতে পারি না।

আমার প্রশ্নগুলি হ'ল:

ক) রিগ্রেশনে রুপান্তরিত ভেরিয়েবলের ব্যাখ্যা করার কী আরও ভাল উপায় আছে? ২০১০ সালে সর্বদা এক দিনের জন্য মিস করা তারা ২০১১ সালে ২ দিন মিস করবে যেহেতু ২০১০ সালে কোনও লগ ইউনিট পরিবর্তনের বিপরীতে ২০১১ সালে এক্স লগ ইউনিট পরিবর্তন হবে?

খ) বিশেষত, এই উত্স থেকে উদ্ধৃত প্যাসেজ নীচে দেওয়া হয়েছে:

"গণিতের মানকৃত পরীক্ষার স্কোরের এক ইউনিট বৃদ্ধির জন্য এটি নেতিবাচক দ্বিপদী রিগ্রেশন অনুমান, অন্য ভেরিয়েবলগুলিকে মডেলটিতে স্থির রাখা হয়। যদি কোনও শিক্ষার্থী তার গণিত পরীক্ষার স্কোরকে এক পয়েন্ট বাড়িয়ে তোলে তবে লগের পার্থক্য মডেলের ধ্রুবকটিতে অন্যান্য ভেরিয়েবল ধরে রেখে প্রত্যাশিত গণনাগুলি 0.0016 ইউনিট কমে আসবে বলে আশা করা যায়। "

আমি জানতে চাই:

  • এই প্যাসেজটি কি বলছে যে UNTRANSFORMEDপরিবর্তনশীল গণিতের স্কোর বৃদ্ধির জন্য প্রতিটি ইউনিট ধ্রুবক (ক) থেকে 0.0016 হ্রাসের UNTRANSFORMEDদিকে নিয়ে যায় , তাই যদি গণিতের স্কোর দুটি পয়েন্ট বৃদ্ধি পায় তবে আমি ধ্রুবক a থেকে 0.0016 * 2 বিয়োগ করব?
  • এর অর্থ কি আমি ঘৃণ্য (ক) এবং তাত্পর্যপূর্ণ (এ + বিটা * 2) ব্যবহার করে জ্যামিতিক গড় পেয়েছি এবং, ভবিষ্যদ্বাণী ভেরিয়েবল (গুলি) এর কী প্রভাব ফেলেছে / তা বলার জন্য আমাকে এই দুজনের মধ্যে শতকরা পার্থক্য গণনা করতে হবে / নির্ভরশীল পরিবর্তনশীল উপর আছে?
  • নাকি আমি পুরোপুরি ভুল পেয়েছি?

আমি এসপিএসএস ভি 20 ব্যবহার করছি। দীর্ঘ প্রশ্নে এটি ফ্রেমিংয়ের জন্য দুঃখিত।



8
আপনি কি এর পরিবর্তে পোইসন রিগ্রেশন ব্যবহার করার কথা ভাবেন? এটি নির্ভরশীল গণনা ডেটার সাথে স্বাভাবিকভাবে নির্দেশিত এবং লগ রূপান্তরের মাধ্যমে আপনার সাফল্য পোইসন বিতরণের সাথে সামঞ্জস্যপূর্ণ। বিদ্যালয়ের কোনও দিন অনুপস্থিত হওয়ার সম্ভাব্য সম্ভাবনা সমানুপাতিক বৃদ্ধির ক্ষেত্রে সহগের ব্যাখ্যা করা হবে। একটি সুবিধা হ'ল শূন্যগুলির কোনও বিশেষ চিকিত্সার প্রয়োজন নেই (যদিও এটি শূন্য-স্ফীত বিকল্প মডেলের দিকে তাকানো এখনও খুব ভাল ধারণা)।
whuber

হাই হুইবার, হ্যাঁ, আমি পয়সন রিগ্রেশন সম্পর্কে ভাবছিলাম কিন্তু এটি সম্পর্কে নিশ্চিত ছিল না বা নেতিবাচক দ্বিপদী রিগ্রেশনটি বেছে নেবে। নেতিবাচক দ্বিপদী অনুমান করি যেহেতু ডেটা ছড়িয়ে পড়েছে - অর্থাত ডেটাসেটের পরিবর্তনের চেয়ে গড় কম (তাই ইতিবাচক স্কিউ)) এছাড়াও, কঠোরভাবে, বছরে স্কুল সেশনের সংখ্যার উপরের সীমা রয়েছে, তবে পইসন সীমাহীন ডিনামিনেটর হিসাবে ধরেছেন? অথবা আপনি কি এখনও পোয়েসনকে আরও উপযুক্ত বলে মনে করেন? দুর্ভাগ্যক্রমে এসপিএসএস যতদূর আমি দেখেছি শূন্য স্ফীত মডেলগুলিকে সমর্থন করে না ...) ধন্যবাদ হুইবার :)
জিম্বোবি

3
আমি পইসন বিতরণগুলির সীমাহীন সহায়তায় কোনও সমস্যা দেখতে পাচ্ছি না: এটি মডেল, বলার জন্য আদর্শ বিতরণগুলি ব্যবহার করার মতো, যা মান অবশ্যই ননজেটিভ হতে হবে। অসম্ভব মানগুলির সাথে যুক্ত সম্ভাবনাগুলি যদি ছোট হয় তবে তা সত্ত্বেও এটি একটি ভাল মডেল হতে পারে। নেতিবাচক দ্বিপদী হ'ল ফিট এবং ওভারডিস্পেরিয়েন্সের ধার্মিকতা পরীক্ষা করতে ব্যবহৃত পয়েসনের মানক বিকল্প; এটা একটা ভালো ধারণা. এসপিএসএস যদি খুব সীমাবদ্ধ থাকে তবে অন্য কিছু ব্যবহার করুন! ( Rশূন্য-স্ফীত মডেলের জন্য প্যাকেজ রয়েছে; এই সাইটটি অনুসন্ধান করুন
শুক্রবার

2
আমি @ যাহার সাথে একমত, আমার মনে হয় আপনি সম্ভবত একটি জিপ বা জিনব মডেল চান। আমি কেবল এটিকে যুক্ত করব যে সেগুলি প্রস কন্ট্রেগের (এসটিএস) এর মাধ্যমে এবং এসএএস 9.2 দিয়ে প্রোক জেনমোডে (স্ট্যাট) দিয়ে পাওয়া যাবে
পিটার

2
Stats.stackexchange.com/questions/18480/… এ খুব ভাল তথ্য রয়েছে ।
রোল্যান্ডো 2

উত্তর:


7

আমি মনে করি @ হোবারের মন্তব্যে আরও গুরুত্বপূর্ণ বিষয়টির পরামর্শ দেওয়া হয়েছে। আপনার পুরো পদ্ধতির ভুলভ্রান্তি রয়েছে কারণ লগারিদম গ্রহণের মাধ্যমে আপনি কার্যকরভাবে ২০১০ বা ২০১১ সালের মধ্যে শূণ্য অনুপস্থিত দিনগুলির সাথে যে কোনও শিক্ষার্থী ডেটাसेट থেকে ছিটকে যাচ্ছেন It মনে হচ্ছে এই সমস্যাগুলির মধ্যে যথেষ্ট পরিমাণে লোক রয়েছে, এবং আমি নিশ্চিত যে আপনার ফলাফলগুলি হবে আপনি যে পদ্ধতির গ্রহণ করছেন তার ভিত্তিতে ভুল হোন।

পরিবর্তে, আপনাকে পোয়েসন প্রতিক্রিয়া সহ একটি সাধারণীকরণীয় রৈখিক মডেল ফিট করতে হবে। আপনি উপযুক্ত মডিউলটির জন্য অর্থ প্রদান না করে এসপিএসএস এটি করতে পারে না, তাই আমি আর-তে আপগ্রেড করার পরামর্শ দিই

আপনার তখনও সহগের ব্যাখ্যা করার সমস্যা থাকবে, তবে এটি মূলত উপযুক্ত এমন একটি মডেল থাকার গুরুত্ব সহকারে এটি গৌণ।


রূপান্তরটি কেন ব্যবহার করবেন না ? এটি আপনার সামনে আসা সমস্যার সমাধান করবে। যাইহোক, বিপরীত রূপান্তর কিছুটা বেশি জড়িত হবে, এবং ব্যাখ্যাটি আরও কঠিন হবে। এটি সম্পর্কে এখানে একটি পোস্ট রয়েছে: stats.stackexchange.com/questions/18694/…xlog(x+1)
toypajme

3

আমি অন্যান্য উত্তরদাতাদের সাথে বিশেষত মডেলটির ফর্মের সাথে সম্মত agree যদি আমি আপনার প্রশ্নের প্রেরণা বুঝতে যাইহোক, আপনি সাধারণ শ্রোতাদের অ্যাড্রেসিং এবং বোঝাতে চাও বাস্তব(তাত্ত্বিক) আপনার বিশ্লেষণের অর্থ। এই উদ্দেশ্যে আমি বিভিন্ন "পরিস্থিতিতে" এর অধীনে পূর্বাভাসিত মানগুলি (উদাহরণস্বরূপ আনুমানিক দিনগুলি মিস করা) তুলনা করি। আপনি যে মডেলটি বেছে নিয়েছেন তার উপর ভিত্তি করে, ভবিষ্যদ্বাণীকারীরা নির্দিষ্ট নির্দিষ্ট মানগুলিতে (উদাহরণস্বরূপ তাদের মিডিয়ান বা শূন্য) যখন নির্ভরশীল ভেরিয়েবলের প্রত্যাশিত সংখ্যা বা মানটির সাথে তুলনা করতে পারেন এবং তারপরে ভবিষ্যদ্বাণীকারীদের "অর্থবহ" পরিবর্তন কীভাবে দেখায় ভবিষ্যদ্বাণী প্রভাবিত করে। অবশ্যই, আপনাকে ডেটাটিকে মূল, বোধগম্য স্কেলে রূপান্তর করতে হবে যার সাথে আপনি শুরু করেন। আমি "অর্থবহ পরিবর্তন" বলি কারণ প্রায়শই স্ট্যান্ডার্ড "এক্সের এক-ইউনিট পরিবর্তন" প্রকৃত আমদানি বা স্বাধীন ভেরিয়েবলের অভাব প্রকাশ করে না। "উপস্থিতি ডেটা" দিয়ে, আমি নিশ্চিত নই যে এই ধরনের পরিবর্তন কী হবে। (যদি কোনও শিক্ষার্থী ২০১০-এর কোনও দিন এবং ২০১১ সালে একদিন মিস না করে, আমি নিশ্চিত না যে আমরা কিছু শিখব। তবে আমি জানি না।)


2

যদি আমাদের কাছে মডেল থাকে , তবে আমরা আশা করতে পারি যে ফলনের 1 ইউনিট বৃদ্ধি Y ইউনিট বৃদ্ধি পাবে Instead পরিবর্তে, যদি আমাদের তবে আমরা 1 শতাংশ বৃদ্ধি আশা করব ফলন ওয়াই মধ্যে ইউনিট বৃদ্ধিY=bXXY=blog(X)Xblog(1.01)

সম্পাদনা: ওফস, বুঝতে পারিনি যে আপনার নির্ভরশীল ভেরিয়েবলটিও লগ রূপান্তরিত হয়েছিল। তিনটি পরিস্থিতি বর্ণনা করার জন্য একটি ভাল উদাহরণের সাথে এখানে একটি লিঙ্ক রয়েছে:

1) কেবল Y রুপান্তরিত হয় 2) কেবল ভবিষ্যদ্বাণীকারীদের রূপান্তরিত হয় 3) Y এবং ভবিষ্যদ্বাণীকারী উভয়ই রূপান্তরিত হয়

http://www.ats.ucla.edu/stat/mult_pkg/faq/general/log_transformed_regression.htm


1
হাই জেসি, আপনার উত্তরের জন্য ধন্যবাদ। আমি ধারাবাহিকতার জন্য আমার নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবল উভয়কেই রূপান্তরিত করার পদ্ধতিকে গ্রহণ করেছি, তবে আমি পড়েছি যে এটি কেবলমাত্র ডিভিই এর আইভিগুলির তুলনায় সত্যিকারের স্বাভাবিকতার জন্য রূপান্তরকরণ প্রয়োজন।
জিম্বোবি

আপনি প্রস্তাবিত লিঙ্কটি আমি আসলে দেখেছি (ধন্যবাদ ধন্যবাদ) তবে বেশ কয়েকটি পয়েন্টে স্পষ্ট ছিল না, বিশেষত জ্যামিতিক গড়কে 'বাস্তব-জীবনের' সাথে তুলনা করার বিষয়ে, তবে আমি অনুমান করি যে জ্যামিতিক গড়টি ব্যবহার করে মডেলিংয়ের সাথে আরও কিছু করা যায় x এর পরিবর্তিত x এর পরিবর্তে x এর প্রতি ইউনিট পরিবর্তনের জন্য প্রতি ইউনিটের পরিবর্তনের প্রভাব? আমার মনে হয় আমার ফিরে যেতে হবে এবং এটি দ্বিতীয় বার পড়া দরকার ...
জিম্বোবো

2

আমি প্রায়শই লগ-ট্রান্সফর্ম ব্যবহার করি তবে আমি বাইনারি কোভারিয়েটগুলি ব্যবহার করি না কারণ এটি গুণকগুলির ক্ষেত্রে একটি প্রাকৃতিক ব্যাখ্যার দিকে নিয়ে যায়। মনে করুন আপনি ভবিষ্যদ্বাণী করা করতে চান দেওয়া বলতে 3 বাইনারি covariates , এবং মান গ্রহণ । এখন, উপস্থাপনের পরিবর্তে:YX1X2X3{0,1}

log(Y)log(C)+X1W1+X2W2 ,

আপনি কেবল প্রদর্শন করতে পারেন:

YC M1X1 M2X2 M3X3 ,

যেখানে: , এবং গুণক। বলা চলে, প্রতিবার কোভারিয়েট সমান 1 হলে, ভবিষ্যদ্বাণীটি দ্বারা গুণিত হয় । উদাহরণস্বরূপ, যদি , এবং , আপনার ভবিষ্যদ্বাণীটি হ'ল:M1=eW1M2=eW2M3=eW3XiMiX1=0X2=1X3=1

YC M2 M3

আমি ব্যবহার করছি কারণ এটি এর গড়ের পূর্বাভাসটি হুবহু : লগ-সাধারণ বিতরণের গড় প্যারামিটারটি এলোমেলো ভেরিয়েবলের গড় হিসাবে বোঝায় না (কারণ এটি ব্যতীত ধ্রুপদী লিনিয়ার রিগ্রেশনের ক্ষেত্রে হয়) লগ-রুপান্তর)। আমার এখানে সুনির্দিষ্ট রেফারেন্স নেই তবে আমি মনে করি এটি সোজা যুক্তিযুক্ত।Y


3
লগইনরমাল সমস্যা নিয়ে আপনার চিন্তা করার দরকার নেই: গুণক নির্বিশেষে সঠিক। (ভিন্ন ভিন্ন মডেলগুলির সাথে কোনও সমস্যা হবে)) এটি কারণ হ'ল যেখানে এর বৈকল্পিক । , দয়া করে জন্য আপনার সংজ্ঞাগুলি স্ক্যান করুন । E[Y]=Ceσ2/2e(X1W1+X2W2+X3W3)σ2log(Y)Mi
whuber
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.