মূল আগ্রহের নয় এমন সমস্ত ভেরিয়েবলগুলি কেন লগ-রূপান্তর করবেন না?


10

বই এবং আলোচনায় প্রায়শই বলা হয় যে ভবিষ্যদ্বাণীকারীর সাথে সমস্যাগুলির মধ্যে (যার মধ্যে কয়েকটি রয়েছে) লগ-ট্রান্সফরমিং এটি একটি সম্ভাবনা। এখন, আমি বুঝতে পেরেছি যে এটি ভবিষ্যদ্বাণীকারীদের বিতরণ এবং স্বাভাবিকতার উপর নির্ভর করে যা প্রতিরোধের অনুমান নয়; তবে লগ ট্রান্সফর্মিং ডেটাটিকে আরও অভিন্ন করে তোলে, বহিরাগতদের দ্বারা কম প্রভাবিত হয়।

আমি লগটি আমার সমস্ত ধ্রুবক ভেরিয়েবলগুলি রূপান্তর করার বিষয়ে ভেবেছিলাম যা মূল আন্তঃসংযোগকারীর নয়, যেমন ভেরিয়েবলগুলি কেবলমাত্র আমি সামঞ্জস্য করি।

এটা কি ভুল? ভাল? বেহুদা?

উত্তর:


24

এখন, আমি বুঝতে পারি যে এটি ভবিষ্যদ্বাণীকারীদের বিতরণ এবং স্বাভাবিকতার উপর নির্ভর করে

লগ রূপান্তর তথ্য আরও ইউনিফর্ম করে তোলে

একটি সাধারণ দাবি হিসাবে, এটি মিথ্যা --- তবে এটি যদি হয় তবে কেন অভিন্নতা গুরুত্বপূর্ণ হবে?

উদাহরণস্বরূপ, বিবেচনা করুন

i) একটি বাইনারি ভবিষ্যদ্বাণী মাত্র 1 এবং 2 এর মান গ্রহণ করে লগ গ্রহণ করা বাইনারি পূর্বাভাসকারী হিসাবে কেবলমাত্র 0 টি মান এবং লগ নেয় leave এমনকি ভবিষ্যদ্বাণীকারীর পি-মানটিও অপরিবর্তিত থাকবে, যেমন উপযুক্ত মানগুলি।

এখানে চিত্র বর্ণনা লিখুন

ii) একটি বাম-স্কু ভবিষ্যদ্বাণী বিবেচনা করুন। এখন লগ নিন। এটি সাধারণত আরও বাম স্কু হয়ে যায়।

এখানে চিত্র বর্ণনা লিখুন

iii) অভিন্ন ডেটা বাম স্কুতে পরিণত হয়

এখানে চিত্র বর্ণনা লিখুন

(যদিও প্রায়শই এটি সর্বদাই চরম পরিবর্তন হয় না, যদিও)

বিদেশী দ্বারা কম প্রভাবিত

সাধারণ দাবি হিসাবে এটি মিথ্যা। একজন ভবিষ্যদ্বাণীকারীর মধ্যে নিম্ন outliers বিবেচনা করুন।

এখানে চিত্র বর্ণনা লিখুন

আমি লগ আমার সমস্ত অবিচ্ছিন্ন ভেরিয়েবলগুলি রূপান্তর করার বিষয়ে চিন্তা করেছি যা মূল আগ্রহের নয়

কি শেষ? মূলত যদি সম্পর্কগুলি লিনিয়ার হয় তবে সেগুলি আর থাকবে না।

এখানে চিত্র বর্ণনা লিখুন

এবং যদি তারা ইতিমধ্যে বাঁকা হয়ে থাকে তবে এটি স্বয়ংক্রিয়ভাবে করা তাদের আরও খারাপ (আরও বাঁকা) করতে পারে, আরও ভাল নয়।

-

কোনও ভবিষ্যদ্বাণীকের লগ নেওয়া (প্রাথমিক আগ্রহ বা না হোক) মাঝে মাঝে উপযুক্ত হতে পারে তবে এটি সর্বদা তা হয় না।


2
এই দুর্দান্ত উত্তরের জন্য অনেক ধন্যবাদ। আমি মনে করি যে আমাদের মধ্যে বেশিরভাগ লোককে এইভাবে দেখার প্রয়োজন ছিল। তবে আপনি কি সম্মত হন যে ডান-স্কিউড ডেটা লগ-ট্রান্সফর্মিংয়ের সাপেক্ষে হওয়া উচিত? অন্যান্য স্কিউ এবং ফর্মের চেয়ে বেশি?
অ্যাডাম রবিনসন

1
সাধারণত না, না। কিছু খুব নির্দিষ্ট অবস্থার অধীনে, সম্ভবত।
গ্লেন_বি -রিনস্টেট মনিকা

আমি অবাক হয়েও দেখেছি যে কেউই মডেলের ব্যাখ্যার উল্লেখ করেনি। আপনি যদি নির্ভরশীল পরিবর্তনশীল রূপান্তর করতে লগ করেন তবে মডেলটি ব্যাখ্যা করা কিছুটা আরও কঠিন হয়ে পড়ে - বিশেষত সাধারণ মানুষ বা পরিসংখ্যান / গাণিতিক ব্যাকগ্রাউন্ড ব্যতীত। উদাহরণস্বরূপ বলা যাক যে আপনার একটি মডেল ছিল যা ইঞ্চিতে ট্রাঙ্কের পরিধিকে কেন্দ্র করে ফুটের একটি গাছের উচ্চতার পূর্বাভাস দেয়। এর ব্যাখ্যা, পরিধি এক ইঞ্চি বাড়ার জন্য, গাছের গড় উচ্চতা লম্বায় আধা ফুট β^=0.50
লম্বা করা

(কনটেন্ট) বলতে সক্ষম হওয়ার চেয়ে উদাহরণস্বরূপ, ট্রাঙ্ক পরিধি পরিধি হিসাবে এক ইঞ্চি বৃদ্ধির জন্য, গাছের গড় উচ্চতা অর্ধফুট বৃদ্ধি পায়। পরেরটি ব্যাখ্যা করা সহজ এবং কোনও ক্যালকুলেটর ছাড়াই মাঠে গণনা করা সহজ।
স্ট্যাটাস স্টুডেন্ট

10

আমার মতে, কেবলমাত্র এটির জন্য লগ রূপান্তর (এবং কোনও ডেটা ট্রান্সফর্মেশন , সেই বিষয়ে) সম্পাদন করা কোনও অর্থবোধ করে না। পূর্ববর্তী উত্তর যেমন উল্লিখিত হয়েছে, তথ্যের উপর নির্ভর করে কিছু রূপান্তরগুলি অবৈধ বা অকেজো হবে । আমি অত্যন্ত নিম্নলিখিত এই প্রোগ্রামটিতে চমৎকার পড়তে আপনাকে সুপারিশ পরিচায়ক উপাদান উপর তথ্য রূপান্তর : http://fmwww.bc.edu/repec/bocode/t/transint.html । দয়া করে নোট করুন যে এই দস্তাবেজের কোড উদাহরণগুলি স্টাটা ভাষায় লিখিত হয়েছে , তবে অন্যথায় নথিটি যথেষ্ট জেনারিক এবং এইভাবে স্টাট-নন ব্যবহারকারীদের জন্যও দরকারী useful

সাধারণ তথ্য-সম্পর্কিত সমস্যাগুলির সাথে মোকাবিলার জন্য কিছু সাধারণ কৌশল এবং সরঞ্জামাদি , যেমন সাধারণতার অভাব , আউটলিয়ার এবং মিশ্রণ বিতরণগুলি এই নিবন্ধে পাওয়া যেতে পারে (দ্রষ্টব্য, মিশ্রণ বিতরণকে মোকাবেলা করার পদ্ধতিরূপে স্তরবদ্ধকরণ সম্ভবত সবচেয়ে সহজতম - এর আরও সাধারণ ও জটিল পদ্ধতির মধ্যে রয়েছে মিশ্রণ বিশ্লেষণ , এটি সীমাবদ্ধ মিশ্রণ মডেল হিসাবেও পরিচিত , যার একটি বিবরণ এই উত্তরের ক্ষেত্রের বাইরেও নয়)। বক্স-কক্স রূপান্তরউপরোক্ত দুটি রেফারেন্সে সংক্ষেপে উল্লিখিত, এটি একটি গুরুত্বপূর্ণ ডেটা ট্রান্সফরমেশন, বিশেষত অ-স্বাভাবিক ডেটার জন্য (কিছু সতর্কতা সহ)। বক্স-কক্স রূপান্তর সম্পর্কে আরও তথ্যের জন্য, দয়া করে এই প্রারম্ভিক নিবন্ধটি দেখুন


2
গ্রেট রেফারেন্স যে ভাল প্রয়োজন scepisism ভাগ করে নেওয়ার জন্য ধন্যবাদ। ধন্যবাদ।
অ্যাডাম রবিনসন

1
@ অ্যাডামরবিনসন: আমার আনন্দ, আদম! আপনি আমার উত্তর পছন্দ করেছেন খুশি।
আলেকসান্দ্র ব্লেক

8

লগ রূপান্তর সবসময় জিনিসকে আরও ভাল করে না। স্পষ্টতই, আপনি শূন্য বা নেতিবাচক মান অর্জনকারী ভেরিয়েবলগুলি লগ-ট্রান্সফর্ম করতে পারবেন না, এমনকি লগ-রূপান্তরিত হলে শূন্যকে আলিঙ্গন করে এমন ইতিবাচকগুলিও নেতিবাচক বহিরাগতদের সাথে আসতে পারে।

আপনার কেবল নিয়মিতভাবে সমস্ত কিছু লগ করা উচিত নয়, তবে কোনও মডেল ফিট করার আগে নির্বাচিত ইতিবাচক ভবিষ্যদ্বাণীকে (যথাযথভাবে, প্রায়শই একটি লগ তবে সম্ভবত অন্য কোনও কিছু) রূপান্তর করা সম্পর্কে ধারণা করা একটি ভাল অনুশীলন। একই প্রতিক্রিয়া পরিবর্তনশীল জন্য যায়। বিষয়বস্তু জ্ঞানও গুরুত্বপূর্ণ। পদার্থবিজ্ঞান বা সমাজবিজ্ঞানের কিছু তত্ত্ব বা যা কিছু স্বাভাবিকভাবেই কিছু নির্দিষ্ট রূপান্তর হতে পারে। সাধারণত, আপনি যদি ভেরিয়েবলগুলি ইতিবাচকভাবে স্কিউডগুলি দেখতে পান তবে লগ (বা সম্ভবত একটি বর্গমূল বা পারস্পরিক) সাহায্য করতে পারে।

কিছু রিগ্রেশন পাঠ্য মনে হয় যে কোনও রূপান্তর বিবেচনা করার আগে আপনাকে ডায়গনিস্টিক প্লটগুলি দেখতে হবে তবে আমি একমত নই। আমি মনে করি যে কোনও মডেল ফিট করার আগে এই পছন্দগুলি করার ক্ষেত্রে আপনার পক্ষে সেরা কাজটি করা আরও ভাল, যাতে আপনার সর্বোত্তম শুরুর পয়েন্ট সম্ভব হয়; তারপরে আপনাকে সেখান থেকে সামঞ্জস্য করতে হবে কিনা তা দেখতে ডায়াগনস্টিকগুলি দেখুন।


সমস্ত যুক্ত করে যে এই বিবেচনাগুলি গুরুত্বপূর্ণ এবং গুরুত্বহীন ভবিষ্যদ্বাণীকারীদের উভয় ক্ষেত্রেই প্রযোজ্য।
রাশ দৈর্ঘ্য

ধন্যবাদ @ আরভিএল! কখন এবং কীভাবে রূপান্তরগুলি চয়ন করতে হয় তার মধ্যে বিভেদ দ্বারা আমি সর্বদা বিভ্রান্ত; বইগুলি প্রায়শই উল্লেখ করে যে, যেমন আপনি লিখেছেন, রিগ্রেশন স্পর্শ করার আগে একটিতে সমস্ত ভেরিয়েবলের ফর্ম পরীক্ষা করা দরকার। আপনার অন্তর্দৃষ্টি প্রদান করার জন্য ধন্যবাদ।
অ্যাডাম রবিনসন

@ আরভিএল, আপনার উত্তরের জন্য আপনাকে ধন্যবাদ আপনি কি snoqএই ক্রসভিলেটেড থ্রেডে ডেটাসেটটিকে লগ-ট্রান্সফর্ম করবেন (লক্ষ্যটি মনে রেখে গাউসিয়ানদের মিশ্রণটি মাপসই করা)?
ঝুবার্ব

-3

1) ডেটা গণনা করুন (y> 0) -> লগ (y) বা y = Exp (b0 + biXi) 2) ডেটা গণনা + শূন্য (y> = 0) -> বাধা মডেল (দ্বিপদী + গণনা রেজি।) 3) সমস্ত বহুবিধ প্রভাব (& ত্রুটিগুলি) সংযোজনযোগ্য 4) বৈকল্পিক ~ গড় -> লগ (y) বা y = এক্সপ্রেস (বি0 + বিএক্সআই) 5) ...


এই উত্তরটি পড়া শক্ত এবং এটি প্রশ্নের উত্তর দেওয়ার চেষ্টা করে কিনা তা অস্পষ্ট।
জুহো কোক্কলা

1
টেলিগ্রাফিক এবং অপরিবর্তিত উপস্থাপনা এই উত্তরটি বোধগম্য করে তোলে। আপনি কি মনে করেন যে আপনি আপনার ধারণাগুলি ইংরেজিতে প্রসারিত করতে পারেন এবং সূত্রগুলির জন্য ব্যবহার করতে পারেন ? TEX
হোয়বার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.