লগ আইশ কখন উপযুক্ত?


57

আমি পড়েছি যে টাইম সিরিজের চার্টে y- অক্ষের মতো নির্দিষ্ট পরিস্থিতিতে যেমন লেখচিত্র / গ্রাফিংয়ের জন্য লগ স্কেল ব্যবহার করা উপযুক্ত। যাইহোক, আমি কেন এটি ক্ষেত্রে, বা কখন এটি উপযুক্ত হবে সে সম্পর্কে একটি নির্দিষ্ট ব্যাখ্যা খুঁজে পাইনি। দয়া করে মনে রাখবেন, আমি কোনও পরিসংখ্যানবিদ নই তাই আমি পয়েন্টটি পুরোপুরি অনুপস্থিত হতে পারি এবং যদি এটি হয় তবে আমি প্রতিকারের সংস্থানগুলির দিকনির্দেশকে প্রশংসা করব।


10
এটি কোনও আনুষ্ঠানিক উত্তর নয় তবে - যখন কোনও ভেরিয়েবল বিভিন্ন আকারের বিভিন্ন ক্রম ছড়িয়ে দেয় তবে লগ স্কেলে এটি ভিজ্যুয়ালাইজ করা প্রায়শই চোখের (এবং আরও তথ্যমূলক) পক্ষে সহজ হয় easier
ম্যাক্রো

ম্যাক্রো-এটি ভাল ধারণা দেয় (বিশেষত যখন আপনি এটির মতো শ্রোতা পেয়েছেন যা এটি বুঝতে পারে!)
ডেভ

1
আপনি নির্দিষ্ট জবাবের জন্য অপেক্ষা করার সময় আপনি ব্যবহারের এই ঘনিষ্ঠভাবে সম্পর্কিত থ্রেডটি দেখতে পাবেন: stats.stackexchange.com/questions/298 । চার্টিংয়ের ক্ষেত্রে, আপনি ফলস্বরূপ "নির্ভরশীল ভেরিয়েবল "টিকে" y অক্ষ "হিসাবে ব্যাখ্যা করতে পারেন। তারপরে এখানে উপস্থিত হওয়া খুব ঘনিষ্ঠভাবে সম্পর্কিত প্রশ্নগুলি একবার দেখুন ।
whuber

3
এছাড়াও এফওয়াইআই নাওমি রবিন্সের বিষয়টিতে খুব সরল নিবন্ধ রয়েছে যা আগ্রহের বিষয় হওয়া উচিত, কখন আমার চার্ট এবং গ্রাফগুলিতে লোগারিদমিক স্কেলগুলি ব্যবহার করা উচিত?
অ্যান্ডি ডব্লিউ

হুফ, অতিরিক্ত লিঙ্কগুলি নির্দেশ করার জন্য ধন্যবাদ। আমি সেগুলির কয়েকটি দেখেছি, তবে সবকটিই নয় এবং আমি এখন তাদের মাধ্যমে আমার পথে কাজ করছি।
ডেভ

উত্তর:


51

এটি একটি খুব আকর্ষণীয় প্রশ্ন এবং এটি যা খুব কম লোকই ভাবেন। লগ স্কেল উপযুক্ত হতে পারে এমন বিভিন্ন উপায় রয়েছে। প্রথম এবং সর্বাধিক পরিচিত যা ম্যাক্রো তার মন্তব্যে উল্লেখ করেছেন: লগ স্কেলগুলি গ্রাফের নীচে সঙ্কুচিত না হয়ে ছোট মানগুলি ছাড়াই বৃহত্তর পরিসীমা প্রদর্শন করতে দেয়।

লগ স্কেলিংকে প্রাধান্য দেওয়ার ভিন্ন কারণ হ'ল এমন পরিস্থিতিতে যেখানে ডেটা স্বাভাবিকভাবে জ্যামিতিকভাবে প্রকাশিত হয়। একটি উদাহরণ হ'ল যখন ডেটা জৈবিক মধ্যস্থতার ঘনত্বকে উপস্থাপন করে। ঘনত্ব নেতিবাচক হতে পারে না এবং পরিবর্তনশীলতা প্রায় অদৃশ্যভাবে গড়ের সাথে স্কেল করে (অর্থাত্ হেটেরোসেসটেস্টিক বৈকল্পিকতা রয়েছে)। লগারিদমিক স্কেল ব্যবহার করে বা সমানভাবে লগের ঘনত্বকে প্রাথমিক হিসাবে ব্যবহার করে উভয় অসম পরিবর্তনশীলতা 'ফিক্স' করে এবং উভয় প্রান্তে সীমাহীন একটি স্কেল দেয়। ঘনত্ব সম্ভবত লগ-সাধারণত বিতরণ করা হয় এবং তাই লগ স্কেলিং আমাদের একটি খুব সুবিধাজনক ফলাফল দেয় যা তর্কযোগ্যভাবে 'প্রাকৃতিক'। ফার্মাকোলজিতে আমরা ড্রাগ ঘনত্বের জন্য লগারিদমিক স্কেল ব্যবহার করি না এর চেয়ে অনেক বেশি বার,

লগ স্কেলের আরও একটি ভাল কারণ, সম্ভবত আপনি সময়-সিরিজের ডেটাগুলির জন্য আগ্রহী, এটি লগ স্কেলের দক্ষতা থেকে ভগ্নাংশগত পরিবর্তনকে সমতুল্য করে তোলে। আপনার অবসরকালীন বিনিয়োগের দীর্ঘমেয়াদী কর্মক্ষমতা প্রদর্শনের একটি কল্পনা করুন। এটি (হওয়া উচিত) মোটামুটি তাত্পর্যপূর্ণভাবে বৃদ্ধি পাচ্ছে কারণ আগামীকালটির আগ্রহ আজকের বিনিয়োগের উপর নির্ভর করে (মোটামুটি কথা বলা)। সুতরাং শতাংশের শর্তাবলী যদি পারফরম্যান্স মোটামুটি ধ্রুবক থাকে তবে তহবিলগুলির একটি গ্রাফ ডান হাতের প্রান্তে খুব দ্রুত বেড়েছে বলে মনে হয়। লগারিদমিক স্কেল সহ একটি ধ্রুবক শতাংশের পরিবর্তনকে একটি ধ্রুবক উল্লম্ব দূরত্ব হিসাবে দেখা হয় তাই একটি ধ্রুবক বৃদ্ধির হারকে একটি সরলরেখা হিসাবে দেখা যায়। এটি প্রায়শই যথেষ্ট সুবিধা হয়।

লগ স্কেল বাছাই করার জন্য আরও কিছুটা তাত্পর্যপূর্ণ কারণ এমন পরিস্থিতিতে আসে যেখানে মানগুলি যথাযথভাবে x বা 1 / x হিসাবে প্রকাশ করা যেতে পারে। আমার নিজের গবেষণার একটি উদাহরণ ভাস্কুলার প্রতিরোধের যা সংবেদনশীলভাবে পারস্পরিক, ভাস্কুলার আচরণ হিসাবে প্রকাশ করা যেতে পারে। (কিছুটা ক্ষেত্রে রক্তনালীগুলির ব্যাসের কথা ভাবাও বোধগম্য যা প্রতিরোধের বা আচরণের শক্তি হিসাবে স্কেল করে)) সেগুলির কোনওটিরই অপরটির চেয়ে বাস্তবতা নেই এবং উভয়ই গবেষণামূলক গবেষণাপত্রে পাওয়া যায় না। যদি এগুলি লোগারিথ্মিকভাবে স্কেল করা হয় তবে এগুলি কেবল একে অপরের নেতিবাচক এবং এক বা অন্যের পছন্দ কোনও ধরণের পার্থক্য রাখে না। (ভাস্কুলার ব্যাস যখন সমস্ত লগ মাপানো হয় তখন ধ্রুবক গুণক দ্বারা প্রতিরোধের এবং চালনা থেকে পৃথক হবে))


মহান উত্তরের জন্য ধন্যবাদ! যদিও আপনি "মানগুলি যথাযথভাবে এক্স হিসাবে প্রকাশ করা যেতে পারে" এর বিস্তারিত ব্যাখ্যা করতে পারেন?
ktdrv

4
@ktdrv কিছু জিনিস উভয় উপায়েই বোঝায়। বলুন আপনি কোনও জেলেদের দক্ষতার দলিল করতে চান। আপনি প্রতিদিন মাছ ধরা সংখ্যা গণনা করতে পারেন বা আপনি ক্রমাগত ক্যাচ মধ্যে ব্যবধান পরিমাপ করতে পারেন। হয় পরিমাপটি বোঝায় তবে সেগুলি একে অপরের সাথে অ-রৈখিকভাবে সম্পর্কিত। এগুলি একে অপরের প্রাপ্য আদায়যোগ্য এবং তাই একে অপরকে রূপান্তরিত হতে পারে। বিরতিতে লগ এবং প্রতিদিন সংখ্যার লগ একে অপরের সাথে রৈখিকভাবে সম্পর্কিত এবং একটি ধ্রুবক (নেতিবাচক) ফ্যাক্টর দ্বারা পৃথক হয়।
মাইকেল লিউ

1
মাইকেল, দুর্দান্ত উত্তরের জন্য ধন্যবাদ। আমাকে স্বীকার করতে হবে, আপনার সমস্ত পয়েন্টগুলি পরীক্ষা করতে আমার কিছুটা সময় লেগেছিল (এবং "হেটেরোসেসটাস্টিক ভেরিয়েন্স" এর মতো কয়েকটি পদ গুগল করতে হয়েছিল)। আমি এখনও একসাথে পাইকি করছি উত্তরটির আসল প্রভাবটি আমার কাজের অর্থ কী হবে তবে আমি আমাকে সাধারণ দিকনির্দেশনা এবং কিছু দিকনির্দেশনার জন্য কৃতজ্ঞ করছি me
ডেভ

x1/xlog(x)x1/x x1/xx1/x

pH=log[H+]

29

@ মিশেল লিউর খুব ভাল উত্তরের একটি সংযোজন হিসাবে আমাকে কিছু বাস্তব জীবনের উদাহরণ দিতে হয়েছিল।

প্রথমত, নীচে দুটি সময়ের সিরিজের প্লটগুলি নিউজিল্যান্ডে মাসিক দর্শকদের আগমন দেখায়, যা পরিসংখ্যান নিউজিল্যান্ড থেকে পাওয়া যায় । উভয় প্লটেরই তাদের উদ্দেশ্য রয়েছে তবে আমি লোগারিদমিক স্কেলতে উল্লম্ব অক্ষ সহ একটিটি প্রথমটির চেয়ে অনেকগুলি উদ্দেশ্যে দর্শনীয়ভাবে কার্যকর বলে মনে করি। উদাহরণস্বরূপ, আপনি দেখতে পারেন যে আগমনকারীদের মৌসুমী আগতদের স্কেলের প্রায় সমানুপাতিক থাকে; এবং আপনি বৃদ্ধির হারের (যেমন দ্বিতীয় বিশ্বযুদ্ধের সময়) উল্লেখযোগ্য পরিবর্তনগুলি দেখতে পাচ্ছেন যা মূল স্কেলটিতে কেবল অদৃশ্য।

এখানে চিত্র বর্ণনা লিখুন

দ্বিতীয়ত, নীচের প্লটগুলি নিউজিল্যান্ডে ভ্রমণকারীদের ব্যয় তুলনা করে নিউজিল্যান্ডে মোট ভ্রমণ-সম্পর্কিত ব্যয় দেখায়। উত্সটি অর্থনৈতিক উন্নয়ন মন্ত্রকের আন্তর্জাতিক ভিজিটর জরিপ । পার্থক্য হ'ল প্রাক-ভ্রমণের ব্যয়, যেমন হোটেল বা অগ্রিম প্রদেয় প্যাকেজগুলি। প্রথম প্লটটি মূল স্কেলটিতে নীচের বাম কোণে ডেটাগুলি গোষ্ঠীভুক্ত করার খুব অশোধিত (তবে গুরুত্বপূর্ণ) ছাপ ব্যতীত কয়েকটি উদ্দেশ্যে ব্যবহার করা যেতে পারে। দ্বিতীয় প্লটটি কিছু তাত্ক্ষণিক ব্যাখ্যার ত্যাগ করে, বিশেষত অ-পরিসংখ্যানবিদদের জন্য (এর কারণে, আমি এখন সাধারণত অ্যাক্সেসের উপর ভিত্তি করে ডেটা রুপান্তরিত করার পরিবর্তে এবং লগারিদমিক মান দেখানোর স্কেলটি ব্যবহার করে) আরও ভিজ্যুয়াল পার্থক্য।

উদাহরণস্বরূপ, আপনি পরিষ্কারভাবে কয়েকজন আউটলিয়ারকে চিহ্নিত করতে পারেন (যা ডেটা সম্পাদনা ত্রুটি হিসাবে প্রমাণিত হয়েছিল) যেখানে মোট ব্যয় নিউজিল্যান্ডে ব্যয়ের চেয়ে কম ছিল। সম্ভবত আরও গুরুত্বপূর্ণ, আপনি বিভিন্ন রঙের দেশগুলির সাথে এই গ্রাফটি ব্যবহার করতে পারেন বা দেখানোর জন্য বিভিন্ন বাজারের দেশগুলি বা ভ্রমণের উদ্দেশ্য (যেমন ছুটির দিন বনাম ভিজিটর বন্ধুরা এবং পরিবার) ব্যয়ের "স্পেস" এর বিভিন্ন অংশ কীভাবে দখল করে - এটি কেবল অদৃশ্য হবে be মূল অক্ষ উপর।

এই প্লটটিকে দরকারী কিছুতে রূপান্তর করা কোনওভাবেই উচ্চ ঘনত্বের ডেটা (যেমন পয়েন্টগুলিতে কিছু স্বচ্ছতা যুক্ত করে, বা ঘনত্ব অনুসারে ষড়ভুজ বিন্যাসের সাথে পয়েন্টগুলি প্রতিস্থাপনের মাধ্যমে) জড়িত তবে কোনও কার্যকর ভিজ্যুয়াল সমাধান প্রায় অবশ্যই লোগারিদমিক অক্ষগুলিকে জড়িত করবে।

এখানে চিত্র বর্ণনা লিখুন

সম্পাদনা / সংযোজন

ষড়ভুজ বিন্দু বলতে আমি কী বোঝাতে চেয়েছি তা বোঝানোর আরেকটি চক্রান্ত, একটি বড় ডেটাসেট থাকাকালীন ঘনত্বের প্রতিনিধিত্ব করার জন্য রঙ ব্যবহার করে (এই ক্ষেত্রে, নিউজিল্যান্ডের রাগবি বিশ্বকাপের অভিজ্ঞতা সম্পর্কে এক সমীক্ষায় প্রায় 12000 জবাবদিহি)। আবার নোট করুন এটির আরও একটি উদাহরণ যেখানে আমি ব্যয়ের জন্য লগারিদমিক স্কেল ব্যবহার করেছি।

এখানে চিত্র বর্ণনা লিখুন


পিটার, অতিরিক্ত অন্তর্দৃষ্টি-গ্রাফিক্সের জন্য ধন্যবাদ সত্যই আপনার পয়েন্টগুলি বুঝতে সাহায্য করে। একটি ফলো-আপ প্রশ্ন (যদি আপনি এত ঝুঁকে থাকেন) তবে কেন আপনি "ষড়ভুজ" বিনের সাথে পয়েন্টগুলি প্রতিস্থাপন করবেন? "সূর্যমুখী প্লটস" এর মতো একই ধারণা? আমি এই শব্দটি আগে শুনিনি।
ডেভ

না, সূর্যমুখী প্লটের চেয়ে আলাদা। বিন্দুটি হ'ল ষড়যন্ত্র বিন্যাসে চক্রান্ত ক্ষেত্রটি বিভক্ত করা এবং তারপরে তাদের প্রতিটি বর্ণের মধ্যে কতগুলি পয়েন্ট রয়েছে তা অনুসারে তাদের রঙ করুন (উদাহরণস্বরূপ হালকা থেকে অন্ধকারে) color বড় ডেটাসেটের প্লট করা প্রায় ভাল করার উপায় হতে পারে যা অন্যথায় কেবল কালো রঙের আকারে পরিণত হওয়ার প্রবণতা রয়েছে।
পিটার এলিস

@ ডেভিডভ্যান্ডেনবোস - আমি একটি উদাহরণ যোগ করেছি
পিটার এলিস

(মন্তব্যটির বাকি অংশ) @ পিটারএলিস স্পষ্টির জন্য ধন্যবাদ। এটি ডেটা ভিজ্যুয়ালাইজ করার একটি দুর্দান্ত উপায় I এটি আমি ব্যবহার করি এমন ভৌগলিক তাপের মানচিত্রের সাথে সাদৃশ্য। আপনি কি আর এ তৈরি করেছেন?
ডেভ

হ্যাঁ, আর, ggplot2 প্যাকেজ ব্যবহার করে - এই উদ্দেশ্যটির জন্য খুব ভাল এবং একবার বেসিকগুলি পেয়ে গেলে বেশ সোজা।
পিটার এলিস

9

লগ স্কেলগুলি সম্পর্কে অন্য একটি নিফটি বিষয় হ'ল তারা অনুপাতকে প্রতিসাম্যযুক্ত করে তোলে। উদাহরণস্বরূপ, এটি পছন্দ করুন: এখানে চিত্র বর্ণনা লিখুন


9
একই প্লটটি লিনিয়ার স্কেলে দেখতে ভাল লাগবে, তুলনা করার জন্য
নিকো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.