ভিজ্যুয়ালাইজেশন কি ডেটা পরিবর্তন করার পক্ষে যথেষ্ট যুক্তিযুক্ত?


13

সমস্যা

আমি প্রতিটি 30 টি প্যারামিটার দ্বারা ব্যাখ্যা করা বৈকল্পিক প্লট করতে চাই, উদাহরণস্বরূপ প্রতিটি প্যারামিটারের জন্য পৃথক বারের বারপ্লট এবং y অক্ষের সাথে বৈকল্পিক:

বিকল্প পাঠ

তবে, রূপগুলি 0 সহ ছোট মানগুলির দিকে দৃ strongly়ভাবে আঁকানো হয়, যেমন নীচের হিস্টোগ্রামে দেখা যায়:

বিকল্প পাঠ

আমি যদি মাধ্যমে তাদের রূপান্তর করি তবে ছোট মানগুলির মধ্যে পার্থক্য (নীচে হিস্টোগ্রাম এবং বারপ্লট) দেখতে সহজ হবে:log(x+1)

বিকল্প পাঠবিকল্প পাঠ

প্রশ্ন

log(x+1)

উত্তর:


13

এই "বলা হয়েছে শুরু লগারিদম " কিছু (দ্বারা যেমন , জন Tukey)। (কিছু উদাহরণের জন্য, গুগল জন টুকি "লগ শুরু করেছেন" ))

এটি ব্যবহার করা পুরোপুরি ঠিক। প্রকৃতপক্ষে, আপনি নির্ভর করতে পারেন যে নির্ভরশীল ভেরিয়েবলের বৃত্তাকার জন্য অ্যাকাউন্টে একটি ননজারো শুরুর মান ব্যবহার করতে হবে। উদাহরণস্বরূপ, নিকটতম পূর্ণসংখ্যার উপর নির্ভরশীল পরিবর্তনশীলকে গোল করে কার্যকরভাবে 1/12 এর প্রকৃত বৈকল্পিকতা থেকে বন্ধ করে দেওয়া হয়, যুক্তিসঙ্গত প্রারম্ভিক মানটি কমপক্ষে 1/12 হওয়া উচিত। (এই মানটি এই ডেটাগুলির সাথে খারাপ কাজ করে না 1 1 টির উপরে অন্যান্য মানগুলি ব্যবহার করে ছবিটি আসলে খুব বেশি পরিবর্তন করে না; এটি কেবল নীচের ডান চক্রান্তের সমস্ত মান প্রায় অভিন্নভাবে উত্থাপন করে))

ভেরিয়েন্স নির্ধারণের জন্য লোগারিদম (বা শুরু হওয়া লগ) ব্যবহার করার আরও গভীর কারণ রয়েছে: উদাহরণস্বরূপ, লগ-লগ স্কেলে আনুমানিক মানের বিপরীতে ভেরিয়েন্সের প্লটটির ope াল বৈকল্পিকতা স্থিতিশীল করার জন্য একটি বক্স-কক্স প্যারামিটার অনুমান করে । এই জাতীয় শক্তি-আইন কিছু সম্পর্কিত পরিবর্তনশীলগুলির সাথে বৈকল্পিকের ফিট করে often (এটি তাত্ত্বিক নয়, একটি অভিজ্ঞতাগত বক্তব্য))

যদি আপনার উদ্দেশ্যটি বৈকল্পিকগুলি উপস্থাপন করা হয় তবে যত্ন সহকারে এগিয়ে যান। অনেক শ্রোতা (বৈজ্ঞানিক ছাড়াও) কোনও লগারিদম বুঝতে পারে না, শুরু করা খুব কম। কমপক্ষে 1 এর শুরুর মানটি ব্যবহার করে অন্য কিছু শুরু মানের তুলনায় ব্যাখ্যা এবং ব্যাখ্যা করার জন্য কিছুটা সহজ হওয়ার যোগ্যতা রয়েছে has বিবেচনা করার মতো কিছু হ'ল তাদের শিকড়গুলি প্লট করা, যা অবশ্যই মানক বিচ্যুতি। এটি দেখতে এমন কিছু লাগবে:

বিকল্প পাঠ

নির্বিশেষে, যদি আপনার উদ্দেশ্য ডেটা অন্বেষণ করা, সেগুলি থেকে শেখা, কোনও মডেল ফিট করা বা কোনও মডেলকে মূল্যায়ন করা হয় তবে আপনার ডেটা এবং ডেটা-উত্পন্ন মানগুলির যুক্তিসঙ্গত গ্রাফিকাল উপস্থাপনা সন্ধান করার পথে কোনও কিছু পেতে দেবেন না যেমন এই রূপগুলি।


1
ব্যাখ্যা এবং সঠিক পরিভাষা / রেফারেন্সের জন্য আপনাকে ধন্যবাদ। শ্রোতারা একটি বৈজ্ঞানিক জার্নালের পাঠক এবং বিষয় হ'ল বৈচিত্র্য ক্ষয়; লগ ট্রান্সফর্মের ধারণাটি বোঝার একটি পূর্ব-প্রয়োজনীয়তা তবে আমি এখনও নিশ্চিত নই যে এই উপস্থাপনাটির আরও ন্যায্যতা প্রয়োজন - শিকড়গুলি একটি ভাল বিকল্প। ধন্যবাদ।
ডেভিড লেবাউর

3

এটা যুক্তিসঙ্গত হতে পারে। আরও ভাল প্রশ্ন জিজ্ঞাসা করতে হবে 1 যোগ করার উপযুক্ত নম্বর কিনা। আপনার সর্বনিম্ন কি ছিল? যদি এটির শুরুটি 1 হয়, তবে আপনি শূন্যের মানযুক্ত আইটেম এবং 1 মানযুক্ত আইটেমগুলির মধ্যে একটি নির্দিষ্ট বিরতি চাপিয়ে দিচ্ছেন study অধ্যয়নের ডোমেনের উপর নির্ভর করে অফসেট হিসাবে 0.5 বা 1 / e বেছে নেওয়া আরও বোধ করতে পারে। লগ স্কেলে রূপান্তরিত করার অর্থ হ'ল আপনার এখন একটি অনুপাত স্কেল রয়েছে।

তবে আমি প্লটগুলি দ্বারা বিরক্ত। আমি জিজ্ঞাসা করব যে এমন কোনও মডেল যা স্কিউ বিতরণের লেজের বেশিরভাগ ব্যাখ্যাযোগ্য বৈকল্পিকতা রাখে তাকে পছন্দসই পরিসংখ্যানগত বৈশিষ্ট্য হিসাবে বিবেচনা করা হয় কিনা? আমি মনে করি না.


এটি স্পষ্ট কিনা তা সম্পর্কে আমি নিশ্চিত নই, তবে হিস্টোগ্রামগুলি বৈকল্পিকতার 30 টি মানের মধ্যে রয়েছে, এবং বারপ্লটগুলি বিবর্তনের কাঁচা মানগুলি, অর্থাত্ var <- c(0,0,1,3,10,100,150), hist(var), barplot(var), তাই আমি কয়েকটি পরামিতি বেশিরভাগ বৈকল্প্যের ব্যাখ্যা হিসাবে ব্যাখ্যা করি, এটি সবচেয়ে বেশি নয় বর্ণিত রূপটি লেজের মধ্যে রয়েছে। এটি কি আরও অর্থবোধ করে? অস্পষ্ট হলে দুঃখিত।
ডেভিড লেবাউর
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.