তুলনা করার জন্য বেহালা প্লট কীভাবে স্কেল করবেন?


14

আমি বেহালার প্লট আঁকার চেষ্টা করছি এবং ভাবছি যে তাদের গ্রুপে স্কেলিংয়ের জন্য কোনও গৃহীত সেরা অনুশীলন আছে কি না। এখানে আর তিনটি বিকল্প রয়েছে যা আমি আর mtcarsডেটা সেট ব্যবহার করার চেষ্টা করেছি (1973 সালের মোটর ট্রেন্ড গাড়ি, এখানে পাওয়া গেছে )।

সমান প্রস্থ

হতে কি মনে হয় মূল কাগজ * করে এবং কি আর vioplotআছে ( উদাহরণস্বরূপ )। আকৃতি তুলনা করার জন্য ভাল।

সমান অঞ্চল বেহালা প্লট

সমান অঞ্চল

প্রতিটি প্লট সম্ভাব্যতা প্লট হওয়ায় সঠিক অনুভূত হয় এবং তাই প্রতিটি স্থানাঙ্ক কিছু স্থানাঙ্কের জায়গার সাথে 1.0 এর সমান হওয়া উচিত। প্রতিটি গ্রুপের মধ্যে ঘনত্বের তুলনা করার জন্য ভাল তবে প্লটগুলি ওভারলেড করা থাকলে আরও উপযুক্ত বলে মনে হয়।

সমান প্রস্থের বেহালা প্লট

ওজনযুক্ত অঞ্চল

সমান ক্ষেত্রের মতো, তবে পর্যবেক্ষণের সংখ্যা দ্বারা ভারিত ighted 6-সিলটি তুলনামূলকভাবে পাতলা হয়ে যায় কারণ এই গাড়িগুলির সংখ্যা কম। গ্রুপগুলির মধ্যে ঘনত্বের তুলনা করার জন্য ভাল Good

ওজনযুক্ত অঞ্চল বেহালা প্লট

* বেহালা প্লট: একটি বক্স প্লট-ঘনত্ব ট্রেস সিনারগিস (ডিওআই: 10.2307 / 2685478)


1
প্লটগুলির উদ্দেশ্য, বৃহত পরিমাণে, কোন সমাধানগুলি উপযুক্ত তা নির্ধারণ করবে। তাহলে, আপনি কি তাদের সাথে দেখানোর চেষ্টা করছেন?
হোবার

@ শুভ প্রশ্ন, আমার সরাসরি উত্তর না থাকলেও। আমি ইডিএর জন্য একটি গ্রাফিক সরবরাহ করার চেষ্টা করছি এবং একটি ভাল সাধারণ ডিফল্ট খুঁজছি (এবং অন্যান্য বিকল্পগুলি পৃষ্ঠতলের জন্য যথেষ্ট কার্যকর কিনা)।
xan

আমি আপনাকে পরামর্শ দিতে চাই যে আপনি কোনও ডিফল্ট গ্রহণের পরিবর্তে আপনার উদ্দেশ্য অনুসারে প্লটগুলি নিয়ন্ত্রণ করুন।
হুঁশিয়ারি

আমি পরামর্শ দেব যে আপনার "ওজনযুক্ত অঞ্চলগুলি" সংস্করণটি "একটি জনগোষ্ঠীর উপগোষ্ঠীর তুলনা করার জন্য ভাল" কারণ এটি পুরো জনসংখ্যার আকৃতি পেতে প্রস্থগুলি যুক্ত করা বুদ্ধিমান হতে পারে।
হেনরি

আমি সমান অঞ্চল পছন্দ করি, বিতরণের আকারের ভিজ্যুয়াল এফেক্টটি সংরক্ষণ করি। তারপরে নমুনা মাপ দেখানো থার্মোমিটারগুলি সহ গ্রাফের পরিপূরক করুন বা বেহালার পাশে কেবল নমুনা আকারের পাঠ্য উপস্থাপনা ব্যবহার করুন।
ফ্র্যাঙ্ক হ্যারেল

উত্তর:


4

বাক্স প্লটগুলি বিতরণের পরিকল্পনামূলক সংক্ষিপ্তসারগুলির জন্য ব্যবহৃত হয়। বেহালা প্লটগুলি কেবল বাক্স প্লট যেখানে Q1, Q2 এবং Q3 বাক্সগুলি বিস্তৃত পরিমাণে কোয়ান্টাইল দ্বারা প্রতিস্থাপিত হয়। যে কারণে, আমি মনে করি গ্রহণযোগ্য অনুশীলনটি গ্রুপগুলিতে অভিন্ন প্রস্থ ব্যবহার করা।

যাইহোক, আপনি একটি ভাল বিষয় তুলে ধরেছেন: গ্রুপগুলির মধ্যে ঘনত্বগুলি কীভাবে তুলনা করা উচিত? উত্তর আপনি প্রতিটি গ্রুপের নিজস্ব জনসংখ্যা বা উপ-জনসংখ্যা হিসাবে দেখছেন কিনা তার উপর নির্ভর করে।

Σআমিপিআমি=1


বেহালা প্লটগুলি মূলত হাইব্রিড বক্স প্লট এবং ঘনত্বের ট্রেস হিসাবে সংজ্ঞায়িত এবং সংজ্ঞায়িত করা হয়েছিল। একটি তাত্ক্ষণিক গুগল দেখায় যে অনুশীলনে অনেকগুলি প্লটটি বেহালা প্লট হিসাবে প্রকাশ্য হিসাবে বাক্স বাদ দেয় এবং অনেকগুলি এর মতো কোয়ান্টাইলগুলি দেখায় না। সুতরাং, সংজ্ঞাগুলি এখানে বিস্তৃত।
নিক কক্স

5

সত্যিই, আমি মনে করি আপনি এটি ভুল দিক থেকে এগিয়ে যাচ্ছেন। তিনটি প্লটই আপনাকে স্পষ্টভাবে মান সহ তথ্য জানায় - অন্যথায়, কোন প্লটটি ব্যবহার করবেন তা আপনি বিবেচনা করবেন না। অনুসন্ধানের ডেটা বিশ্লেষণ আপনার ডেটা বোঝার বিষয়ে। যেখানে এটি প্রত্যাশা মেনে চলে। যেখানে এটি না। এটি একাধিক ভেরিয়েবলের আকারে কেমন।

ইডিএ করার সম্পূর্ণ পয়েন্টটি মূল্যায়ন করছে যে আমাদের ডিফল্ট, সেগুলি বিতরণ হোক বা কোলিনারিটি অনুমান করা হোক, পরিসংখ্যানের মডেল যেটি ব্যবহার করা হচ্ছিল, ইত্যাদি সুবিচারযোগ্য tified যেমন, একটি "ডিফল্ট" ইডিএর ধারণাটি কিছুটা ত্রুটিযুক্ত।

এগুলির সমস্তটির দিকে নজর দিন - বা কমপক্ষে সমস্ত প্লট যা আপনি জিজ্ঞাসা করতে চান সেই প্রশ্নের সাথে সম্পর্কিত। ইডিএ পর্যায়ে নিজেকে "কী আকর্ষণীয়" এবং "আমি কী উপেক্ষা করব" এ নিজেকে আটকা দেওয়ার কোনও কারণ নেই। এবং যদি আমরা কেবল ডিফল্টগুলির মাধ্যমে ডেটা ফিড করি তবে এটি সত্যই প্রথম স্থানটিতে ইডিএ নয়।


ইডিএ সম্পর্কে আলোকিত মন্তব্যের জন্য +1, যদিও এটি এখনও স্পষ্ট নয় (আমার কাছে) ওপি
ইডিএর

@ সিএইচএল ওপির কয়েকটি মন্তব্যে তিনি এরপরে এমনটাই পরামর্শ দিয়েছেন। যদি আমি কেবল "এর মধ্যে কোনটি বেশি কার্যকর" উত্তর হয় তবে আমি যে উত্তরটি ভয় করি তা আরও একটি অস্পষ্ট "কুয়া" হয়ে যায়, আপনি কী দেখাতে চান? "
ফোমাইট

আহ, আমি যে মন্তব্য মিস ... সুতরাং আপনার প্রতিক্রিয়া একটি +1 মূল্য আবার, কিন্তু আমি পারব না :(
chl

4

এবং ব্যান্ডউইথ সম্পর্কে কি? তুমি কি ভেবেছ?

আপনি যদি পিডিএফ পেতে আপনার সফ্টওয়্যারটির ডিফল্ট সেটিংস ব্যবহার করেন তবে আপনি সম্ভবত গাউসীয় কার্নেলের অনুকূল ব্যান্ডউইদথের জন্য থাম্বের নিয়মটি ব্যবহার করছেন। এই 'সর্বোত্তম ব্যান্ডউইথ' তারপরে প্রতিটি উপসেটের জন্য আলাদা হতে পারে। এখন নিজেকে জিজ্ঞাসা করুন, আকারগুলি কি এখনও তুলনীয়? এটি এমনও হতে পারে যে, ডাবল স্ট্যান্ডার্ডগুলির সাথে একই ভেরিয়েবল (কার্নেল ঘনত্বের প্রাক্কলন) পরিমাপ করতে চলে।

কার্নেল ঘনত্বের অনুমানের জন্য ডান ব্যান্ডউইদথ (কোনও ধরণের ক্রস-বৈধকরণ) পাওয়ার জন্য পরিষ্কার বিধি তৈরি করা হয়েছে, তবে বেহালা প্লটগুলির জন্য এগুলি বেশিরভাগ উপেক্ষা করা হয়। গুরুত্বপূর্ণ হতে পারে, যখন নমুনার আকারগুলি অনেক আলাদা হয়।

আমার এখনই এই সমস্যা হচ্ছে। আপনি এটি সম্পর্কে কি মনে করেন? কীভাবে সমাধান করবেন? কোন মন্তব্য ব্যাপকভাবে প্রশংসা করা হয়।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.