কিভাবে খাঁজ বক্স প্লট ব্যাখ্যা করতে


11

কিছু ইডিএ করার সময় আমি একটি ফ্যাক্টরের দুই স্তরের পার্থক্য চিত্রিত করতে একটি বক্স প্লট ব্যবহার করার সিদ্ধান্ত নিয়েছিলাম।

পথ ggplot বক্স চক্রান্ত অনুষ্ঠিত সন্তোষজনক কিন্তু সামান্য সরল (নীচে প্রথম চক্রান্ত) ছিল। বাক্স প্লটের বৈশিষ্ট্যগুলি নিয়ে গবেষণা করে আমি খাঁজ নিয়ে পরীক্ষা-নিরীক্ষা শুরু করি।

আমি বুঝতে পেরেছি যে ন্যাচগুলি মধ্যের চারদিকে সিআই প্রদর্শন করে, এবং যদি দুটি বাক্সে 'খাঁজ' ওপরে না যায় তবে 'দৃ strong় প্রমাণ' রয়েছে - 95% আত্মবিশ্বাসের স্তরে - যে মিডিয়ানরা পৃথক হয়।

আমার ক্ষেত্রে (দ্বিতীয় চক্রান্ত), notches অর্থপূর্ণভাবে ওভারল্যাপ হয় না। কিন্তু ডানদিকে বক্সের নীচে কেন সেই অদ্ভুত রূপটি গ্রহণ করে?

একটি বেহালা প্লটের একই ডেটা প্লট করা সম্পর্কিত বেহালার সম্ভাব্যতা ঘনত্ব সম্পর্কে অস্বাভাবিক কিছু ইঙ্গিত দেয় না।

চিত্র 1 বক্সপ্লট

ডুমুর 2 বক্সপ্লট খচিত


1
আপনার জিজিপ্লট কোডে আপনার फिल = ফ্যাক্টর (এএম) ব্যবহার করা উচিত যেহেতু বর্তমানে am একটি সংখ্যার ভেরিয়েবল হিসাবে ব্যবহৃত হচ্ছে।
rnso

যে @rnso একটি দুর্দান্ত স্পট
RDJ

কেউ কি মূল তথ্য পোস্ট করতে পারে? আমার ধারণা তারা এগুলির জন্য একটি আদর্শ বালির বাক্স থেকে এসেছে ggplot2। আমি পৃথক তথ্য পয়েন্টও প্লট করার ধারণাটি পছন্দ করি তবে অন্ধকার বাক্সের মধ্যে থাকা পয়েন্টগুলি অদৃশ্য হয়ে যাওয়া পর্যন্ত এটি হতাশ।
নিক কক্স

উত্তর:


18

আমার ক্ষেত্রে (দ্বিতীয় চক্রান্ত), notches অর্থপূর্ণভাবে ওভারল্যাপ হয় না। কিন্তু ডানদিকে বক্সের নীচে কেন সেই অদ্ভুত রূপটি গ্রহণ করে? আমি কীভাবে এটি ব্যাখ্যা করব?

এটি নির্দেশ করে যে 25 তম পার্সেন্টাইল প্রায় 21.5, 75 তম শতাংশ প্রায় 30.5। এবং খাঁজ এর নীচের এবং উপরের সীমা প্রায় 18 এবং 27 হয়।

একটি সাধারণ কারণ হ'ল আপনার বিতরণটি স্কিউড বা নমুনার আকার কম। খাঁজের সীমানা এর উপর ভিত্তি করে:

মিআমিএকটিএন±1.57×আমিপ্রশ্নঃআরএন

যদি মধ্যমা এবং 25 তম পার্সেন্টাইলের মধ্যবর্তী দূরত্ব এবং মিডিয়ান এবং 75 তম পার্সেন্টাইলের মধ্যে দূরত্ব অত্যন্ত পৃথক হয় (ডানদিকে একটিটির মতো) এবং / বা নমুনার আকার কম হয় তবে খাঁজটি আরও প্রশস্ত হবে। যদি এটি যথেষ্ট প্রশস্ত হয় যে 25 তম এবং 75 তম পার্সেন্টাইল (ওরফে, বাক্স) এর চেয়ে খাঁটির সীমানা আরও চরম, তবে খাঁজযুক্ত বাক্স প্লটটি এই "ভিতরের" আকারটি প্রদর্শন করবে।


1
আপনার বিস্তারিত ব্যাখ্যার জন্য অনেক ধন্যবাদ। আমাকে জিজ্ঞাসা করা যাক, কেন নীচের নীচের এবং উপরের সীমাগুলি প্রায় 17 এবং 24, প্রায় 18 এবং 27 নয় (ডান বক্সপ্লোটে)?
ডেনিস

@ ডেনিস, এটি ধরার জন্য ধন্যবাদ আমি এটি সংশোধন করেছি।
পেঙ্গুইন_কাইট
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.