চূড়ান্ত আউটলেটারের সাথে বক্স প্লট কীভাবে উপস্থাপন করবেন?


17

আমি কিছু তথ্য উপস্থাপন সম্পর্কে কিছু গাইডেন্স ব্যবহার করতে পারি।

এই প্রথম প্লটটি সাইটোকাইন আইএল -10 এর ক্ষেত্রে কেস-নিয়ন্ত্রণের তুলনা। আমি 99% ডেটা অন্তর্ভুক্ত করতে আমি y অক্ষটি ম্যানুয়ালি সেট করেছি।

ম্যানুয়াল ওয়াই অক্ষ সহ আইএল -10

আমি ম্যানুয়ালি এটি সেট করার কারণটি হ'ল কেস গ্রুপের চূড়ান্ত আউটলেট রয়েছে। আউটলেটারের সাথে

আমার সহযোগীরা আমাদের ডেটাসেটে আউটলেট অপসারণ করতে দ্বিধা বোধ করছেন। আমি এটির সাথে ঠিক আছি, তবে তারা তা পছন্দ করবে না। এটা সুস্পষ্ট সমাধান হতে চাই। তবে যদি আমি সমস্ত ডেটা রাখি এবং এই আউটলেটটিকে অপসারণ না করতে পারি তবে কীভাবে আমি এই বক্সপ্লটকে সর্বোত্তমভাবে উপস্থাপন করতে পারি? অক্ষরেখা? এটি কি কেবল প্রথম গ্রাফটি ব্যবহার করে গ্রহণযোগ্য এবং নোট করে যে এটি সমস্ত ডেটা অন্তর্ভুক্ত করার জন্য নির্মিত হয়েছিল? (এই বিকল্পটি আমার কাছে অসৎ মনে করে)। যেকোন পরামর্শই মহৎ হবে।


5
কেন উভয় প্লট উপস্থাপন ?
অ্যালেক্সিস

উত্তর:


23

আমি বলব যে এইগুলির মতো ডেটা সহ আপনাকে সত্যিকার অর্থে একটি রূপান্তরিত স্কেলে ফলাফল প্রদর্শন করা দরকার। বাক্সের প্লটটি কীভাবে আঁকতে হবে তার চেয়ে এটি প্রথম জরুরি এবং আরও গুরুত্বপূর্ণ বিষয়।

তবে ফ্র্যাঙ্ক হ্যারেলের প্রতিধ্বনিত হ'ল নূন্যতম বক্স প্লটের চেয়েও কিছু তথ্যবহুল কিছু অনুরোধ করার পরেও কিছু চূড়ান্ত বিষয় চিহ্নিত করা। আপনার কাছে আরও অনেক তথ্য দেখানোর পর্যাপ্ত জায়গা রয়েছে। এখানে অনেকগুলি উদাহরণগুলির মধ্যে একটি, একটি হাইব্রিড বক্স এবং কোয়ান্টাইল প্লট। আপনার তথ্য হিসাবে, দুটি গ্রুপ তুলনা করা হয়।

এখানে চিত্র বর্ণনা লিখুন

আমি এই দুটি পয়েন্ট এক এক করে নিয়ে আরও বলব।

রুপান্তরিত স্কেল

সহজতম ক্ষেত্রে, আপনার সমস্ত মান ইতিবাচক হতে পারে এবং তারপরে আপনাকে প্রথমে লগারিদমিক স্কেল ব্যবহার করার চেষ্টা করা উচিত।

আপনার যদি সঠিক জিরো থাকে তবে স্কোয়ার রুট বা কিউব রুট স্কেলটি এখনও চরম স্কিউনেস উন্নত করবে। কিছু লোক লগ (মান + ধ্রুবক) দ্বারা খুশি, যেখানে ধীরে ধীরে ধীরে ধীরে ধীরে ধীরে 1 থাকে, জিরোগুলির সাথে লড়াইয়ের উপায় হিসাবে।

রুপান্তরিত স্কেল ব্যবহারের বক্স প্লটের জন্য প্রভাবগুলি সূক্ষ্ম।

আপনি যদি উচ্চতর কোয়ার্টাইল + 1.5 আইকিউআর বা নিম্ন কোয়ার্টাইল - 1.5 আইকিউআরের বাইরে পৃথকভাবে সমস্ত পয়েন্টগুলি দেখানোর সাধারণ টুকি কনভেনশন ব্যবহার করেন তবে যুক্তিযুক্তভাবে সেই সীমাগুলি রূপান্তরিত স্কেলে গণনা করা উচিত। যে না মূল স্কেলে সেই সীমা গণক, তারপর রূপান্তর হিসাবে একই।

পরিবর্তে আমি এখনও হুইস্কারের শেষের জন্য কোয়ান্টাইল নির্বাচন করার সংখ্যালঘু সম্মেলন বলে মনে করি support এর বেশ কয়েকটি সুবিধার মধ্যে একটি হ'ল ট্রান্সফর্মের কোয়ান্টাইল = কোয়ান্টাইলের রূপান্তর, বেশিরভাগ ক্ষেত্রে গ্রাফিকাল উদ্দেশ্যে কমপক্ষে নিবিড়ভাবে যথেষ্ট। (ছোট মুদ্রণটি যখনই সংলগ্ন অর্ডারের পরিসংখ্যানের মধ্যে লিনিয়ার ইন্টারপোলেশন দ্বারা কোয়ান্টাইলগুলি গণনা করা হয়))

এই কোয়ান্টাইল সম্মেলনটি ক্লিভল্যান্ড (1985) দ্বারা মোটামুটি সুস্পষ্টভাবে প্রস্তাব করেছিল was রেকর্ডের জন্য, বর্ধিত বাক্স প্লটগুলি বাক্সে কোয়ার্টাইলস, পাতলা বাক্সে বহির্মুখের (12.5 এবং 87.5% পয়েন্ট) এবং ডেটার স্ট্রিপ প্লটগুলি ভূগোল এবং জলবায়ুবিদ্যায় (যেমন) ম্যাথিউজ (1936) এবং গ্রোভ (1956) এর অধীনে ব্যবহৃত হত নাম "ছড়িয়ে পড়া ডায়াগ্রাম"।

বক্স প্লটের চেয়ে বেশি

বাক্স প্লটগুলি ১৯ 1970০ সালের দিকে টুকি দ্বারা পুনরায় উদ্ভাবন করা হয়েছিল এবং তার 1977 সালের বইটিতে সর্বাধিক দৃশ্যমানভাবে প্রচার করা হয়েছিল। তাঁর বেশিরভাগ উদ্দেশ্য ছিল গ্রাফিকগুলি প্রচার করা যা অনানুষ্ঠানিক অন্বেষণে কলম (সিল) এবং কাগজ ব্যবহার করে দ্রুত আঁকতে পারে। তিনি সম্ভাব্য বিদেশিদের সনাক্ত করার উপায়গুলিও পরামর্শ দিচ্ছিলেন। এটি দুর্দান্ত ছিল, তবে এখন আমাদের সকলের কম্পিউটারে অ্যাক্সেস রয়েছে গ্রাফগুলি আঁকতে কোনও ব্যথা নেই, যদি সমস্ত ডেটা না হয় তবে কমপক্ষে আরও বিশদ বিবরণ। বক্স প্লটের সংক্ষিপ্ত ভূমিকা মূল্যবান, তবে কোনও গ্রাফ সূক্ষ্ম কাঠামোটি প্রদর্শন করতে পারে, কেবল আকর্ষণীয় বা গুরুত্বপূর্ণ ক্ষেত্রেই। (এবং গবেষকরা যা মনে করছেন উদ্বেগহীন বা গুরুত্বহীন তা তাদের পাঠকদের কাছে আরও আকর্ষণীয় হতে পারে))

সবচেয়ে ভাল কাজ করে কি সম্পর্কে ভদ্র মতানৈক্য জন্য প্রচুর অবকাশ আছে, তবে আমার দৃষ্টিতে খালি বক্স প্লটগুলি বরং বিক্রয় করা হয়েছে।

স্ট্যাটা ব্যবহারকারীরা প্রোগ্রামটিতে আরও খুঁজে পেতে পারেন যা এই স্ট্যাটালালিস্ট পোস্টে চিত্রটি আঁকেছে । অন্যান্য সফ্টওয়্যার ব্যবহারকারীদের ভাল বা আরও ভাল কিছু আঁকতে কোনও অসুবিধা পাওয়া উচিত নয় (অন্যথায় কেন সেই সফ্টওয়্যারটি ব্যবহার করুন?)

ক্লেভল্যান্ড, WS 1985. গ্রাফিকিং ডেটার উপাদানসমূহ। মন্টেরি, সিএ: ওয়েডসওয়ার্থ।

গ্রোভ, এটি 1956. নাইজেরিয়ার মাটির ক্ষয়। ইস্পাত, আরডাব্লু এবং ফিশারে, ব্রিটিশ গ্রীষ্মমন্ডলীয় ভূমিতে সিএ (এড) ভৌগলিক প্রবন্ধগুলি। লন্ডন: জর্জ ফিলিপ, 79-111।

ম্যাথিউজ, এইচএ 1936. কিছু পরিচিত ভারতীয় বৃষ্টিপাতের একটি নতুন দৃশ্য। স্কটিশ ভৌগলিক ম্যাগাজিন 52: 84-97।

টুকি, জেডাব্লু 1977. অনুসন্ধানের তথ্য বিশ্লেষণ। পড়া, এমএ: অ্যাডিসন-ওয়েসলি


1
আমি এর আগে বক্স প্লট এবং ইসিডিএফগুলির এই জাতীয় জুস্টিপজিশনটি আগে কখনও দেখিনি। সত্যিই ঠাণ্ডা! পৃথক প্যানেলে দুটি ইসিডিএফকে ওভারলেল করার বিষয়ে আপনার কী ধারণা?
ফ্রাঙ্ক হ্যারেল

2
@ ফ্র্যাঙ্ক হ্যারেল ধন্যবাদ ওভারলেলিংও একটি ভাল ধারণা। আমার কাজের কয়েকটি উদাহরণের জন্য উদাহরণস্বরূপ stata-jorter.com/sjpdf.html?articlenum=gr0018 দেখুন ।
নিক কক্স

14

নিকের দুর্দান্ত উত্তর থেকে কিছু না নেওয়ার জন্য, যা আমি মনে করি একটি টিক এবং উত্সাহের পক্ষে ভাল - তবে আমি কিছু সম্ভাবনাগুলি ঘুরে দেখতে চেয়েছিলাম।

বিশাল আকারের বিভিন্ন অর্ডারগুলিতে এমন ভারী স্কু ডেটার সাহায্যে লগ-স্কেলে প্লট করা প্রায়শই বেশ প্রকাশিত হয়; মনে রাখবেন যে আপনার এখনও মূল মানগুলিতে টিক চিহ্ন এবং টিক চিহ্নের লেবেল থাকতে পারে। (আমি রূপান্তর সম্পর্কিত নিকের পয়েন্টগুলির সাথে একমত, তাই আমি এর বেশি আর প্রসারিত করব না।)

রূপান্তরের পাশাপাশি অন্য একটি বিকল্প হ'ল আপনার দ্বিতীয় চক্রান্তের মতো কিছু করা, তবে প্লট করা হয়নি এমন সমস্ত মানের একটি ইঙ্গিত অন্তর্ভুক্ত:

  এখানে চিত্র বর্ণনা লিখুন

এইভাবে আপনি বিদেশী অপসারণ করছেন না , কেবল তাদের আলাদাভাবে প্রদর্শন করছেন display

তবে আমি ফ্র্যাঙ্ক এবং নিককে একটি সরল বক্সপ্লটের চেয়ে আরও তথ্যবহুল ডিসপ্লে ব্যবহার করার পরামর্শ দিয়ে যোগ দিয়েছি - নিকের পোস্টে কোয়ান্টাইল প্লটের সাথে একটি বক্সপ্লটের সংমিশ্রণটি বিশেষত একটি ভাল ধারণা বলে মনে হচ্ছে, যদিও কেউ কোয়ান্টাইল প্লটটি হালকাভাবে প্লট করতে পারে (বা এর অধীনে) , এখানে যেমন) এর পরিবর্তে সম্পর্কিত বাক্স:

  এখানে চিত্র বর্ণনা লিখুন

যদি আপনি এটির মতো কিছু না করেন (কেবল একটি সরল বক্সপ্লট নিয়ে যাচ্ছেন, বলুন), আমি যথেষ্ট সংকীর্ণ বাক্সগুলির পরামর্শ দেব।


3
কোয়ান্টাইল এবং বক্স প্লটগুলিকে সুপারিম্পোসিং করা আকর্ষণীয় is এটি আন্ডারলাইন করে যে বাক্স প্লটটি কোয়ান্টাইল প্লট হ্রাস, যদিও কিছু বক্স প্লটের কাছে তখন অপ্রয়োজনীয় বলে মনে হতে পারে। দুটি গ্রাফের মধ্যে সম্পর্কের উপর জোর দেওয়ার জন্য, উদাহরণস্বরূপ পারজেন, E. 1979 দেখুন Non ননপ্যারমেট্রিক স্ট্যাটিস্টিকাল ডেটা মডেলিং। আমেরিকান স্ট্যাটিস্টিকাল অ্যাসোসিয়েশনের জার্নাল 74: 105-121
নিক কক্স

আপনার কি ওপি'র ডেটাসেট আছে? অথবা আপনি গ্রাফটি স্ক্র্যাপ করছেন / এটিকে নকল করছেন?
নিক কক্স

2
@ নিক কেবল এটি নকল, মূলত; আমি কার্যকরভাবে চূড়ান্ত পয়েন্টগুলি স্ক্র্যাপ করেছিলাম (কেবল হাতে হাতে, সেখানে খুব কম ছিল), এবং তারপরে জ্ঞাত মানের (3 কোয়ার্টাইল এবং সর্বনিম্ন) মধ্যে 3 ইউনিফর্ম থেকে এবং উপরের কোয়ার্টাইল এবং শেষের মধ্যে নমুনা দিয়ে উপরের কোয়ার্টিলের নীচে মান উত্পন্ন করলাম এক্সপেনশনিয়ালগুলি সহ উপরের হুইস্কারগুলির মধ্যে এরপরে চূড়ান্ত পয়েন্টগুলি যুক্ত করা হয়েছে (কেবল আমার বক্সপ্লটগুলি দেখতে একই রকম হবে)। কমপক্ষে ধারণাটির মূল বক্তব্য এটি। চূড়ান্ত পয়েন্টগুলি সঠিক হবে না, তাই আমার প্লটের মুদ্রিত মানগুলি উদাহরণের মতো।
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেেন_বি আপনি যদি পছন্দ করেন তবে আমি একটি পৃথক প্রশ্ন জিজ্ঞাসা করতে পারি, তবে বক্সপ্লট দিয়ে কোয়ান্টাইল প্লটটি ওভারলে করার জন্য আপনি কোন পদ্ধতিটি ব্যবহার করেছেন?
টাভ্রোক

@ টাভ্রোক এটি লেখার আড়াই বছর হয়ে গেছে, সুতরাং আমি অনুমান করছি। pointsস্পষ্টত করণীয় হ'ল কোয়ান্টাইল মানগুলি প্রদর্শন করার জন্য কল করা (এটি xs=sort(x); points(ppoints(xs),xs)বক্সপ্লটের পরে কিছুটা লাইক বরাবর দেখায় , তবে কাছাকাছি পরীক্ষায় পয়েন্টগুলি বক্সপ্লটের নীচে থাকে , সুতরাং এটি প্লট হতে পারে তবে অ্যাড = সত্যের সাথে বক্সপ্লট হতে পারে বা এটি
বক্সপ্লট

5

আমি বর্ধিত বাক্স প্লট বা বেহালা প্লট পছন্দ করি কারণ সেগুলিতে অনেক বেশি তথ্য রয়েছে। আমি সংযুক্ত নমুনার 0.01 এবং 0.99 কোয়ান্টাইলগুলিতে বর্ধিত বাক্স প্লটগুলি স্কেল করি। বিশদ জানতে http://biostat.mc.vanderbilt.edu/wiki/pub/Main/StatGraphCourse/ographicscourse.pdf দেখুন ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.