"কখন বাক্সপ্লট ব্যবহার করবেন এবং কখন বারপ্লট" বিধি (থাম্বের?)


14

বাক-ও-হুইস্কার প্লট এবং বার চার্ট উভয়ই এনওওএ- র জন্য দ্য আর বুক অনুসারে গ্রাফিক্স (ক্রোলি, ২০১৩), তবে কোনটি আরও উপযুক্ত ? আমি মনে করি এটি পরিস্থিতির উপর নির্ভর করে ... কেউ কি আমাকে সহায়তা করতে পারে?


5
" যদিও একাধিক বিকল্প পরীক্ষার মাধ্যমে একটি সমস্যার সমাধান হতে পারে - সর্বদা একটি মাত্র পরীক্ষা থাকে যা ব্যবহার করা সবচেয়ে উপযুক্ত " - আমি এই বাক্যটির সাথে একমত নই; আমি মনে করি না যে এটি সবসময় সত্য।
গ্লেন_বি -রিনস্টেট মনিকা

5
আমি এখানে @ Glen_b এর সাথে একমত এবং প্রস্তাব দিচ্ছি যে এমনকি এই শব্দটিও মূল পয়েন্টটি মিস করে। সর্বাধিক উপযুক্ত পরীক্ষার সনাক্তকরণ হ'ল ডেটাগুলির জন্য সঠিক উত্পাদন প্রক্রিয়াটি জেনে নেওয়ার উপর নির্ভর করে, যা আমরা বলব, অস্বাভাবিক। এটি আরও সাধারণ যে বিবিধ সুবিধা এবং অসুবিধাগুলি সহ বেশ কয়েকটি সম্ভাব্য পরীক্ষা রয়েছে।
নিক কক্স

1
আমি মনে করি না যে ভাল পরিসংখ্যানগত চিন্তার কোনও সংক্ষিপ্ত বৈশিষ্ট্যগুলিতে আমি পরীক্ষারও (অনুমান বা তাত্পর্য) উল্লেখ করব ... আমি মনে করি এটি তবে একটি পক্ষই বিষয়। আপনার প্রশ্নটি এটিকে ছাড়াই যথেষ্ট স্পষ্ট।
নিক কক্স

উত্তর:


18

বিশেষ করে আনোভা গ্রাফিকাল চিত্রের জন্য:

  • আনোভা-র জন্য গ্রাফিকভাবে কিছুই না করে একটি বক্স প্লট বা বার চার্ট অনেক ভাল, তবে সাধারণভাবে প্লট করা হিসাবে, উভয়ই গ্রাফিকাল সারসংক্ষেপ হিসাবে অপ্রত্যক্ষ বা অসম্পূর্ণ।

  • আনোভা হল এক বা একাধিক প্রকারের পরিবর্তনের প্রসঙ্গে অর্থের তুলনা সম্পর্কে , তাই সর্বাধিক উপযুক্ত গ্রাফিকটি ন্যূনতমভাবে, মানে পাশাপাশি কাঁচা ডেটা প্রদর্শন করবে। গ্রুপ স্ট্যান্ডার্ড বিচ্যুতি (এসডি) বা সম্পর্কিত পরিমাণ কোনও ক্ষতি করবে না।

  • যদিও কিছু ধরণের বাক্স প্লট শোয়ের পাশাপাশি মিডিয়ানদেরও দেখা যায়, মানক প্রকারের মাধ্যমে মিডিয়েনস, কোয়ার্টাইলস এবং বিতরণের লেজগুলিতে কিছু তথ্য প্রদর্শিত হয়। সর্বাধিক প্রচলিত বৈকল্পিকটি মনে হয় যেটিতে পৃথক ডেটা পয়েন্টগুলি প্রদর্শিত হয় এবং কেবলমাত্র যদি তারা নিকটবর্তী চৌকোটি থেকে 1.5 আইকিআর বেশি দূরে থাকে। এটি হ'ল: আন্তঃআরক্ষীয় পরিসীমা আইকিআর উচ্চতর চতুর্ভুজ নিম্ন চতুর্ভুজ, সুতরাং প্লটগুলি পয়েন্টের মান হিসাবে উচ্চতর চতুর্ভুজ 1.5 আইকিউআরের চেয়ে বড় বা নিম্ন চতুর্ভুজের চেয়ে কম=+1.5 আইকিউআর। এ জাতীয় সম্মেলন স্থূল আউটলিয়ারগুলি দেখানোর ক্ষেত্রে সহায়ক হতে পারে যা আনোভার জন্য সমস্যাযুক্ত হতে পারে তবে মিডিয়ানরা বা কোয়ার্টাইল উভয়ই এএনওভাতে কোনও ভূমিকা রাখে না এবং মিডিয়ানদের আনুমানিক উপায়গুলি পরীক্ষা করার মতো বিষয় কিনা তা ধরে নেওয়া যায় না। সাধারণত, অভিজ্ঞ ডেটা বিশ্লেষকগণ উদাহরণস্বরূপ উচ্চারিত চিহ্নিত চিহ্নিত আউটলিয়ার এবং / বা বিতরণের অসমত্বকে এমন সমস্যার লক্ষণ হিসাবে গ্রহণ করেন যা পদক্ষেপের রূপান্তরকরণ বা অ-পরিচয় লিঙ্ক ফাংশন সহ সাধারণীকরণীয় রৈখিক মডেলের প্রয়োজন as তবুও এটি আশ্চর্যজনক যে কতগুলি পাঠ্যপুস্তক এবং অন্যান্য অ্যাকাউন্টগুলি যখন একটি আনোভা উপস্থাপন করা হচ্ছে তখন বাক্সের প্লট দেখায় তবে ঘরে হাতি নয়, ষড়যন্ত্র নয় এমন উপায়ের কথা উল্লেখ করবেন না।

  • বিপরীতভাবে, সবচেয়ে সাধারণ ধরনের বার চার্ট এই প্রেক্ষাপটে মানে এবং এসডিএস বা মান ত্রুটি দ্বারা ডেটা সংক্ষিপ্ত বিবরণ, কিন্তু অন্যথায় পৃথক ডাটা পয়েন্টের কোন ডিসপ্লে বাদ। সুতরাং, উদাহরণস্বরূপ, আউটলিয়ার বা চিহ্নিত অসমমিতিটি কেবলমাত্র বাইরের বাইরে লাইন থেকে বা পৃথক গোষ্ঠীর মধ্যে স্ফীত পরিবর্তনশীলতা থেকে অনুমান করা যায়।

সাধারণত, কোন ধরণের গ্রাফগুলি কার্যকর সে সম্পর্কে অনেকগুলি পরামর্শ রয়েছে তবে কোনটি সবচেয়ে ভাল তা সম্পর্কে সামান্য sensকমত্য। আমি মানদণ্ড হিসাবে পরামর্শ দেব যা একটি ভাল গ্রাফ দেখায়

  • ডেটাতে পরিবর্তনের সম্পূর্ণ প্যাটার্ন, অন্তত ব্যাকড্রপ বা প্রসঙ্গ হিসাবে

  • ডেটা সম্পর্কিত প্রাসঙ্গিক সংক্ষিপ্তসারগুলি, বিশেষত মডেলটির সাথে প্রাসঙ্গিক বা বর্ণনাকারীদের বিবেচনা করা হচ্ছে relevant

  • এমন ডেটাগুলির সাথে সম্ভাব্য সমস্যার ইঙ্গিত যা অনুমান করা হচ্ছে বলে সন্দেহ তৈরি করে।

অনেকগুলি ডিজাইন রয়েছে যা আনোভাতে সহায়তা করে, যেমন যুক্ত উপায় এবং এসএস সহ ডট বা স্ট্রিপ প্লট।

জন টুকির এই কাগজটি এখানে প্রাসঙ্গিক প্রচারমূলক গ্রাফ এবং বিশ্লেষণাত্মক গ্রাফের মধ্যে পার্থক্য ব্যাখ্যা করেছে । আনোভা-র অনেকগুলি গ্রাফিকাল চিত্রগুলি হ'ল প্রচুর বিশ্লেষণ ছাড়াই প্রচারের গ্রাফগুলি (দেখুন! গ্রুপগুলি খুব আলাদা) (এবং এই অ্যাপ্লিকেশনটিতে থাকা ডেটা বা কৌশলটির সীমাবদ্ধতা সম্পর্কে আমরা আর কী শিখতে পারি?)।


তাহলে বেহালা প্লটগুলি কীভাবে আদর্শ, এসডি এবং বহিরাগতদের সাথে আঁকা?
ziggystar

বেহালা প্লট সহায়ক হতে পারে। ব্যক্তিগতভাবে আমি কাঁচা ডেটার কাছাকাছি কিছু পছন্দ করি, যাতে আমি মোডালিটি এবং গ্রানুলারিটিও দেখতে পারি।
নিক কক্স

8

দয়া করে বারের চার্টগুলির মধ্যে বিভ্রান্ত হন না (প্রতিটি বারের আগ্রহের পরিমাণ দেখানোর জন্য একটি বার ব্যবহৃত হয়) এবং ডায়ামাইট প্লট (একটি বার প্রতিটি গ্রুপের গড়, এবং ত্রুটি বারগুলি দেখায়)। ডায়নামাইট প্লটগুলি গ্রহণযোগ্য নয় কারণ তারা বিনা কারণে অকারণে ডেটা বন্টনকে আড়াল করে।

হ্যাঁ আমি বুঝতে পারি যে এটি এখন পর্যন্ত সবচেয়ে সাধারণ ধরণের প্লট। এটি একটি বড় সমস্যা যা গবেষকরা তাদের ডেটার আকারের উপরে (নিম্ন) গুরুত্বকে প্রতিফলিত করে। যদি আপনি হত্যার অস্ত্রের সন্ধানকারী গোয়েন্দা হয়ে থাকেন তবে কোনও সাক্ষী আপনাকে 1) কেবল অস্ত্রটির অবস্থান এবং আকার বললে কি ভাল হত? বা 2) অবস্থান, আকার এবং আকৃতি?

http://biostat.mc.vanderbilt.edu/wiki/pub/Main/TatsukiRcode/Poster3.pdf


ডিনামাইট প্লট কেন আদর্শ নয় সে সম্পর্কে আপনার কি অন্যান্য সংস্থান আছে?
মিগুজ্জামান

@ এমগুজম্যান দুঃখিত, আমি করি না। আমি ভাবলাম কে এই ধারণাটি নিয়ে এসেছিল, সময়ের সাথে সাথে এর গ্রহণ, ইত্যাদি এবং সে সম্পর্কে কিছুই খুঁজে পেল না। আমি কল্পনা করেছিলাম এটি কম্পিউটারের আগের দিনগুলিতে +/- ত্রুটির মাধ্যমের প্রতিবেদনগুলি থেকে বিকশিত হয়েছিল। আমি ১৯৩০ এর দশক থেকে কাগজপত্রগুলি দেখেছি যা সম্পূর্ণ ডেটাসেটের টেবিলগুলি প্রকাশ করতে পরিচালিত করে তাই আমি নিশ্চিত নই যে অনুশীলনটি সত্যই কখনও ন্যায়সঙ্গত হয়েছিল। উদাহরণস্বরূপ: হিডরিচ এডাব্লু। বাচ্চাদের জনসংখ্যার মাসিক অনুমানটি হামের প্রতি "সংবেদনশীল", 1900–1931, বাল্টিমোর, মেরিল্যান্ড। আমি জে হাইগ 1933; 17: 613-636।
লাইভ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.