+1 to @ নিকস্যাবেকে, কারণ 'প্লটটি আপনাকে কেবল "কিছু ভুল" বলে দেয় যা প্রায়শই কিউকিউ প্লট ব্যবহার করার সর্বোত্তম উপায় (কারণ কীভাবে এটি ব্যাখ্যা করতে হবে তা বোঝা মুশকিল)। তবে কীভাবে কীভাবে কীভাবে তৈরি করা যায় তা চিন্তা করে কীভাবে একটি কিউকি প্লটটির ব্যাখ্যা করা যায় তা শেখা সম্ভব।
আপনি আপনার ডেটা বাছাই করে শুরু করবেন, তারপরে আপনি ন্যূনতম মান থেকে সমান শতাংশ হিসাবে গ্রহণের পথটি গণনা করবেন। উদাহরণস্বরূপ, আপনার যদি 20 ডেটা পয়েন্ট থাকে, যখন আপনি প্রথমটি গণনা করেন (সর্বনিম্ন), আপনি নিজেকে বলবেন, 'আমি আমার ডেটা 5% গণনা করেছি'। আপনি শেষ না হওয়া পর্যন্ত আপনি এই প্রক্রিয়াটি অনুসরণ করবেন, যার পর্যায়ে আপনি আপনার 100% ডেটা দিয়ে গেছেন। এই শতাংশের মানগুলি তাত্ত্বিক স্বাভাবিক (যেমন, একই গড় এবং এসডি সহ স্বাভাবিক) থেকে একই শতাংশের মানের সাথে তুলনা করা যেতে পারে।
আপনি যখন এগুলি প্লট করতে যান, আপনি আবিষ্কার করতে পারবেন যে আপনার শেষ মানটি যা 100% এর সাথে সমস্যা রয়েছে কারণ আপনি যখন একটি তাত্ত্বিক স্বাভাবিকের 100% পেরিয়ে গেছেন তখন আপনি 'অনন্ত' হন। শতাংশ গণনা করার আগে আপনার ডাটাতে প্রতিটি বিন্দুতে ডিনোমিনেটরে একটি সামান্য ধ্রুবক যুক্ত করে এই সমস্যাটি মোকাবেলা করা হয়। একটি সাধারণ মান হ'ল ডিনোমিনেটরে 1 যুক্ত করা; উদাহরণস্বরূপ, আপনি আপনার 1 ম (20 এর) ডেটা পয়েন্ট 1 / (20 + 1) = 5% কল করবেন এবং আপনার শেষটি হবে 20 / (20 + 1) = 95%। এখন আপনি যদি এই সম্পর্কিত পয়েন্টগুলি সম্পর্কিত তাত্ত্বিক স্বাভাবিকের তুলনায় প্লট করেন তবে আপনার পিপি প্লট হবে(সম্ভাবনার বিরুদ্ধে সম্ভাব্য পরিকল্পনা করার জন্য)। এই জাতীয় প্লট সম্ভবত আপনার বিতরণ এবং বিতরণের কেন্দ্রে একটি স্বাভাবিকের মধ্যে বিচ্যুতিগুলি দেখায়। এটি কারণ সাধারণ বন্টনের% distribution% + +-- ১ এসডির মধ্যে থাকে, সুতরাং পিপি-প্লটগুলিতে সেখানে চমৎকার রেজোলিউশন থাকে এবং অন্য কোথাও খারাপ রেজোলিউশন থাকে। (এই বিষয়ে আরও তথ্যের জন্য, আমার উত্তরটি এখানে পড়তে সাহায্য করতে পারে: পিপি-প্লট বনাম কিউকিউ-প্লট ।)
প্রায়শই, আমরা আমাদের বিতরণের লেজগুলিতে কী ঘটছে তা নিয়ে আমরা সবচেয়ে উদ্বিগ্ন। সেখানে আরও ভাল রেজোলিউশন পেতে (এবং এর মধ্যে আরও খারাপ রেজোলিউশন) পেতে আমরা এর পরিবর্তে একটি কিউকি প্লট তৈরি করতে পারি। আমরা আমাদের সম্ভাবনার সেটগুলি গ্রহণ করে এবং এটিকে সাধারণ বিতরণের সিডিএফের বিপরীত মাধ্যমে পাস করে করি (এটি একটি স্ট্যাটাস বইয়ের পিছনের দিকে জেড-টেবিলটি পড়ার মতো - আপনি কোনও সম্ভাবনার মধ্যে পড়ে এবং একটি জেড- স্কোর)। এই অপারেশনের ফলাফলটি দুটি সেট কোয়ান্টাইল , যা একে অপরের বিরুদ্ধে একইভাবে চক্রান্ত করা যেতে পারে।
@ হুবহু ঠিক আছে যে রেফারেন্স লাইনটি পরে (সাধারণত) পয়েন্টের মাঝামাঝি 50% (অর্থাৎ প্রথম চৌকোটি থেকে তৃতীয় পর্যন্ত) মধ্য দিয়ে সর্বোত্তম ফিটিং রেখাটি খুঁজে পাওয়ার পরে প্লট করা হয়। প্লটটি পড়া সহজ করার জন্য এটি করা হয়। এই লাইনটি ব্যবহার করে, আপনি এই প্লটটি ব্যাখ্যা করতে পারেন যে আপনি আপনার বন্টনের কোয়ান্টাইলগুলি পুচ্ছের মধ্যে যাওয়ার সময় ক্রমশ সত্যিকারের স্বাভাবিক থেকে সরে যায় কিনা। (দ্রষ্টব্য যে কেন্দ্র থেকে আরও পয়েন্টের অবস্থানটি নিকটবর্তীগুলির তুলনায় সত্যই স্বতন্ত্র নয়; সুতরাং আপনার নির্দিষ্ট হিস্টোগ্রামে, 'কাঁধ' পৃথক হওয়ার পরে লেজগুলি একত্রিত হয়েছিল বলে মনে হয় না) কোয়ান্টাইলগুলি বোঝায় না এখন আবার একই।)
প্রদত্ত প্লটযুক্ত বিন্দুর তুলনায় অক্ষ থেকে পড়া মানগুলি বিবেচনা করে বিশ্লেষণ করে আপনি কিউকি প্লটটির ব্যাখ্যা করতে পারেন। যদি একটি সাধারণ বিতরণ দিয়ে ডেটাগুলি ভালভাবে বর্ণিত হয় তবে মানগুলি একই রকম হওয়া উচিত। উদাহরণস্বরূপ, একেবারে বাম নীচের কোণায় চূড়ান্ত বিন্দুটি : এর মানটি কোথাও অতীত , তবে এর মানটি কেবল সামান্য অতীত , সুতরাং এটি 'হওয়া উচিত' এর চেয়ে অনেক বেশি দূরে out সাধারণভাবে, কিউকিউ-প্লটের ব্যাখ্যা করার জন্য একটি সরল রুব্রিক হ'ল যদি প্রদত্ত লেজটি রেফারেন্স লাইন থেকে ঘড়ির কাঁটার বিপরীতে ঘুরিয়ে দেয় তবে তাত্ত্বিক স্বাভাবিকের চেয়ে আপনার বন্টনের সেই লেজের মধ্যে আরও বেশি ডেটা থাকে এবং যদি কোনও লেজ ঘড়ির কাঁটার দিকে ঘুরিয়ে দেয় তবে হয় কম- 3 y - .2এক্স−3y−.2তাত্ত্বিক স্বাভাবিকের চেয়ে আপনার বিতরণের সেই লেজের মধ্যে ডেটা। অন্য কথায়:
- যদি উভয় লেজগুলি ঘড়ির কাঁটার বিপরীতে ঘুরিয়ে দেয় তবে আপনার ভারী লেজ রয়েছে ( লেপটোকার্টসিস ),
- যদি উভয় লেজগুলি ঘড়ির কাঁটার দিকে মোচড় দেয়, আপনার হালকা লেজ রয়েছে (প্ল্যাটিকুর্টিসিস),
- যদি আপনার ডান লেজটি ঘড়ির কাঁটার বিপরীতে এবং আপনার বাম লেজটি ঘড়ির কাঁটার বিপরীতে ঘুরিয়ে দেয় তবে আপনার ডান স্কু রয়েছে
- যদি আপনার বাম লেজটি ঘড়ির কাঁটার বিপরীতে এবং ডান লেজটি ঘড়ির কাঁটার বিপরীতে ঘুরিয়ে দেয় তবে আপনি স্কু বামে রেখেছেন