পাইথনে কিউকিউ প্লট


11

আমি নিম্নলিখিত কোড ব্যবহার করে একটি কিউকি প্লট তৈরি করেছি। আমি জানি যে কিউকিউ প্লটটি ডেটা বিতরণ করা হয় কিনা তা পরীক্ষা করতে ব্যবহৃত হয়। আমার প্রশ্নটি হল x এবং y অক্ষের লেবেলগুলি কিউকিউ প্লটে ইঙ্গিত দেয় এবং সেই r বর্গ মানেরটি কী বোঝায় ??

  N = 1200
  p = 0.53
  q = 1000
  obs = np.random.binomial(N, p, size = q)/N

import scipy.stats as stats

z = (obs-np.mean(obs))/np.std(obs)

stats.probplot(z, dist="norm", plot=plt)
plt.title("Normal Q-Q plot")
plt.show()

এখানে চিত্র বর্ণনা লিখুন

আমি জানি যে কিউকিউ প্লট নিয়ে ইতিমধ্যে আলোচনা আছে , তবে আমি সেই আলোচনার মধ্য দিয়ে যাওয়া সত্ত্বেও ধারণাটি বুঝতে পারি না।


4
এটি সংযুক্ত থ্রেডের সদৃশ হওয়ার খুব কাছাকাছি - পাইথন বনাম আর এখানে কোনও গুরুত্বপূর্ণ পার্থক্য নয় - তবে দিকটি নতুন। সদৃশতা এড়াতে প্রশ্ন এবং উত্তরগুলির পক্ষে সেই দিকটিতে আরও কিছুটা ফোকাস করা ভাল ধারণা হতে পারে। (আমি ভাবছি যে ভুল বোঝাবুঝি হওয়ার প্রবণ কিনা , যেহেতু দুর্বল ফিটের জন্যও, কিউকিউ প্লটে অনিবার্য যে upর্ধ্বমুখী opeাল মানে আমরা শূন্যের চেয়ে কিছুটা বড় একটি expect আশা করি । সুতরাং মানগুলি যা কোনও রিগ্রেশনে বেশ চিত্তাকর্ষক হতে পারে বিশ্লেষণটি এখানে এতটা চিত্তাকর্ষক নাও হতে পারে))আর 2 আর 2R2R2R2
সিলভারফিশ

@Silverfish আমি এটা সহায়ক বা উপযুক্ত ফোকাস করতে পাবেন না । কিউকিউ প্লটগুলি সাধারণত দেখা যায় , কেবল অগণিত মানের একটি টেবিলের সাথে রিপোর্ট করা হয় না । ভিজ্যুয়ালাইজেশন যতক্ষণ থাকবে, কেন এটি একটি সংখ্যায় হ্রাস করবেন? যদি কিউকিউ প্লটটি "খারাপ" দেখায়, তবে কোনওভাবে "ভাল" দেখাচ্ছে, আপনি কি এখনও দাবি করেন যে এটি সাধারণ? বেশিরভাগ ভাল প্যাকেজগুলি ঠিক এই কারণে না। এই ভার্সেস-বনাম-মুহুর্তের তর্কটির এমনকি একটি চতুর নাম রয়েছে: আনসকম্বের চৌকোটি আর 2 আর 2 আর 2R2R2R2R2
মাইক উইলিয়ামসন

@ মাইকউইলিয়ামসন আমি একমত যে বিশেষভাবে কার্যকর প্রমাণিত হওয়ার সম্ভাবনা নেই (এটি আমার বক্তব্যের অংশ ছিল, যদিও আমি এটি খারাপভাবে প্রকাশ করেছি)। আমার মূল বক্তব্যটি ছিল যে "কিউকিউ-প্লটের ব্যাখ্যা কীভাবে" এখানে দীর্ঘ আলোচনা করা হয়েছে , যেমন প্রশ্নটি ইতিমধ্যে নোট করেছে - ডুপ্লিকেট হিসাবে এই থ্রেডটি বন্ধ না করা হওয়ার একমাত্র কারণটি হ'ল আর about সম্পর্কে অনুসন্ধান , যাতে সত্যই এখানে উত্তরের সাথে আলোচনা করা উচিত (এটি যদি বলা হয় যে এটি কার্যকর নয়!)আর 2R2R2
সিলভারফিশ

আপনি কি কিউ কিউ প্লট করার বিষয়ে নিশ্চিত? help(probplot)বলে: probplotএকটি সম্ভাব্যতা প্লট উত্পন্ন করে, যা একটি কিউকিউ বা পিপি প্লটের সাথে বিভ্রান্ত হওয়া উচিত নয়।
আবুজাজ

উত্তর:


10

ম্যাকন্ডের উত্তরটি সঠিক, তবে মূল পোস্ট থেকে, আমি ভেবেছিলাম ভার্চিয়াটি কিছুটা সহজ করার জন্য এটি সহায়ক হতে পারে।

একটি কিউকিউ প্লট বলতে "কোয়ান্টাইল-কোয়ান্টাইল প্লট" বোঝায় ।

এটি এমন একটি প্লট যেখানে একটি সাধারণ (বা গাউসিয়ান) বন্টনকে একটি সরলরেখায় প্রদর্শিত করার জন্য অক্ষগুলি উদ্দেশ্যমূলকভাবে পরিবর্তিত হয় । অন্য কথায়, একটি নিখুঁতভাবে সাধারণ বিতরণ হ'ল = 1 এবং ইন্টারসেপ্ট = 0 সহ একটি লাইন অনুসরণ করবে।

অতএব, যদি প্লটটি - মোটামুটি - একটি সরলরেখা হিসাবে উপস্থিত না হয়, তবে অন্তর্নিহিত বিতরণটি স্বাভাবিক নয়। যদি এটি বাঁকায়, তবে প্রত্যাশার চেয়ে আরও বেশি "উচ্চ উড়ানের" মান রয়েছে। (লিঙ্কটি আরও উদাহরণ সরবরাহ করে))


  1. এক্স ও ওয়াই লেবেলগুলি কী উপস্থাপন করে?

তাত্ত্বিক quantiles x- অক্ষ বরাবর স্থাপন করা হয়। অর্থাত্, এক্স-অক্ষটি আপনার ডেটা নয় , এটি কেবল আপনার ডেটাটি কোথায় হওয়া উচিত ছিল তা যদি আপনার স্বাভাবিক হয় তবে এটি কেবল একটি প্রত্যাশা।

প্রকৃত তথ্য y- অক্ষের উপর অঙ্কিত হয়।

মানগুলি গড় থেকে মানক বিচ্যুতি হয়। সুতরাং, 0উপাত্তের 1গড়টি কি হবে উপরে 1 টি স্ট্যান্ডার্ড বিচ্যুতি ইত্যাদি This উদাহরণস্বরূপ, 68.27%আপনার যদি সাধারণ বিতরণ থাকে তবে আপনার সমস্ত ডেটা -1 এবং 1 এর মধ্যে হওয়া উচিত।

  1. কী মান মানে?R2

মান চক্রান্ত এই সাজানোর জন্য বিশেষভাবে উপকারী নয়। একটি ভেরিয়েবল অন্যটির উপর নির্ভরশীল কিনা তা নির্ধারণ করতে সাধারণত ব্যবহার করা হয় । ভাল, আপনি একটি তাত্ত্বিক মানকে একটি আসল মানের সাথে তুলনা করছেন। তাই সেখানে অগত্যা হতে হবে কিছু সাজানোর । (উদাহরণস্বরূপ, এমনকি একটি এলোমেলো ইউনিফর্ম বিতরণ একটি মাঝারি শালীন will ।) আর 2 আর 2 আর 2R2R2R2R2


শেষ অবধি, এখানে অনুরূপ প্লট রয়েছে যা খুব কমই ব্যবহৃত হয় পিপি প্লট । এই চক্রান্ত আরো উপযোগী আপনি যেখানে উপর মনোযোগ আগ্রহী হয় বাল্ক তথ্য মিথ্যার পরিবর্তে চরম।


1
স্কিউ শব্দটি এখানে সেরা পছন্দ নয়: আমি রূপান্তরিত বলতে চাই ।
নিক কক্স

দুর্দান্ত ব্যাখ্যা। আপনি দয়া করে ব্যাখ্যা করতে পারবেন কীভাবে এক্স-অক্ষ (প্রত্যাশিত মান) উত্পন্ন হয়?
বিবেক অনন্তন

1

ওয়াই অক্ষগুলি পর্যবেক্ষিত বিতরণের মান এবং এক্স অক্ষগুলি, তাত্ত্বিক বিতরণের মান দেখায়।

প্রতিটি পয়েন্ট একটি কোয়ান্টাইল। ধরা যাক, প্লটটিতে যদি 100 পয়েন্ট থাকে তবে প্রথম পয়েন্টটি (নীচের বাম দিকে একটিটি) একটি অন্তরালের জন্য একটি উপরের আবদ্ধ নির্দেশ করে, এবং যখন ছোট থেকে বৃহত্তম পর্যন্ত অর্ডার করা হয়, তখন ডেটা পয়েন্টের মধ্যে সর্বনিম্ন 1 শতাংশ সংশ্লিষ্ট বিতরণ এই ব্যবধানে থেকে যায়। একইভাবে ২ য় পয়েন্টটি একটি বিরতিতে উপরের সীমানা যেখানে বিতরণ থেকে প্রাপ্ত ক্ষুদ্রতম 2 শতাংশ ডাটা পয়েন্ট থাকে। এটি কোয়ান্টাইলের ধারণা। তবে এটি 100 ব্যবধানের সাথে সীমাবদ্ধ নয়, এটি একটি সাধারণ ধারণা এবং আপনার যতটা সম্ভব অন্তর অন্তর অন্তরগুলির সীমারেখা বর্ণনা করে এমন অনেক কোয়ান্টাইল থাকবে।

এই চক্রান্ত সম্পর্কে বিশেষ কী, প্রতিটি বিন্দুর অবস্থান অক্ষের সাথে সম্পর্কিত মান হিসাবে উভয় বিতরণে প্রদত্ত কোয়ান্টাইলের প্রকৃত মান নির্ধারণ করে। আসুন মনে করি যেন আবার এই জাতীয় 100 টি পয়েন্ট (কোয়ান্টাইলস) রয়েছে, এই প্লটটি বলে যে পর্যবেক্ষণ করা বিতরণ থেকে প্রাপ্ত সর্বনিম্ন 1 শতাংশ ডাটা পয়েন্টগুলি ( ইনফটি, -3.5] এবং তাত্ত্বিক বিতরণ থেকে প্রাপ্ত ডেটা পয়েন্টের মধ্যে সর্বনিম্ন 1 শতাংশের মধ্যেও রয়েছে ( , -3.2]। এইভাবে আপনি উভয় বিতরণে প্রতিটি অন্তর সীমানার অবস্থানের অবস্থানগুলি দেখতে পারেন can-

আমি আমার উত্তর জুড়ে ডেটা পয়েন্ট ব্যবহার করেছি, যেমন অর্ডার করা ডেটা পয়েন্ট ইত্যাদি This

আর 2R2 হ'ল একটি পরিমাপ যা পয়েন্টগুলি লাল রেখার সাথে ফিট করে fit উভয় অক্ষের সমান বিতরণ থাকলে, সমস্ত পয়েন্ট হুবহু লাইনটিতে থাকবে এবং সমান হবে। আপনি লিনিয়ার রিগ্রেশনকে ব্যাখ্যা করে যে কোনও পাঠ্যে এ সম্পর্কে আরও শিখতে পারেন।R2


3
লিনিয়ার রিগ্রেশন সংক্রান্ত পাঠ্যগুলি ব্যাখ্যা করবে না, যদিও কীভাবে কিউকিউ প্লটের উপরের পয়েন্টগুলি তীব্রভাবে বাধাগ্রস্থ হয় তখন কীভাবে ব্যাখ্যা করবেন ! বিশেষত, কিউকিউ প্লটের পয়েন্টগুলি একঘেয়েমি হ্রাস করা উচিত be এটি কে যাই হোক না কেন অসাধারণ উচ্চ হতে বাধ্য করে। আর 2R2R2
শুক্র
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.