আমি স্কেওড এবং নন-নরমাল ডেটা সহ একটি জেড স্কোর ব্যবহার করতে পারি? [বন্ধ]


12

পুরো চক্র সময়ের অংশগুলির মধ্যে তুলনা করার জন্য আমি কিছু প্রক্রিয়া চক্রের সময় ডেটা এবং স্কেলিংকে স্ট্যান্ডার্ড জেড-স্কোর ব্যবহার করে কাজ করছি।

ডেটা ভারিভাবে ডান স্কিউ / নরমাল হওয়ায় আমার কি অন্য কিছু রূপান্তর ব্যবহার করা উচিত? ('আউটলিয়ার' কখনও নেতিবাচক সময় নিতে পারে না এবং প্রায়শই 'গড়' এর চেয়ে অনেক বেশি সময় নেয়)

জেড-স্কোরটি ব্যবহার করা এখনও "কাজের" বলে মনে হচ্ছে ...

###############
# R code    
###############
mydata <- rweibull(1000,1,1.5)
hist(mydata)
hist(scale(mydata))

5
আপনি ঠিক কি জিজ্ঞাসা করা হয়? অবশ্যই, আপনি এখনও স্কোর গণনা করতে পারেন , তবে আপনি এটি কীসের জন্য ব্যবহার করার চেষ্টা করছেন? গড় থেকে স্ট্যান্ডার্ড বিচ্যুতির সংখ্যা (যা স্কোর যা হ'ল) ​​কিছু পরিস্থিতিতে বিশেষত দরকারী পরিসংখ্যান নাও হতে পারে। zz
ম্যাক্রো

উত্তর:


5

যদি এক্সকে উচ্চতর স্কিউড করা হয় তবে জেড পরিসংখ্যানগুলি সাধারণত বিতরণ করা হবে না (বা মানক বিচ্যুতির অনুমান করা আবশ্যক। তাই জেড এর পারসেন্টাইলগুলি সাধারণ স্বাভাবিক হবে না So সুতরাং সেই অর্থে এটি কাজ করে না।


আমার বোঝার জন্য, এক্স অত্যন্ত স্কিউড হওয়ার অর্থ নমুনার আকার যথেষ্ট বড় ছিল না (কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য)। তবে আমি নিশ্চিত নই, জেড স্ট্যাটিস্টিকগুলি কাজ করার জন্য জনসংখ্যা নিজেই স্বাভাবিক হওয়া দরকার কিনা। এটা কি পারে?
আন্দ্রেজেজ গিস

1
ওপি জনসংখ্যা বিতরণ এবং গড়ের বিতরণের কথা বলছে না। সুতরাং নমুনার আকার এবং কেন্দ্রীয় সীমা তত্ত্বটি প্রয়োগ হয় না।
মাইকেল আর চেরনিক

2

আর কোডটি কাজ করবে, তবে জেড-স্কোরটি প্রায় অর্থবহ হবে "বাক্সটি ঝর্ণা কলমে হালকাভাবে ফোন করছে are" এটি একটি বৈধ বাক্য, তবে অর্থবহ কিছু বোঝায় না।

আপনার আর কোড দ্বারা বিচার করলে মনে হয় যে আপনি ভাবেন যে আপনার ডেটা ওয়েইবুল বিতরণ। সেক্ষেত্রে আমি কেবল ওয়েইবুলের পরিসংখ্যান ব্যবহার করব এবং যদি আপনার একেবারে না থাকে তবে কোনও কিছুই স্কেল করব না। যদিও প্রতিটি ইন্ট্রো স্ট্যাটিস্টিক ক্লাসে জেড-স্কোরগুলি শেখানো হয়, এর অর্থ এই নয় যে আপনার এগুলি সর্বদা ব্যবহার করা উচিত, এবং বিশেষত যদি আপনার কাছে প্রতিসম ডেটা না থাকে not


1

জনসংখ্যা সাধারণত বিতরণ না হলে। সেক্ষেত্রে বারের (X) {নমুনা অর্থের বন্টন limit কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য অনুসারে একটি সাধারণ বিতরণে পৌঁছায়; বড় নমুনা আকার জন্য। যদিও তাত্ত্বিকভাবে আমরা বলেছি আমরা শিক্ষার্থীদের টি টি ব্যবহার করছি তবে এন এর উচ্চ মানের জন্য (নমুনার আকার বা স্বাধীনতার ডিগ্রি), টি বিতরণ এবং জেড বিতরণ প্রায় সমান।


-4

আপনার ডেটা কোনও জেড-টেস্টের জন্য সাধারণ হতে হবে না। (সফর, 2002) তবুও, বিভিন্ন পদার্থ সমানভাবে সমান হতে হবে। আপনার দুটি ডেটাতে একটি এফ-টেস্টের বাহকটি পরীক্ষা করে দেখুন, এবং যদি আপনার ভ্যারিয়েন্সগুলি সমান পরিমাণে সমান হয় তবে জেড টেস্টের ফলাফল কার্যকর হয়। যদি তা না হয় তবে ডেটা স্থানান্তর করুন।


9
প্রশ্নটি একটি পরীক্ষার পরিবর্তে ভেরিয়েবলের রূপান্তর সম্পর্কিত, সুতরাং আপনার উত্তর প্রযোজ্য বলে আমি মনে করি না। এছাড়াও, যদি আপনি কেবল একটি নাম-বছরের রেফারেন্সের পরিবর্তে পুরো রেফারেন্স দেন এবং কিছু লোক শট করার বিরুদ্ধে আপত্তি জানায় তবে এটি সম্ভবত আরও তথ্যপূর্ণ।
মার্টেন বুইস

আমি @ মার্টেনবুইসের সাথে একমত তবে তাঁর বিপরীতে আমি এটিকে কম করব।
এরিক
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.