কোন র‌্যাঙ্কের সম্পর্ক সম্পর্কিত সহগের প্রসঙ্গে ডেটা বাঁধা কী?


16

আমি পরিসংখ্যান ক্ষেত্রে নেই।

র‌্যাঙ্ক সহকারী সহগ সম্পর্কে পড়ার সময় আমি "বাঁধা ডেটা" শব্দটি দেখেছি।

  • বাঁধা ডেটা কী?
  • বাঁধা ডেটার উদাহরণ কী?

উত্তর:


5

এর অর্থ এমন ডেটা যার একই মান থাকে; উদাহরণস্বরূপ আপনার যদি ডেটাসেট হিসাবে 1,2,3,3,4 থাকে তবে দুটি 3 এর ডেটা বাঁধা। যদি আপনার ডেটাসেট হিসাবে 1,2,3,4,5,5,5,6,7,7 থাকে তবে 5 এবং 7 এর ডেটা বাঁধা।


14

"বাঁধা ডেটা" র‌্যাঙ্ক ভিত্তিক নন-প্যারাম্যাট্রিক স্ট্যাটিস্টিকাল পরীক্ষার প্রসঙ্গে আসে।

নন-প্যারাম্যাট্রিক পরীক্ষা : পরীক্ষা যা কোনও নির্দিষ্ট সম্ভাবনার বন্টন ধরে না, যেমন এটি বেল-আকৃতির বক্ররেখাকে ধরে নেয় না।

র‌্যাঙ্ক ভিত্তিক : নন-প্যারাম্যাট্রিক পরীক্ষাগুলির একটি বৃহত শ্রেণি সংখ্যাকে (যেমন "3 দিন", "5 দিন" এবং "4 দিন") র‌্যাঙ্কে রূপান্তর করে শুরু হয় (যেমন "স্বল্পতম সময়কাল (তৃতীয়))", "দীর্ঘতম সময়কাল (1 ম) "," দ্বিতীয় দীর্ঘতম সময়কাল (দ্বিতীয়) ")। এর পরে এই র‌্যাঙ্কগুলিতে একটি traditionalতিহ্যবাহী প্যারামেট্রিক পরীক্ষার পদ্ধতি প্রয়োগ করা হয়।

টাইড ডেটা হ'ল একটি ইস্যু যেহেতু সংখ্যাগুলি অভিন্ন যা এখন র‌্যাঙ্কে রূপান্তরিত হওয়া দরকার। কখনও কখনও র‌্যাঙ্কগুলি এলোমেলোভাবে নির্ধারিত হয়, কখনও কখনও গড় র‌্যাঙ্ক ব্যবহার করা হয়। সর্বাধিক গুরুত্বপূর্ণ, ফলাফলের পুনঃপ্রসারণযোগ্যতার জন্য বাঁধা র‌্যাঙ্কগুলি ভাঙ্গার জন্য একটি প্রোটোকল বর্ণনা করা দরকার।


5

এটি কেবলমাত্র দুটি অভিন্ন ডাটা মান, যেমন একই ডেটা সেটে 7 বার পর্যবেক্ষণ।

এটি পরিসংখ্যানগত পদ্ধতির প্রসঙ্গে উঠে আসে যা ধরে নিয়েছে যে ডেটাটির একটি অবিচ্ছিন্ন এবং একই রকম পরিমাপ অসম্ভব (বা প্রযুক্তিগতভাবে, সম্ভাবনার অভিন্ন মানগুলি শূন্য)। ব্যবহারিক জটিলতা দেখা দেয় যখন এই পদ্ধতিগুলি এমন ডেটাতে প্রয়োগ করা হয় যা বৃত্তাকার বা ক্লিপযুক্ত হয় যাতে অভিন্ন পরিমাপ কেবল সম্ভব না তবে মোটামুটি সাধারণ।


1
আমি এই যুক্তিটির সাথে একমত নই যেহেতু আপনি বলতে পারবেন না যে এর শূন্যতার কারণেই এই ঘটনাটি কখনই ঘটে না। এটি একটি ভাল যুক্তি নয়।
হেনরি.এল

2

প্রশ্নটি মৌলিক গুরুত্বের বিষয়:

একটি আবদ্ধ পর্যবেক্ষণ / তথ্য / জুড়ি কি?

Altough প্রায়ই শুধুমাত্র nonparametric পদ্ধতিতে উল্লেখ করা হয়েছে, এই ধারণা স্বাধীন nonparametric পদ্ধতি। এটি ননপ্যারমেট্রিক পদ্ধতিতে উল্লেখ করা হয়েছে কারণ এই পরিস্থিতি ননপ্যারমেট্রিক পদ্ধতিতে উইলকক্সন স্বাক্ষরিত র‌্যাংকযুক্ত পরিসংখ্যান মতো পরিসংখ্যানগুলি প্রাপ্তিতে গণনা জটিলতা সৃষ্টি করবে ।T+

(সুতরাং আমি প্রথমে ননপ্যারামেট্রিক পরীক্ষা প্রবর্তনের মাধ্যমে @ মিং-চিহ কাওর উত্তরটি সঠিক বলে মনে করি না But তবে যেহেতু শিরোনামটি হ'ল র‌্যাঙ্কের সাথে সম্পর্কযুক্ত সহগের প্রসঙ্গে ডেটাটি কী বাঁধা? ', তাই আমি এটি কিনব))

উদাহরণস্বরূপ, আমি মনে করি সবচেয়ে ভাল উপায় হ'ল উইলকক্সন স্বাক্ষরিত র‌্যাঙ্কড টেস্টের সাদামাটা উদাহরণ সহ কাজ করা: আমাদের মাপ 10 এর জোড়যুক্ত ডেটার একটি নমুনা দেওয়া উচিত: পার্থক্যটি এলোমেলো পরিবর্তনশীল Zi=XiYi

: (1, -1) (1,2) (1,2) (1, -1) (2,1) (2,1) (2,3) (2,3) (3,2) (3,0)(Xi,Yi)

: 2 -1 -1 2 1 1 -1 -1 1 3Zi

পদক্ষেপের জন্য এই এর পরম মান নিন ।Zi

: 2 1 1 2 1 1 1 1 1 3|Zi|

{(1,1)(1,1)},{(1,2)(1,2)(2,1)(2,1)(2,3)(2,3)(3,2)},{(3,0)}

আসুন আমরা এটি করার খুব সহজ উপায়টি চেষ্টা করি, আমরা বাম থেকে ডানে র‌্যাঙ্ক করি এবং দেই:

Ri

|Zi|

Ri

|Zi|

Ri

|Zi|=1|Zi|=2

আমরা প্রথম গ্রুপে প্রতিটি পর্যবেক্ষণকে র‌্যাঙ্ক দিয়েছি1++77=4;we assign to each of the observation in the second group the rank8+92=8.5. Therefore we have:

Ri: 8.5 4 4 8.5 4 4 4 4 4 10

This modified the rankings and make each of the tied observation has the same influence in calculating the ranked statistics, thus in the rank test.

What are the solutions to tied observation/data/pair ?

(1)Assign the average rank. This is just what we did above. By assigning the same rank to the tied data in the same group, we make their influence in the ranked test just the same and therefore eliminate the possible inaccuracy caused by tied observations.

(2)Assign the random rank. Just assign ranks randomly to each of the tied group element. The only restriction is that MaxRankfirstgroup<MinRanksecondgroup since if MaxRankfirstgroup>MinRanksecondgroup, that breaks the ranking law; if MaxRankfirstgroup=MinRanksecondgroup, then we have to merge two tied groups into one.

(3)Perturbation of data. This requires very careful consideration about the nature of the data. This works only if the data is not categorical(discrete). In the above example, we can just make a This will put different weights manually to each of the elements in the tied group. For a continuous distribution, for example, it makes little difference if you perturb it in ϵ manner.

(@John D. Cook 's answer is a bit misleading in this way. A better way of saying this point is that when the distribution is continuous, PX=x=0. However, we shall observe ties since our measurement is of limited accuracy, i.e. any sample space in reality is actually finite.) (@quarkdown27 's answer is simple but correct in each word.)

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.