গিনি সহগ এবং ত্রুটির সীমা


11

আমার কাছে প্রতিটি সময় পয়েন্টে এন = 14 গণনার সাথে ডেটাগুলির একটি সিরিজ রয়েছে এবং আমি প্রতিটি সময় পয়েন্টে এই অনুমানের জন্য গিনি সহগ এবং একটি স্ট্যান্ডার্ড ত্রুটি গণনা করতে চাই।

যেহেতু প্রতিটি সময় পয়েন্টে আমার কেবলমাত্র এন = 14 সংখ্যা রয়েছে তাই আমি জ্যাকনিফের বৈকল্পিক গণনা করে এগিয়ে চলেছি, যেমন অপেরাটর্নাম টমসন ওগওয়ংয়ের equ সমীকরণ থেকে 'গিনি সূচক এবং এর' স্ট্যান্ডার্ড ত্রুটি ' গণনার একটি সুবিধাজনক পদ্ধতি । কোথায় উপাদান ছাড়া এন মূল্যবোধের গিনি সহগ হয় এবং গড় হল ।Var(জি)=এন-1এন×Σ=1এন(জি(এন,)-জি¯(এন))2জি(এন,)জি¯(এক্স)জি(এন,)

ভেরিয়েন্সের জন্য উপরের সূত্রটির সরাসরি নির্বিকার প্রয়োগ।

calc.Gini.variance <- function(x) {
  N <- length(x)
  # using jacknifing as suggested by Tomson Ogwang - equation 7
  # in the Oxford Bulletin of Economics and Statistics, 62, 1 (2000)
  # ((n-1)/n) \times \sum_{k=1}^n (G(n,k)-\bar{G}(n))^2
  gini.bar <- Gini(x)

  gini.tmp <- vector(mode='numeric', length=N)
  for (k in 1:N) {
    gini.tmp[k] <- Gini(x[-k])
  }
  gini.bar <- mean(gini.tmp)
  sum((gini.tmp-gini.bar)^2)*(N-1)/N
 }
 calc.Gini.variance(c(1,2,2,3,4,99)) 
 # [1] 0.1696173
 Gini(c(1,2,2,3,4,99))
 # [1] 0.7462462

এটি কি একটি ছোট এন এর জন্য যুক্তিসঙ্গত পদ্ধতি? অন্য কোন পরামর্শ?


সম্ভবত আপনি নমুনা অনুমান এবং স্ট্যান্ডার্ড ত্রুটি উভয়ের জন্য ব্যবহার করছেন প্রকৃত গণনা যোগ করতে পারেন যেহেতু প্রদত্ত লিঙ্কটিতে অনেকেরই কাগজে অ্যাক্সেস নাও থাকতে পারে।
কার্ডিনাল

উত্তর:


5

একটি সমস্যা হ'ল এই ছোট্ট নমুনার আকার এবং একটি জটিল পরিসংখ্যানের সাথে (জিনির সহগ) আপনার পরিসংখ্যানের সম্ভাব্যতা বন্টন অবশ্যই প্রায় স্বাভাবিক হবে না, তাই আপনি যদি আত্মবিশ্বাসের ব্যবধান তৈরি করার জন্য এটি ব্যবহার করতে চান তবে "স্ট্যান্ডার্ড ত্রুটি" বিভ্রান্তিকর হতে পারে বা হাইপোথিসিস টেস্টিং স্বাভাবিকতার উপর নির্ভর করে।

আমি ভাবতাম একটি পারসেন্টাইল বুটস্ট্র্যাপ আরও ভাল পদ্ধতি হবে এবং এটি কার্যকর করা সহজ। উদাহরণ স্বরূপ:

> library(reldist) # just for the gini() function
> library(boot) # for the boot() function
> x <- c(1,2,2,3,4,99)
> gini(x)
[1] 0.7462462 # check get same result as in your question
> y <- boot(x, gini, 500)
> quantile(y$t, probs=c(0.025, 0.975))
     2.5%     97.5% 
0.6353158 0.7717868 
> plot(density(y$t))

আমি শেষের সাথে উত্পন্ন প্লটটি সংযুক্ত করি নি তবে এটি দেখায় যে আত্মবিশ্বাসের ব্যবধানটি খুব অ্যাসিমেট্রিক, সুতরাং একটি আত্মবিশ্বাসের ব্যবধানের জন্য +/- 1.96 * সে জাতীয় পদ্ধতি ব্যবহার করা বিভ্রান্তিকর হবে। আমি মূলত এই কারণে আত্মবিশ্বাসের ব্যবধানগুলির জন্য জ্যাকনিফ পদ্ধতির ভক্ত নই; জ্যাকনিফ পয়েন্ট অনুমানের জন্য পক্ষপাত হ্রাস কৌশল হিসাবে আবিষ্কার করা হয়েছিল, যেখানে আত্মবিশ্বাসের ব্যবধানগুলি বুটস্ট্র্যাপের পুরো ধারণার অন্তর্নিহিত।


এন=14
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.