লেপটোকুর্টিক বিতরণকে কীভাবে স্বাভাবিকতায় রূপান্তর করবেন?


12

ধরুন আমার কাছে লেপটোকুর্টিক ভেরিয়েবল রয়েছে যা আমি স্বাভাবিকতায় রূপান্তর করতে চাই। কোন রূপান্তরগুলি এই কাজটি সম্পাদন করতে পারে? আমি ভাল করেই জানি যে রূপান্তরকারী ডেটা সর্বদা কাম্য নাও হতে পারে তবে একাডেমিক অনুসারী হিসাবে ধরা যাক, আমি ডেটাটিকে স্বাভাবিকতায় পরিণত করতে চাই। অতিরিক্ত হিসাবে, আপনি প্লট থেকে বলতে পারেন, সমস্ত মান কঠোরভাবে ইতিবাচক।

আমি বিভিন্ন রূপান্তর চেষ্টা করেছি (used , ইত্যাদি) সহ আমি এর আগে বেশিরভাগ কিছুই দেখেছি , তবে এগুলির বিশেষভাবে কাজ করে না। লেপটোকুর্টিক বিতরণ আরও সাধারণ করার জন্য কি সুপরিচিত রূপান্তর রয়েছে?1X,X,asinh(X)

নীচে সাধারণ কিউকিউ প্লটের উদাহরণটি দেখুন:

এখানে চিত্র বর্ণনা লিখুন


5
আপনি কি সম্ভাবনা ইন্টিগ্রাল ট্রান্সফর্মের সাথে পরিচিত ? আপনি যদি এটিটি কার্যক্রমে দেখতে চান তবে এটি এই সাইটে কয়েকটি থ্রেডে আহ্বান করা হয়েছে ।
whuber

8
আপনার এমন কিছু দরকার যা চিহ্নের প্রতি সম্মান প্রদর্শন করার সময় (পরিবর্তনশীল "মাঝারি") উপর প্রতিসমভাবে কাজ করে । আপনার "মধ্যম" না থাকলে আপনি যা চেষ্টা করেছিলেন তা কিছুই কাছে আসে না। "মিডল" এর জন্য মিডিয়ান ব্যবহার করুন এবং কিউব রুটটিকে চিহ্ন (।) * অ্যাবস (।) As (1/3) হিসাবে প্রয়োগ করার কথা মনে রেখে বিচ্যুতির কিউব রুটটি চেষ্টা করুন। কোনও গ্যারান্টি নেই এবং খুব কার্যকর নয়, তবে এটি সঠিক দিকে এগিয়ে যেতে হবে।
নিক কক্স

1
আহ, কী আপনাকে এই প্লাটিকুর্টিক বলে? আমি যদি কিছু মিস না করি তবে মনে হয় এটি স্বাভাবিকের চেয়ে বেশি কুরটোসিস পেয়েছে।
গ্লেন_বি -রিনস্টেট মনিকা

3
@ Glen_b আমার মনে হয় সঠিক: এটি লেপটোকুর্টিক। তবে এই উভয় পদই বেশ নির্বোধ, যতক্ষণ না তারা বায়োমেট্রিকায় শিক্ষার্থী দ্বারা মূল কার্টুনের রেফারেন্সকে অনুমতি দেয় । মানদণ্ডটি কুর্তোসিস; মানগুলি উচ্চ বা নিম্ন বা (আরও ভাল) পরিমাণযুক্ত।
নিক কক্স

3
লেপটোকার্টিককে 'পাতলা লেজযুক্ত' হিসাবে বর্ণনা করা হয় কেন? যদিও লেজ এবং কুর্তোসিসের পুরুত্বের মধ্যে কোনও প্রয়োজনীয় সম্পর্ক নেই, সাধারণ প্রবণতাটি ভারী সাথে সাথে যুক্ত হওয়ার জন্য (যেমন মানের সাথে ঘনত্বের জন্য সাথে তুলনা করুন )t6
Glen_b -Rininstate মনিকা

উত্তর:


12

লেপটোকুর্টিক ডেটার বর্ণনা ও রূপান্তর করতে আমি ভারী লেজ ল্যামবার্ট ডাব্লু এক্স এফ বিতরণ ব্যবহার করি । আরও বিশদ এবং উল্লেখের জন্য নিম্নলিখিত পোস্টগুলি দেখুন (আমার):

ল্যামবার্টব্লু আর প্যাকেজটি ব্যবহার করে এখানে একটি পুনরুত্পাদনযোগ্য উদাহরণ ।

library(LambertW)
set.seed(1)
theta.tmp <- list(beta = c(2000, 400), delta = 0.2)
yy <- rLambertW(n = 100, distname = "normal", 
                theta = theta.tmp)

test_norm(yy)

মূল ডেটার স্বাভাবিকতা পরীক্ষা করুন

## $seed
## [1] 267509
## 
## $shapiro.wilk
## 
##  Shapiro-Wilk normality test
## 
## data:  data.test
## W = 1, p-value = 0.008
## 
## 
## $shapiro.francia
## 
## 	Shapiro-Francia normality test
## 
## data:  data.test
## W = 1, p-value = 0.003
## 
## 
## $anderson.darling
## 
##  Anderson-Darling normality test
## 
## data:  data
## A = 1, p-value = 0.01

এর কিউকিপ্ল্লট yyমূল পোস্টে আপনার কিউপিপ্লটের খুব কাছাকাছি এবং 5 এর কার্টোসিস সহ ডেটা সত্যই সামান্য লেপটোকুর্টিক Hence সুতরাং আপনার ডেটাটি ল্যামবার্ট ডাব্লু- গাউসীয় বিতরণ দ্বারা এক্সপ্যাক্স সিএম এবং এর একটি লেজ প্যারামিটার (যা বোঝায় যে moments উপস্থিত থাকতে কেবল মুহুর্ত অবধি থাকে)।×XN(2000,400)δ=0.25

এখন আপনার প্রশ্নে ফিরে আসুন: কীভাবে এই লেপটোকুর্টিক ডেটা আবার সাধারণ করবেন? ওয়েল, আমরা এমএলই ব্যবহার করে বিতরণের প্যারামিটারগুলি অনুমান করতে পারি (বা মুহূর্তগুলি ব্যবহারের পদ্ধতিগুলির জন্য IGMM()),

mod.Lh <- MLE_LambertW(yy, distname = "normal", type = "h")
summary(mod.Lh)

## Call: MLE_LambertW(y = yy, distname = "normal", type = "h")
## Estimation method: MLE
## Input distribution: normal
## 
##  Parameter estimates:
##        Estimate  Std. Error  t value Pr(>|t|)    
## mu     2.05e+03    4.03e+01    50.88   <2e-16 ***
## sigma  3.64e+02    4.36e+01     8.37   <2e-16 ***
## delta  1.64e-01    7.84e-02     2.09    0.037 *  
## ---
## Signif. codes:  0 '***' 0.001 '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1
## -------------------------------------------------------------- 
## 
## Given these input parameter estimates the moments of the output random variable are 
##   (assuming Gaussian input): 
##  mu_y = 2052; sigma_y = 491; skewness = 0; kurtosis = 13.

এবং তারপরে ইনপুট তে ডেটা ব্যাক ট্রান্সফর্ম করতে বাইজিক ইনভার্স ট্রান্সফর্মেশন (ভিত্তিতে W_delta()) ব্যবহার করুন যা ডিজাইনের মাধ্যমে - একটি সাধারণের খুব কাছাকাছি হওয়া উচিত।X

# get_input() handles does the right transformations automatically based on
# estimates in mod.Lh
xx <- get_input(mod.Lh)
test_norm(xx)

গাউসিযুক্ত তথ্যের স্বাভাবিকতা পরীক্ষা করুন

## $seed
## [1] 218646
## 
## $shapiro.wilk
## 
##  Shapiro-Wilk normality test
## 
## data:  data.test
## W = 1, p-value = 1
## 
## 
## $shapiro.francia
## 
## 	Shapiro-Francia normality test
## 
## data:  data.test
## W = 1, p-value = 1
## 
## 
## $anderson.darling
## 
##  Anderson-Darling normality test
## 
## data:  data
## A = 0.1, p-value = 1

ভাল খবর!


আমি একজন অনুরাগী, এবং পাইথনের সংস্করণ-শিখার মতো সংস্করণে কাজ শুরু করেছি: github.com/gregversteeg/ga Persianize
গ্রেগ ভের

জর্জি আপনার পক্ষে কীভাবে আপনার রূপান্তর কাজ করে তার আরও স্বজ্ঞাত ব্যাখ্যা প্রদান করা সম্ভব?
আজুরিক

@azuric এটি এর বিপরীতমুখী রূপান্তরের উপর ভিত্তি করে , যেখানে একটি আদর্শ সাধারণ র্যান্ডম ভেরিয়েবল। ডাব্লু / ও বিশদে যাচ্ছি (রেফারেন্সের জন্য কাগজপত্র দেখুন) এটি স্বজ্ঞাতভাবে পরিষ্কার হওয়া উচিত যে জন্য এলোমেলো পরিবর্তনশীলZ=Uexp(δ/2U2)Uδ>0Z

9

sign(.)abs(.)13Ymedian(Y)

যদিও কিউব রুটের রূপান্তরটি ভালভাবে কার্যকর হয়নি তবে এটি বর্গমূল এবং আরও অস্পষ্ট তিন-চতুর্থাংশ মূল কাজ ভাল করে তোলে।

মূল প্রশ্নটিতে লেপটোকুর্টিক ভেরিয়েবলের কিউকিউ প্লটের সাথে সম্পর্কিত মূল কার্নেল ঘনত্বের প্লটটি এখানে ছিল:

এখানে চিত্র বর্ণনা লিখুন


বিচ্যুতির স্কোয়ার রুটের রূপান্তরটি প্রয়োগ করার পরে, কিউকিউ প্লটটি এরকম দেখাচ্ছে:

এখানে চিত্র বর্ণনা লিখুন

আরও ভাল তবে এটি আরও কাছাকাছি হতে পারে।


আরও কিছুটা হ্যামারিং, ত্রি-চতুর্থাংশের মূল রূপান্তরটি বিচ্যুতির ক্ষেত্রে প্রয়োগ করে:

এখানে চিত্র বর্ণনা লিখুন


এবং এই রূপান্তরিত ভেরিয়েবলের চূড়ান্ত কার্নেল ঘনত্বটি এরকম দেখাচ্ছে:

এখানে চিত্র বর্ণনা লিখুন

আমার কাছাকাছি লাগছে।


8

বেশিরভাগ ক্ষেত্রে, খুব সহজ-সরল রূপের একঘেয়ে রূপান্তর হতে পারে যা খুব নিকটে-স্বাভাবিক ফলাফল আনবে।

উদাহরণস্বরূপ, কল্পনা করুন যে আমাদের কাছে এমন একটি বিতরণ রয়েছে যা বিভিন্ন পরামিতিগুলির লগনরমাল বিতরণের একটি সীমাবদ্ধ মিশ্রণ। একটি লগ রূপান্তর মিশ্রণটির যে কোনও উপাদানকে স্বাভাবিকতায় রূপান্তরিত করে, তবে রূপান্তরিত ডেটাতে নরমালদের মিশ্রণ আপনাকে এমন কিছু দিয়ে ফেলে দেয় যা সাধারণ নয়।

অথবা তুলনামূলকভাবে সুন্দর রূপান্তর হতে পারে, তবে আপনি যে ফর্মগুলি চেষ্টা করতে চেয়েছিলেন তার মধ্যে একটি নয় - আপনি যদি ডেটা বন্টন না জানেন তবে আপনি এটি সন্ধান করতে পারেন না। উদাহরণস্বরূপ, যদি ডেটা গামা-বিতরণ করা হত তবে আপনি এমনকি স্বাভাবিকতার (যা অবশ্যই বিদ্যমান) সঠিক রূপান্তরটি খুঁজে পাবেন না যদি না আমি আপনাকে বিতরণটি ঠিক কীভাবে বলে না (যদিও আপনি কিউব-রুটের রূপান্তরকে হোঁচট খেতে পারেন যে এটিতে শেপ প্যারামিটারটি খুব ছোট না হওয়া পর্যন্ত কেস এটিকে স্বাভাবিকের খুব কাছাকাছি করে তুলবে)।

অগণিত উপায় রয়েছে যাতে ডেটা রূপান্তরিত হওয়ার পক্ষে যুক্তিসঙ্গতভাবে প্রযোজনীয় দেখায় তবে সুস্পষ্ট রূপান্তরগুলির তালিকার কোনওটিতে দুর্দান্ত লাগে না।

আপনি যদি আমাদের ডেটাতে অ্যাক্সেস দিতে পারেন তবে এটি ভাল হতে পারে যে আমরা হয় এমন কোনও রূপান্তরটি দেখতে পারি যা ঠিক আছে - বা আমরা আপনাকে দেখাতে পারি কেন আপনি কেন এটির সন্ধান পাবেন না।

কেবল সেখানে ভিজ্যুয়াল ইম্প্রেশন থেকে, এটি দেখতে দুটি পৃথক স্কেলের সাথে দুটি স্বাভাবিকের মিশ্রণের মতো দেখাচ্ছে। অসমमितার কেবলমাত্র একটি সামান্য ইঙ্গিত রয়েছে, যা আপনি সহজেই সুযোগ দ্বারা পর্যবেক্ষণ করতে পারেন। এখানে সাধারণ দুটি গড়ের সাথে দুটি স্বাভাবিকের মিশ্রণের একটি নমুনার উদাহরণ রয়েছে - আপনি দেখতে পাচ্ছেন এটি আপনার প্লটের মতো দেখতে বেশ কিছুটা দেখাচ্ছে (তবে অন্যান্য নমুনাগুলিগুলি ভারী বা হালকা লেজযুক্ত লাগবে - এই নমুনার আকারে ক্রমের মধ্যে অনেকগুলি প্রকরণ রয়েছে) গড়ের উভয় দিকের 1 এসডির বাইরে পরিসংখ্যান)

এখানে চিত্র বর্ণনা লিখুন

প্রকৃতপক্ষে এখানে আপনার এবং আমার সুপারম্পোজড:

এখানে চিত্র বর্ণনা লিখুন


এটি অবশ্যই বিভিন্ন স্কেলের দুটি সাধারণ বিতরণের মিশ্রণের মতো দেখায়, দুর্দান্ত পর্যবেক্ষণ।
আন্ডারমিনার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.