বিশাল কুর্তোসিস?


10

আমি স্টক সূচকগুলিতে প্রতিদিনের আয় সম্পর্কিত কিছু বর্ণনামূলক পরিসংখ্যান করছি। অর্থাত্ যদি এবং দিন 1 এবং দিন 2 সূচক স্তর আছে যথাক্রমে, তারপর আগমন আমি ব্যবহার করছি (সাহিত্য সম্পূর্ণভাবে মান) হয়।পি 2 এল জি ( পি 2)P1P2loge(P2P1)

সুতরাং এর মধ্যে কার্টোসিস বিশাল। আমি প্রায় 15 বছরের দৈনিক ডেটা দেখছি (সুতরাং প্রায় সময় সিরিজের পর্যবেক্ষণ)26015

                      means     sds     mins    maxs     skews     kurts
ARGENTINA          -0.00031 0.00965 -0.33647 0.13976 -15.17454 499.20532
AUSTRIA             0.00003 0.00640 -0.03845 0.04621   0.19614   2.36104
CZECH.REPUBLIC      0.00008 0.00800 -0.08289 0.05236  -0.16920   5.73205
FINLAND             0.00005 0.00639 -0.03845 0.04622   0.19038   2.37008
HUNGARY            -0.00019 0.00880 -0.06301 0.05208  -0.10580   4.20463
IRELAND             0.00003 0.00641 -0.03842 0.04621   0.18937   2.35043
ROMANIA            -0.00041 0.00789 -0.14877 0.09353  -1.73314  44.87401
SWEDEN              0.00004 0.00766 -0.03552 0.05537   0.22299   3.52373
UNITED.KINGDOM      0.00001 0.00587 -0.03918 0.04473  -0.03052   4.23236
                   -0.00007 0.00745 -0.09124 0.06405  -1.82381  63.20596
AUSTRALIA           0.00009 0.00861 -0.08831 0.06702  -0.74937  11.80784
CHINA              -0.00002 0.00072 -0.40623 0.02031   6.26896 175.49667
HONG.KONG           0.00000 0.00031 -0.00237 0.00627   2.73415  56.18331
INDIA              -0.00011 0.00336 -0.03613 0.03063  -0.22301  10.12893
INDONESIA          -0.00031 0.01672 -0.24295 0.19268  -2.09577  54.57710
JAPAN               0.00008 0.00709 -0.03563 0.06591   0.57126   5.16182
MALAYSIA           -0.00003 0.00861 -0.35694 0.13379 -16.48773 809.07665

আমার প্রশ্ন: কোন সমস্যা আছে?

আমি এই ডেটা - ওএলএস এবং কোয়ান্টাইল রিগ্রেশন বিশ্লেষণ, এবং গ্রেঞ্জার কার্যকারিতা নিয়ে ব্যাপক সময়ের সিরিজ বিশ্লেষণ করতে চাই।

আমার প্রতিক্রিয়া (নির্ভরশীল) এবং ভবিষ্যদ্বাণীকারী (রেজিস্ট্রার) উভয়েরই বিশাল কুর্তোসিসের এই সম্পত্তি থাকবে। সুতরাং আমার কাছে এই রিটার্ন প্রক্রিয়াগুলি রিগ্রেশন সমীকরণের উভয় পাশে থাকবে। যদি অ-স্বাভাবিকতাটি এমন ব্যাঘাতের মধ্যে ছড়িয়ে যায় যা কেবলমাত্র আমার স্ট্যান্ডার্ড ত্রুটিগুলিকে উচ্চতর রূপ দেয়?

(সম্ভবত আমার একটি স্কিউনেস রবস্ট বুটস্ট্র্যাপ দরকার?)


3
1) আপনি এটি কোয়ান্ট.স্ট্যাকেক্সেঞ্জ ডটকম সাইট এ স্থানান্তর করতে চাইতে পারেন। 2) সমস্যা বলতে কী বোঝ? মুহুর্তগুলিতে আউটলিয়ারদের প্রভাব সম্পর্কে একটি সম্পূর্ণ সাহিত্য রয়েছে। এটি প্রায়শই কোনও বিজ্ঞানের চেয়ে শিল্পের বেশি হতে পারে।
জন

2
"কোন সমস্যা আছে?" খুব অস্পষ্ট। আপনি এই ডেটা দিয়ে কি করতে চান? আপনার বিশাল কুর্তোজেস বিশাল বাম স্কুয়ের সাথে যুক্ত। যেহেতু লগ (পি 2 / পি 1) = লগ পি 2 - লগ পি 1, একটি বিশাল বাম স্কু ইঙ্গিত দেয় যে সাধারণ সময়ের তুলনায় পি 2 এর তুলনায় পি 1 অনেক বেশি ছিল, যখন এটি খুব কম ছিল few দেউলিয়া হয়ে যাওয়ার কোনও সংস্থা বা এরকম কিছু হতে পারে।
পিটার Flom

এ সম্পর্কে দুঃখিত - আমি আমার ওপি সংশোধন করেছি।

1
লগ-রিটার্নগুলি সাধারণত স্কিউড এবং ভারী লেজযুক্ত হয়। এই কারণে এই আচরণটি ক্যাপচার করতে পারে এমন নমনীয় বিতরণগুলি বিবেচনা করা পছন্দ করা হয়। উদাহরণস্বরূপ 1 এবং 2 দেখুন

আপনার এল-মূহুর্তের ভিত্তিতে কুটোসিসের ব্যবস্থাগুলি দেখে নেওয়া উচিত
কেজিটিল বি হালওয়ারসেন

উত্তর:


2

কটাক্ষপাত আছে x এফ ভারী-লেজ ল্যাম্বার্ট ওয়াট বা skewed ল্যাম্বার্ট W X এফ ডিস্ট্রিবিউশন ব্যবহার করে দেখুন (দাবিত্যাগ: আমি লেখক নই)। আর এ তারা ল্যামবার্টডব্লু প্যাকেজে প্রয়োগ করা হয়েছে ।

সম্পর্কিত পোস্ট:

Yএক্স

ইকুইটি ফান্ডের রিটার্নগুলিতে প্রয়োগ করা ল্যামবার্ট ডাব্লু এক্স গাউসিয়ান অনুমানের একটি উদাহরণ এখানে।

library(fEcofin)
ret <- ts(equityFunds[, -1] * 100)
plot(ret)

সময় সিরিজের প্লট ইক্যুইটি তহবিল

রিটার্নগুলির সারসংক্ষেপের মেট্রিকগুলি ওপির পোস্টের মতোই (চরম নয়) are

data_metrics <- function(x) {
  c(mean = mean(x), sd = sd(x), min = min(x), max = max(x), 
    skewness = skewness(x), kurtosis = kurtosis(x))
}
ret.metrics <- t(apply(ret, 2, data_metrics))
ret.metrics

##          mean    sd    min   max skewness kurtosis
## EASTEU 0.1300 1.538 -18.42 12.38   -1.855    28.95
## LATAM  0.1206 1.468  -6.06  5.66   -0.434     4.21
## CHINA  0.0864 0.911  -4.71  4.27   -0.322     5.42
## INDIA  0.1515 1.502 -12.72 14.05   -0.505    15.22
## ENERGY 0.0997 1.187  -5.00  5.02   -0.271     4.48
## MINING 0.1315 1.394  -7.72  5.69   -0.692     5.64
## GOLD   0.1098 1.855 -10.14  6.99   -0.350     5.11
## WATER  0.0628 0.748  -5.07  3.72   -0.405     6.08

বেশিরভাগ সিরিজগুলি স্পষ্টতই অস্বাভাবিক বৈশিষ্ট্যগুলি প্রদর্শন করে (শক্তিশালী স্কিউনেস এবং / অথবা বৃহত্তর কুরটোসিস)। আসুন মুহুর্তের হিসাবরক্ষক ( IGMM) এর একটি পদ্ধতি ব্যবহার করে ভারী লেজযুক্ত ল্যামবার্ট ডাব্লু এক্স গাউসিয়ান বিতরণ (= টুকির এইচ) ব্যবহার করে প্রতিটি সিরিজ গাউসাইজাইজ করি ।

library(LambertW)
ret.gauss <- Gaussianize(ret, type = "h", method = "IGMM")
colnames(ret.gauss) <- gsub(".X", "", colnames(ret.gauss))

plot(ts(ret.gauss))

গাউসাইজড রিটার্নের সময় সিরিজের প্লট

সময় সিরিজের প্লটগুলি অনেক কম লেজ এবং সময়ের সাথে আরও স্থিতিশীল বৈচিত্র দেখায় (যদিও ধ্রুবক নয়)। গাউসাইজড সময় সিরিজের ফলনে আবার মেট্রিক গণনা করা হচ্ছে:

ret.gauss.metrics <- t(apply(ret.gauss, 2, data_metrics))
ret.gauss.metrics

##          mean    sd   min  max skewness kurtosis
## EASTEU 0.1663 0.962 -3.50 3.46   -0.193        3
## LATAM  0.1371 1.279 -3.91 3.93   -0.253        3
## CHINA  0.0933 0.734 -2.32 2.36   -0.102        3
## INDIA  0.1819 1.002 -3.35 3.78   -0.193        3
## ENERGY 0.1088 1.006 -3.03 3.18   -0.144        3
## MINING 0.1610 1.109 -3.55 3.34   -0.298        3
## GOLD   0.1241 1.537 -5.15 4.48   -0.123        3
## WATER  0.0704 0.607 -2.17 2.02   -0.157        3

IGMM3Gaussianize()scale()

সরল দ্বিবিড়ীয় রিগ্রেশন

Rএকজনএসটিইউ,টিRআমিএনডিআমিএকজন,টি

layout(matrix(1:2, ncol = 2, byrow = TRUE))
plot(ret[, "INDIA"], ret[, "EASTEU"])
grid()
plot(ret.gauss[, "INDIA"], ret.gauss[, "EASTEU"])
grid()

স্ক্যাটারপ্লট ইন্ডিয়া এবং ইএসটিইউ

মূল সিরিজের বাম স্ক্র্যাপপ্লট দেখায় যে শক্তিশালী বিদেশী একই দিনে ঘটেনি, তবে ভারত এবং ইউরোপের বিভিন্ন সময়ে ঘটেছিল; এর বাইরে এটি কেন্দ্রের ডেটা মেঘের কোনও সম্পর্ক বা নেতিবাচক / ইতিবাচক নির্ভরতা সমর্থন করে কিনা তা পরিষ্কার নয়। যেহেতু আউটলিয়ারগুলি বৈকল্পিকতা এবং পারস্পরিক সম্পর্কের প্রাক্কলনগুলিকে দৃ strongly়ভাবে প্রভাবিত করে, তাই ভারী লেজগুলি সরানো (ডান স্ক্র্যাটারপ্লট) এর সাথে নির্ভরতার দিকে তাকানো সার্থক। এখানে নিদর্শনগুলি আরও স্পষ্ট এবং ভারত এবং পূর্ব ইউরোপের বাজারের মধ্যে ইতিবাচক সম্পর্ক স্পষ্ট হয়ে ওঠে।

# try these models on your own
mod <- lm(EASTEU ~ INDIA * CHINA, data = ret)
mod.robust <- rlm(EASTEU ~ INDIA, data = ret)
mod.gauss <- lm(EASTEU ~ INDIA, data = ret.gauss)

summary(mod)
summary(mod.robust)
summary(mod.gauss)

গ্রেঞ্জার কার্যকারিতা

ভীএকজনআর(5)পি=5

library(vars)  
mod.vars <- vars::VAR(ret[, c("EASTEU", "INDIA")], p = 5)
causality(mod.vars, "INDIA")$Granger


## 
##  Granger causality H0: INDIA do not Granger-cause EASTEU
## 
## data:  VAR object mod.vars
## F-Test = 3, df1 = 5, df2 = 3000, p-value = 0.02

causality(mod.vars, "EASTEU")$Granger
## 
##  Granger causality H0: EASTEU do not Granger-cause INDIA
## 
## data:  VAR object mod.vars
## F-Test = 4, df1 = 5, df2 = 3000, p-value = 0.003

তবে গাউসিয়াইজড ডেটার জন্য উত্তর আলাদা! এখানে পরীক্ষা এইচ 0 কে প্রত্যাখ্যান করতে পারে না যে "ইন্ডিয়া গ্রেজার-কারণ ইস্টিইউ করে না ", কিন্তু এখনও প্রত্যাখ্যান করে যে "ইএসটিইইউ গ্রেঞ্জার-কারণ ভারতকে দেয় না"। সুতরাং গাউসিআইজড তথ্য পরের দিনেই ইউরোপীয় বাজারগুলি বাজারে চালিত এই হাইপোথিসিকে সমর্থন করে।

mod.vars.gauss <- vars::VAR(ret.gauss[, c("EASTEU", "INDIA")], p = 5)
causality(mod.vars.gauss, "INDIA")$Granger

## 
##  Granger causality H0: INDIA do not Granger-cause EASTEU
## 
## data:  VAR object mod.vars.gauss
## F-Test = 0.8, df1 = 5, df2 = 3000, p-value = 0.5

causality(mod.vars.gauss, "EASTEU")$Granger

## 
##  Granger causality H0: EASTEU do not Granger-cause INDIA
## 
## data:  VAR object mod.vars.gauss
## F-Test = 2, df1 = 5, df2 = 3000, p-value = 0.06

ভীএকজনআর(5)


1

যা প্রয়োজন তা হ'ল সম্ভাব্যতা বন্টন মডেল যা ডেটা আরও ভাল ফিট করে। কখনও কখনও, কোন নির্ধারিত মুহুর্ত হয় না। এরকম একটি বিতরণ হ'ল কচী বিতরণ। যদিও কাচি বিতরণটির একটি প্রত্যাশিত মান হিসাবে মিডিয়ান রয়েছে, সেখানে কোনও স্থিতিশীল গড় মান এবং কোনও স্থিতিশীল উচ্চতর মুহুর্ত নেই। এর অর্থ হ'ল যখন কেউ ডেটা সংগ্রহ করে তখন প্রকৃত পরিমাপগুলি ক্রপ করে যা বিদেশীদের মতো দেখা যায় তবে এটি প্রকৃত পরিমাপ। উদাহরণস্বরূপ, যদি কারও দুটি সাধারণ বিতরণ থাকে एफ এবং জি, যার গড় শূন্য থাকে এবং একটিতে এফ / জি ভাগ হয়, ফলাফলটির প্রথম মুহুর্ত থাকবে না এবং এটি একটি কাচির বিতরণ। সুতরাং আমরা আনন্দের সাথে ডেটা সংগ্রহ করি এবং এটি 5,3,9,6,2,4 এর মতো ঠিক দেখা যায় এবং আমরা একটি গড় গণনা করি যা স্থিতিশীল বলে মনে হয়, তারপরে হঠাৎ করে আমরা একটি -32739876 মান পাই এবং আমাদের গড় মান অর্থহীন হয়ে যায়, তবে মনে রাখবেন, মিডিয়ানটি 4, স্থিতিশীল। এটি দীর্ঘ-লেজযুক্ত বিতরণ সহ।

সম্পাদনা: আপনি 2 ডিগ্রি স্বাধীনতার সাথে শিক্ষার্থীর টি-বিতরণ চেষ্টা করতে পারেন। এই বিতরণটির স্বাভাবিক বিতরণের চেয়ে দীর্ঘ লেজ থাকে, স্কিউনেস এবং কুর্তোসিস অস্থিতিশীল ( সিস , অস্তিত্ব নেই), তবে গড় এবং ভিন্নতা সংজ্ঞায়িত হয়, যেমন স্থিতিশীল।

পরবর্তী সম্পাদনা: একটি সম্ভাবনা থিল রিগ্রেশন ব্যবহার করা হতে পারে। যাইহোক, এটি একটি চিন্তাভাবনা, কারণ লেজগুলি দেখতে যেমনই লাগুক না কেন থেইল ভালভাবে কাজ করবে। থিল এমএলআর করা যায় (একাধিক লিনিয়ার রিগ্রেশন মিডিয়ান medালু ব্যবহার করে)। আমি হিস্টোগ্রামের ডেটা ফিটিংয়ের জন্য থিল কখনও করি নি। তবে, আত্মবিশ্বাসের ব্যবধান স্থাপনের জন্য আমি একটি জ্যাকনিফ বৈকল্পিকের সাহায্যে থেইল করেছি। এটি করার সুবিধাটি হ'ল থিল বিতরণের আকারগুলি কী তা বিবেচনা করে না এবং উত্তরগুলি সাধারণত ওএলএসের তুলনায় কম পক্ষপাতদুষ্ট হয় কারণ সমস্যাযুক্ত স্বতন্ত্র অক্ষের বৈকল্পিকতা দেখা দিলে সাধারণত ওএলএস ব্যবহার করা হয়। থেইল পুরোপুরি নির্বিঘ্নে নয়, এটি মাঝারি opeাল। উত্তরগুলিরও পৃথক অর্থ রয়েছে, এটি নির্ভরশীল এবং স্বতন্ত্র ভেরিয়েবলের মধ্যে আরও ভাল চুক্তি খুঁজে পায় যেখানে ওএলএস নির্ভরশীল ভেরিয়েবলের সর্বনিম্ন ত্রুটি পূর্বাভাসকে খুঁজে পায়,


2
সুন্দর তথ্য, ধন্যবাদ। আপনি আরও কিছু পড়ার জন্য কিছু (যথেষ্ট কমপ্যাক্ট) রিসোর্স জানেন? লম্বা লেজের সাথে আমার সম্পূর্ণ ভিন্ন সমস্যা আছে, তবে আমার কাছে মনে হয় যে আমার ডেটা বিভিন্ন পরিস্থিতিতে একটি মিশ্রণ বিতরণ।
ফ্ল্যাশপোস্ট

আমি গাণিতিক ব্যবহার করি, এবং ফিটিং বিতরণগুলির পাশাপাশি টুকটাকভাবে বিতরণগুলি সংজ্ঞায়িত করা সেই ভাষায় কঠিন নয়। উদাহরণস্বরূপ, তাকান এই । সাধারণভাবে, এলোমেলো পরিবর্তনগুলি সংশ্লেষের সাথে যুক্ত হয় তবে অনুশীলনে ঘনত্বের ক্রিয়াকলাপগুলি সমঝোতার পক্ষে চ্যালেঞ্জিং। কিছু লোক কেবল প্রশংসিত ভেরিয়েবলগুলির জন্য ঘনত্বের ক্রিয়াগুলি সংজ্ঞায়িত করে, উদাহরণস্বরূপ, ভূমিকম্পের মডেল মডেলের সর্বাধিক মানের পরে সেন্সরযুক্ত ভারী গামা বিতরণে হালকা তীক্ষ্ণ লেজ যুক্ত করুন। @ ফ্ল্যাশপেনস্টোস্ট
কার্ল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.