পারস্পরিক সম্পর্ক খুঁজে পেতে ডেস্কল ব্যবহার করা কি একটি পরিসংখ্যানগতভাবে বৈধ পদ্ধতির?


10

আমার কাছে 1,449 ডেটা পয়েন্টের একটি নমুনা রয়েছে যা পারস্পরিক সম্পর্কযুক্ত নয় (আর-স্কোয়ারড 0.006)।

ডেটা বিশ্লেষণ করার সময়, আমি আবিষ্কার করেছি যে স্বতন্ত্র পরিবর্তনশীল মানগুলি ধনাত্মক এবং নেতিবাচক গ্রুপগুলিতে বিভক্ত করার মাধ্যমে, প্রতিটি দলের জন্য নির্ভরশীল পরিবর্তনশীলের গড়ের মধ্যে একটি উল্লেখযোগ্য পার্থক্য রয়েছে বলে মনে হয়।

স্বাধীন ভেরিয়েবল মানগুলি ব্যবহার করে পয়েন্টগুলি 10 টি বিন (ডেসাইল )গুলিতে বিভক্ত করা, ডেসাইল সংখ্যা এবং গড় নির্ভরশীল ভেরিয়েবল মানগুলির (আর-স্কোয়ারড 0.27) মধ্যে একটি শক্তিশালী পারস্পরিক সম্পর্ক বলে মনে হয়।

আমি পরিসংখ্যান সম্পর্কে খুব বেশি জানি না তাই এখানে কয়েকটি প্রশ্ন রয়েছে:

  1. এটি কি বৈধ পরিসংখ্যানগত পদ্ধতির?
  2. বিনের সর্বাধিক সংখ্যক সন্ধানের জন্য কি কোনও পদ্ধতি আছে?
  3. এই পদ্ধতির জন্য উপযুক্ত শব্দটি কী তাই আমি এটি গুগল করতে পারি?
  4. এই পদ্ধতির সম্পর্কে জানতে প্রাথমিক কিছু সংস্থান কী কী?
  5. এই ডেটাতে সম্পর্কগুলি খুঁজে পেতে আমি ব্যবহার করতে পারি এমন আরও কিছু উপায় কী?

এখানে রেফারেন্সের জন্য ডেসাইল তথ্য রয়েছে: https://gist.github.com/georgeu2000/81a907dc5e3b7952bc90

সম্পাদনা: এখানে ডেটার একটি চিত্র রয়েছে: শিল্প গতিবেগটি স্বাধীন ভেরিয়েবল, এন্ট্রি পয়েন্ট গুণমান নির্ভর Quality

শিল্প গতিবেগটি স্বাধীন ভেরিয়েবল, এন্ট্রি পয়েন্ট গুণমান নির্ভর Quality


আশা করি আমার উত্তরটি (বিশেষ প্রতিক্রিয়াগুলিতে ২-৪) বোঝার সাথে সাথে বোঝা গেল যে এটি উদ্দেশ্য ছিল।
গ্লেন_বি -রিনস্টেট মনিকা

যদি আপনার উদ্দেশ্য হয় স্বতন্ত্র এবং নির্ভরশীলদের মধ্যে একটি সম্পর্ক ফর্ম অন্বেষণ করা, এটি একটি সূক্ষ্ম অনুসন্ধান কৌশল technique এটি পরিসংখ্যানবিদদের আপত্তিজনক হতে পারে তবে শিল্পে সর্বদা ব্যবহৃত হয় (যেমন creditণের ঝুঁকি)। আপনি যদি ভবিষ্যদ্বাণীপূর্ণ মডেল তৈরি করছেন, তবে আবার বৈশিষ্ট্য ইঞ্জিনিয়ারিং ঠিক আছে - যদি এটি কোনও প্রশিক্ষণে করা হয় তবে সঠিকভাবে বৈধতা রয়েছে।
বি_মিনার

ফলাফলটি "সঠিকভাবে যাচাই করা হয়েছে" তা নিশ্চিত করার জন্য কীভাবে আপনি কোনও সংস্থান সরবরাহ করতে পারেন?
বি সেভেন

"সম্পর্ক নেই (আর-স্কোয়ারড 0.006)" তার মানে তারা নেই সুসংগত সম্পর্কিত। সম্ভবত এর সাথে জড়িত আরও কিছু সম্পর্ক রয়েছে। আপনি কি কাঁচা ডেটা (নির্ভর বনাম স্বতন্ত্র) প্লট করেছেন ?
এমিল ফ্রেডম্যান

আমি ডেটা প্লট করেছিলাম, তবে এটিকে প্রশ্নের সাথে যুক্ত করার কথা ভাবিনি। কি একটি মহান ধারণা! আপডেট প্রশ্ন দেখুন।
বি সেভেন

উত্তর:


9

0. পারস্পরিক সম্পর্ক (0.0775) ছোট তবে (পরিসংখ্যানগতভাবে) 0 থেকে উল্লেখযোগ্যভাবে পৃথক। এটি মনে হচ্ছে সত্যিকারের পারস্পরিক সম্পর্ক রয়েছে, এটি কেবল খুব ছোট / দুর্বল (সমানভাবে, সম্পর্কের চারপাশে প্রচুর শব্দ আছে)।

১. বিনয়ের মধ্যে কী গড় গড় হয় তা উপাত্তের তারতম্যকে হ্রাস করে ( একটি গড়ের স্ট্যান্ডার্ড ত্রুটির জন্য প্রভাব), যার অর্থ আপনি কৃত্রিমভাবে দুর্বল পারস্পরিক সম্পর্ককে বাড়িয়ে তোলেন। আরো দেখুন এই (কিছুটা) সংশ্লিষ্ট ইস্যুσ/এন

২. অবশ্যই, কম বিনের অর্থ আরও বেশি ডেটা গড় হয়েছে, শব্দ কমানো, তবে তারা যত বিস্তৃত হবে, প্রতিটি ফিনে গড় "ফাজিয়ার" হয়ে যায় কারণ গড়টি বেশ ধ্রুব নয় - একটি বাণিজ্য বন্ধ রয়েছে। লিনিয়ারিটি এবং এর বিতরণ অনুমানের অধীনে পারস্পরিক সম্পর্ককে অনুকূলিতকরণের জন্য কোনও সূত্র তৈরি করতে পারে , তবে এটি ডেটাতে কিছুটা শোষণের প্রভাবের পুরো অ্যাকাউন্ট গ্রহণ করবে না। সহজ উপায় হ'ল যতক্ষণ না আপনি নিজের পছন্দ মতো না পান ততক্ষণ বিভিন্ন বিউন সীমারেখার সম্পূর্ণ বিভিন্ন ধরণের চেষ্টা করে। বিন-প্রস্থ এবং বিন-উত্সগুলি ভিন্ন করার চেষ্টা করতে ভুলবেন না। সেই কৌশলটি মাঝে মধ্যে ঘনত্বগুলির সাথে আশ্চর্যজনকভাবে কার্যকর প্রমাণ করতে পারে এবং এই ধরণের মাঝে মাঝে সুবিধা কার্যকরী সম্পর্কের দিকে চালিত হতে পারে - সম্ভবত আপনাকে সক্ষম করতে সক্ষম করেএক্সঠিক ফলাফলের তোমার জন্য আশা প্রকাশ করেন

৩.হ্যাঁ সম্ভবত এই অনুসন্ধানটি দিয়ে শুরু করুন, তারপরে সম্ভবত প্রতিশব্দ ব্যবহার করুন।

৪. এটি শুরু করার জন্য একটি ভাল জায়গা; এটি একটি অখ্যাত পরিসংখ্যানবিদদের লক্ষ্য নিয়ে খুব জনপ্রিয় বই।

৫. (আরও গুরুত্ব সহকারে :) আমি সম্পর্কের তদন্তের এক উপায় হিসাবে স্মুথ (যেমন স্থানীয় বহুপদী রিগ্রেশন / কর্নেল স্মুথিংয়ের মাধ্যমে) বলতে চাই। এটি আপনি কী চান ঠিক তার উপর নির্ভর করে তবে আপনি যখন কোনও ডেটা-ড্রেজিংয়ের সমস্যাটি এড়িয়ে চলেন না তখন কোনও সম্পর্কের ফর্মটি জানেন না এমন ক্ষেত্রে এটি একটি বৈধ পন্থা হতে পারে।


একটি জনপ্রিয় উক্তি আছে, যার প্রবর্তক রোনাল্ড কোয়েস হিসাবে উপস্থিত হয়েছেন :

"আপনি যদি ডেটাটিকে পর্যাপ্ত পরিমাণে নির্যাতন করেন তবে প্রকৃতি সর্বদা স্বীকার করবে।"


পয়েন্ট 1 এবং 2 হ'ল ওপি'র দৃষ্টিভঙ্গি কেন বৈধ পরিসংখ্যানগত দৃষ্টিভঙ্গি নয় এর ভালো ব্যাখ্যা , যদিও পয়েন্ট 0 (দুর্বল সম্পর্ক) সম্পর্কিত বিষয়ে বোঝানো এটি একটি দরকারী ধর্মতাত্ত্বিক।
আসাদ ইব্রাহিম

9

সম্ভবত আপনি কোনও অনুসন্ধানের সরঞ্জাম থেকে উপকৃত হবেন। এক্স স্থানাঙ্কের ডেস্কলালে ডেটা বিভক্ত করা সেই আত্মায় সম্পাদিত হয়েছে বলে মনে হয়। নীচে বর্ণিত পরিবর্তনগুলি সহ, এটি একটি দুর্দান্ত সূচনা fine

অনেক দ্বিখণ্ডিত অনুসন্ধান পদ্ধতি উদ্ভাবিত হয়েছে। জন টুকি ( ইডিএ , অ্যাডিসন-ওয়েসলি 1977) দ্বারা প্রস্তাবিত একটি সাধারণ যা হ'ল তার "ঘোরাঘুরির পরিকল্পনার প্লট"। আপনি এক্স-স্থানাঙ্ককে টুকরো টুকরো করে ফেলুন, প্রতিটি বিনের মাঝখানে সংশ্লিষ্ট y ডেটার একটি উল্লম্ব বক্সপ্লট খাড়া করুন এবং বাক্সপ্লটসের (মিডিয়ান, কব্জি ইত্যাদি) মূল অংশগুলি বক্ররেখায় সংযুক্ত করুন (allyচ্ছিকভাবে তাদের মসৃণ করুন)। এই "ঘোরাঘুরির চিহ্নগুলি" উপাত্তের দ্বিখণ্ডিত বিতরণের চিত্র সরবরাহ করে এবং অবিলম্বে পারস্পরিক সম্পর্ক, সম্পর্কের লাইনারিটি, বহিরাগতদের এবং প্রান্তিক বিতরণগুলির তত্ক্ষণাত ভিজ্যুয়াল মূল্যায়নের পাশাপাশি শক্তিশালী অনুমান এবং যেকোন ননরেখা রেজিস্ট্রেশন ফাংশনের যথার্থ মূল্যায়ন ।

এই ধারণায় টুকি বাক্সপ্লোট ধারণার সাথে সামঞ্জস্য রেখে এই চিন্তাকে যুক্ত করেছিলেন যে, ডেটা বন্টন তদন্তের একটি ভাল উপায় হল মাঝখানে শুরু করা এবং বাইরের দিকে কাজ করা, আপনি যতটা যান তত পরিমাণে অর্ধেক করে যান। অর্থাৎ ব্যবহার প্রয়োজন বিন সমানভাবে-ব্যবধানযুক্ত quantiles এ কাটা হতে হবে, কিন্তু এর পরিবর্তে বিন্দুতে quantiles প্রতিফলিত হওয়া উচিত এবং2-1-2- জন্য =1,2,3,...

পরিবর্তিত বিন জনসংখ্যা প্রদর্শন করতে আমরা প্রতিটি বক্সপ্লটের প্রস্থকে প্রতিনিধিত্ব করে এমন ডেটার পরিমাণের সাথে আনুপাতিক করে তুলতে পারি।

ফলস্বরূপ ঘোরাঘুরির স্কিম্যাটিক প্লটটি এরকম কিছু দেখায়। ডেটা সংক্ষিপ্তসার থেকে উন্নত হিসাবে ডেটা পটভূমিতে ধূসর বিন্দু হিসাবে দেখানো হয়। এর উপরে পাঁচটি বর্ণের রঙ এবং বক্সপ্লটগুলি (যে কোনও বহিরাগতকে দেখানো হয়েছে) কালো এবং সাদা রঙের সাথে ভ্রমন স্কিম্যাটিক প্লটটি অঙ্কিত হয়েছে।

ব্যক্তিত্ব

কাছাকাছি-শূন্য সম্পর্কের প্রকৃতি তাত্ক্ষণিকভাবে পরিষ্কার হয়ে যায়: চারদিকে ডেটা পাকিয়ে দেয়। তাদের কেন্দ্রের কাছাকাছি, থেকে শুরু করেএক্স=-4 প্রতি এক্স=4, তাদের একটি দৃ positive় ইতিবাচক পারস্পরিক সম্পর্ক রয়েছে। চূড়ান্ত মানগুলিতে, এই ডেটাগুলি বক্ররেখার সম্পর্কগুলি প্রদর্শন করে যা পুরোপুরি নেতিবাচক থাকে। নেট পারস্পরিক সম্পর্ক সহগ (যা ঘটে তা ঘটে)-0,074এই তথ্যগুলির জন্য) শূন্যের কাছাকাছি। যাইহোক, "প্রায় কোনও সম্পর্ক নেই" বা "উল্লেখযোগ্য তবে নিম্ন সম্পর্কের" হিসাবে ব্যাখ্যা করার উপর জোর দেওয়া একই রকম ত্রুটি হবে যে আইসবক্সে চুলা ও পায়ে মাথা রেখে খুশি ছিলেন বলে পরিসংখ্যানবিদ সম্পর্কে পুরাতন রসিকতাতে কারণ একই সাথে তাপমাত্রা আরামদায়ক ছিল। কখনও কখনও একক সংখ্যা পরিস্থিতি বর্ণনা করতে পারে না।

অনুরূপ উদ্দেশ্যে বিকল্প অনুসন্ধানের সরঞ্জামগুলির মধ্যে ডেটাগুলির উইন্ডোড কোয়ান্টাইলগুলির শক্ত মসৃণতা এবং বিভিন্ন পরিমাণে কোয়ান্টাইল ব্যবহার করে কোয়ান্টাইল রিগ্রেশনগুলির ফিট রয়েছে fits এই গণনাগুলি সম্পাদন করার জন্য সফ্টওয়্যারটির প্রস্তুত প্রাপ্যতার সাথে তারা সম্ভবত ঘোরাঘুরির স্কিম্যাটিক ট্রেসের চেয়ে কার্যকর করা সহজ হয়ে গেছে, তবে তারা নির্মাণের সহজ সরলতা, ব্যাখ্যা সহজেই এবং ব্যাপক প্রয়োগযোগ্যতা উপভোগ করে না।


নিম্নলিখিত Rকোডটি চিত্রটি তৈরি করেছে এবং সামান্য বা কোনও পরিবর্তন ছাড়াই মূল ডেটাতে প্রয়োগ করা যেতে পারে। (প্রদত্ত সতর্কবাণীগুলি উপেক্ষা করুন (দ্বারা bpltডাকা bxp): এটির কোনও বিদেশী না থাকলে এটি অভিযোগ করে ))

#
# Data
#
set.seed(17)
n <- 1449
x <- sort(rnorm(n, 0, 4))
s <- spline(quantile(x, seq(0,1,1/10)), c(0,.03,-.6,.5,-.1,.6,1.2,.7,1.4,.1,.6),
            xout=x, method="natural")
#plot(s, type="l")
e <- rnorm(length(x), sd=1)
y <- s$y + e # ($ interferes with MathJax processing on SE)
#
# Calculations
#
q <- 2^(-(2:floor(log(n/10, 2))))
q <- c(rev(q), 1/2, 1-q)
n.bins <- length(q)+1
bins <- cut(x, quantile(x, probs = c(0,q,1)))
x.binmed <- by(x, bins, median)
x.bincount <- by(x, bins, length)
x.bincount.max <- max(x.bincount)
x.delta <- diff(range(x))
cor(x,y)
#
# Plot
#
par(mfrow=c(1,1))
b <- boxplot(y ~ bins, varwidth=TRUE, plot=FALSE)
plot(x,y, pch=19, col="#00000010", 
     main="Wandering schematic plot", xlab="X", ylab="Y")
for (i in 1:n.bins) {
  invisible(bxp(list(stats=b$stats[,i, drop=FALSE],
                     n=b$n[i],
                     conf=b$conf[,i, drop=FALSE],
                     out=b$out[b$group==i],
                     group=1,
                     names=b$names[i]), add=TRUE, 
                boxwex=2*x.delta*x.bincount[i]/x.bincount.max/n.bins, 
                at=x.binmed[i]))
}

colors <- hsv(seq(2/6, 1, 1/6), 3/4, 5/6)
temp <- sapply(1:5, function(i) lines(spline(x.binmed, b$stats[i,], 
                                             method="natural"), col=colors[i], lwd=2))

@ এঙ্গারস্টুডেন্ট আপনি কোড চালানোর আগে দয়া করে এই পোস্টের পাঠ্যটি পড়ুন। সেই সতর্কতাটির উল্লেখ ও ব্যাখ্যা করা হয়েছে।
whuber

আমি বুঝতে পারি না যে এই ভেক্টরটি কোথা থেকে আসছে c(0,.03,-.6,.5,-.1,.6,1.2,.7,1.4,.1,.6), এটি কি উত্পন্ন হচ্ছে এবং ডেটা নির্ভর ( x)? আপনি উল্লেখ 2^*(-k)কিন্তু এটি সম্পর্কিত নয়।
ম্যাক্সিমিলিয়ান

@ ম্যাক্স দ্য ভেক্টর এই বিশেষ উদাহরণটি উত্পন্ন করে।
whuber

ঠিক আছে, তবে আপনি কীভাবে পরিসংখ্যানগুলি প্রক্রিয়া করলেন? এটি স্পষ্টতই ভুল:k <- 1:11; ifelse(quantile(g, seq(0,1,1/10))>0, 2^(-k), 1-2^(-k))
ম্যাক্সিমিলিয়ান

"ম্যাক্স আমি বুঝতে পারি না আপনি" স্পষ্টত ভুল "বলতে কী বোঝাতে পারেন। আপনি আমার কোডটি উল্লেখ করতে পারবেন না: একটি চেক হিসাবে, আমি এটি আবার চালিয়েছি এবং এটি প্রতিটি বিবরণে চিত্রটি পুনরুত্পাদন করে।
whuber

6

আমি বিশ্বাস করি না যে বিনিং সমস্যাটির জন্য একটি বৈজ্ঞানিক পদ্ধতি। এটি তথ্য হারাতে এবং নির্বিচারে। র‌্যাঙ্ক (অর্ডিনাল; সেমিপারমেট্রিক) পদ্ধতিগুলি আরও ভাল এবং তথ্য হারাবেন না। এমনকি যদি কোনওটি ডেসাইল বিনিনে স্থির হয় তবে পদ্ধতিটি এখনও অন্যের দ্বারা স্বেচ্ছাসেবী এবং পুনরুত্পাদনযোগ্য, কেবলমাত্র সংখ্যার সংখ্যার সংখ্যার সংখ্যার সংখ্যার জন্য যা ডেটাগুলির সাথে সম্পর্কগুলির ক্ষেত্রে ব্যবহার করা হয়। এবং উপরের দুর্দান্ত ডেটা নির্যাতনের মন্তব্যে ইঙ্গিত হিসাবে, হাওয়ার্ড ওয়াইনারের কাছে একটি দুর্দান্ত কাগজ রয়েছে যা কীভাবে একটি ইতিবাচক সমিতি তৈরি করতে পারে এবং কীভাবে একটি নেতিবাচক সংঘবদ্ধতা তৈরি করতে পারে এমন বিনগুলি খুঁজে বের করে, একই ডেটাসেট থেকে:

 @Article{wai06fin,
   author =          {Wainer, Howard},
   title =       {Finding what is not there through the unfortunate
    binning of results: {The} {Mendel} effect},
   journal =     {Chance},
   year =        2006,
   volume =      19,
   number =      1,
   pages =       {49-56},
   annote =      {can find bins that yield either positive or negative
    association;especially pertinent when effects are small;``With four
    parameters, I can fit an elephant; with five, I can make it wiggle its
    trunk.'' - John von Neumann}
 }

এটাই আমার সন্দেহ হয়েছিল। আপনি যদি বিভিন্ন সংখ্যক বিন নির্বাচন করেন তবে যা কিছু সন্ধান করছেন তা প্রদর্শন করার জন্য আপনি সেরা সম্পর্কটি খুঁজে পেতে পারেন। তবে ফলাফলগুলি পুনরুত্পাদনযোগ্য বা বৈজ্ঞানিকভাবে বৈধ হবে না। আপনি কি র‌্যাঙ্কিং সম্পর্কে কোনও প্রাথমিক সূত্র জানেন?
বি সেভেন

3
এটি গ্রহণ করার জন্য অত্যধিক চরম অবস্থানের মতো বলে মনে হচ্ছে। অবশ্যই র‌্যাঙ্ক-ভিত্তিক পদ্ধতিগুলিও তথ্য হারাতে পারে: তারা প্রকৃত মান সম্পর্কে সমস্ত তথ্য বাতিল করে দেয়। সুতরাং তথ্য হ্রাস একটি উদ্বেগ কিনা তা নিয়ে প্রশ্নটি আসে কেন বিশ্লেষণ করা হচ্ছে? যদি এটি আবিষ্কার এবং অন্বেষণের জন্য হয় তবে বিন্নের বিভিন্ন দিকনির্দেশিত ফর্মগুলি একটি ভাল কাজ করতে পারে যেখানে সমস্ত কিছুকে পদমর্যাদার সাথে প্রতিস্থাপনের ফলে সম্পর্কগুলি অস্পষ্ট এবং বিকৃত হতে পারে। এটি যদি নিশ্চিতকরণ বা অনুমানের পরীক্ষার জন্য হয় তবে আপনার মন্তব্যগুলি আরও সাধারণভাবে প্রযোজ্য এবং প্রতিরক্ষামূলক ens
whuber

2
আমি সত্যিই এর সাথে একমত নই র‌্যাঙ্ক-ভিত্তিক পদ্ধতিগুলির দ্বারা হারিয়ে যাওয়া তথ্যের ধরণটি ন্যূনতম (যেমন,π-3πগাউসিয়ান অবশিষ্টাংশ ক্ষেত্রে) এবং আরও অনুমান-বোঝা পদ্ধতিগুলির সাথে সম্পর্কিত তারা তথ্য অর্জন করতে পারে । গড় এবং কোয়ান্টাইলগুলি অনুমান করার জন্য একটি সেমিপ্রেমেট্রিক মডেল (উদাহরণস্বরূপ, আনুপাতিক প্রতিকূল মডেল) ব্যবহার করা কঠিন নয়ওয়াই|এক্স। অনুসন্ধানের সময় (আপনি কোনও গুরুত্বপূর্ণ কিছু মিস করতে পারেন) বা আনুষ্ঠানিক বিশ্লেষণের সময় (শক্তি এবং যথাযথ ক্ষতি এবং স্বেচ্ছাচারিতা) তথ্য হ্রাস প্রায় সর্বদা একটি খারাপ বিষয়।
ফ্রাঙ্ক হ্যারেল

2

এক্স পর্যবেক্ষণ করা এক্স ("এন্ট্রি পয়েন্ট কোয়ালিটি") এর উপর ভিত্তি করে ডেটাগুলি ডেস্কলগুলিতে বিভক্ত করা প্রথমে ওয়াল্ড দ্বারা প্রস্তাবিত একটি পুরানো পদ্ধতির সাধারণীকরণ এবং পরে অন্যদের দ্বারা এক্স এবং ওয়াই উভয়ের ত্রুটিযুক্ত বলে মনে হয়। (ওয়াল্ড ডেটা দুটি গ্রুপে বিভক্ত করেছেন। নায়ার ও শ্রীবাস্তব এবং বার্টলেট এটিকে তিন ভাগে বিভক্ত করেছেন।) এটি হ্যাগলিন, মোস্টেলার এবং টুকি দ্বারা সম্পাদিত বোঝাপড়া ও এক্সপ্লোরেটরি ডেটা অ্যানালাইসিসের বিভাগ 5 সি-তে বর্ণিত হয়েছে (উইলি, 1983)। তবে এই জাতীয় "পরিমাপ ত্রুটি" বা "ভেরিয়েবল মডেলগুলিতে ত্রুটি" নিয়ে প্রচুর কাজ তখন থেকেই হয়েছে then আমি যে পাঠ্যপুস্তকগুলিতে দেখেছি সেগুলি হ'ল পরিমাপ ত্রুটি: মডেল, পদ্ধতি এবং অ্যাপ্লিকেশন জন বুওনাকর্সি (সিআরসি প্রেস,

আপনার পরিস্থিতি কিছুটা আলাদা হতে পারে কারণ আপনার স্ক্র্যাটারপ্লট আমাকে সন্দেহ করতে পরিচালিত করে যে উভয় পর্যবেক্ষণ এলোমেলো পরিবর্তনশীল এবং আমি জানি না যে সেগুলিতে প্রত্যেকটিতে পরিমাপের ত্রুটি রয়েছে কিনা। ভেরিয়েবলগুলি কী উপস্থাপন করে?


এন্ট্রি পয়েন্ট কোয়ালিটি হ'ল একটি নির্দিষ্ট সময়ে একটি স্টক স্বল্প মেয়াদে কতটা বৃদ্ধি বা পড়ে falls শিল্প গতিবেগ সময় একই সময়ে শেয়ারের জন্য শিল্পের "গতি" একটি পরিমাপ। অনুমানটি হ'ল শিল্পের গতি এবং স্টকের ভবিষ্যতের দামের মধ্যে একটি সম্পর্ক রয়েছে।
বি সেভেন

1
আমরা সাধারণত উল্লম্ব অক্ষের উপর প্রতিক্রিয়া রাখি। ভিজ্যুয়াল ইন্সপেকশন থেকে বোঝা যায় যে সত্যিকারের সম্পর্ক থাকলেও, এন্ট্রি পয়েন্টের মানের পরিবর্তনের বিষয়টি একেবারেই অকেজো করে তোলে। আপনি যেহেতু স্টকের দাম নিয়ে কাজ করছেন তাই জিনিসগুলি আরও জটিল হয়ে ওঠে কারণ সময় সিরিজ জড়িত।
এমিল ফ্রেডম্যান

2

আমি এর জন্য লোকালগাউস প্যাকেজটি খুব দরকারী বলে মনে করি। https://cran.r-project.org/web/packages/localgauss/index.html

প্যাকেজ রয়েছে

স্থানীয় গাউসিয়ান প্যারামিটারগুলি অনুমান করা এবং দেখার জন্য গুণগত রুটিন ut স্থানীয় গাউসিয়ান প্যারামিটারগুলি বিভাজনে উপাত্তের মধ্যে অ-রৈখিক নির্ভরতার জন্য চিহ্নিতকরণ এবং পরীক্ষার জন্য দরকারী।

উদাহরণ:

library(localgauss)
x=rnorm(n=1000)
y=x^2 + rnorm(n=1000)
lgobj = localgauss(x,y)
plot(lgobj)

ফলাফল:

এখানে চিত্র বর্ণনা লিখুন

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.