পরিসংখ্যান এবং বড় তথ্য missing-data

4

দুটি পারস্পরিক সম্পর্ক উল্লেখযোগ্যভাবে পৃথক কিনা তা আমি কীভাবে নির্ধারণ করব?

আমি নির্ধারণ করতে চাই যে কোন দুটি সেট ডেটার (বি 1, বি 2) আরও ভাল সংযোগ (পেয়ারসন আর) অন্য সেট (এ) এর সাথে। সমস্ত সেট ডেটাতে ডেটা নেই। ফলাফলের পারস্পরিক সম্পর্ক উল্লেখযোগ্যভাবে আলাদা কিনা তা আমি কীভাবে নির্ধারণ করতে পারি? উদাহরণস্বরূপ 8426 মানগুলি A এবং B1, r = 0.74 উভয়তেই …

9 hypothesis-testing correlation statistical-significance missing-data

2

এলোমেলো প্রভাব মেটা-বিশ্লেষণের জন্য বিকল্প ওজন স্কীম: মানক বিচ্যুতি অনুপস্থিত

আমি প্রচুর স্টাডিকে কভার করে র্যান্ডম এফেক্টস মেটা-বিশ্লেষণে কাজ করছি যা মানক বিচ্যুতির প্রতিবেদন করে না; সমস্ত অধ্যয়ন নমুনা আকার রিপোর্ট। আমি বিশ্বাস করি না যে এসডি অনুপস্থিত ডেটা আনুমানিক বা গতিবদ্ধ করা সম্ভব। সমস্ত অধ্যয়নের জন্য স্ট্যান্ডার্ড বিচ্যুতি উপলব্ধ না হলে কোনও মেটা-অ্যানালাইসিস যা কাঁচা (অযৌক্তিক) ব্যবহার করে তার …

9 stata missing-data meta-analysis meta-regression

2

সময়ের সাথে আরও বিস্তারিত ব্যাখ্যামূলক ভেরিয়েবলগুলি অন্তর্ভুক্ত করা

আমি বুঝতে চেষ্টা করছি যে আমি কীভাবে একটি পরিবর্তনশীল মডেল করতে পারি যেখানে সময়ের সাথে সাথে ক্রমবর্ধমান বিস্তারিত ভবিষ্যদ্বাণী পেয়েছি। উদাহরণস্বরূপ, খেলাপি loansণগুলিতে মডেলিং পুনরুদ্ধার হারগুলি বিবেচনা করুন। ধরুন আমাদের 20 বছরের ডেটা সহ একটি ডেটাসেট রয়েছে, এবং সেই বছরের 15 বছরের মধ্যে আমরা কেবল জানি যে colণটি জামানত হয়েছিল …

9 regression missing-data

1

কিছু ইনপুটের মান (এনএ) হারিয়ে গেলে র্যান্ডমফোরেস্ট (আর) এর সাথে পূর্বাভাস

আমার একটি দুর্দান্ত randomForestশ্রেণিবদ্ধকরণ মডেল রয়েছে যা আমি একটি অ্যাপ্লিকেশনটিতে ব্যবহার করতে চাই যা একটি নতুন কেসের শ্রেণীর পূর্বাভাস দেয়। নতুন ক্ষেত্রে অনিবার্যভাবে মূল্যবোধ হারিয়েছে। ভবিষ্যদ্বাণী করা এনএ-তে যেমন কাজ করবে না। আমার কীভাবে এটি করা উচিত? data(iris) # create first the new case with missing values na.row<-45 na.col<-c(3,5) case.na<-iris[na.row,] …

9 r random-forest prediction missing-data

1

প্রত্যাশিত ইভেন্টগুলি কীভাবে পর্যবেক্ষণ করা যায়?

ধরুন আমার কাছে 4 টি সম্ভাব্য ইভেন্টের ফ্রিকোয়েন্সিগুলির একটি নমুনা রয়েছে: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 এবং আমার ঘটনার প্রত্যাশিত সম্ভাবনা রয়েছে: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 আমার চারটি ইভেন্টের পর্যবেক্ষণের ফ্রিকোয়েন্সিগুলির যোগফলের সাথে (18) আমি …

9 r statistical-significance chi-squared multivariate-analysis exponential joint-distribution statistical-significance self-study standard-deviation probability normal-distribution spss interpretation assumptions cox-model reporting cox-model statistical-significance reliability method-comparison classification boosting ensemble adaboost confidence-interval cross-validation prediction prediction-interval regression machine-learning svm regularization regression sampling survey probit matlab feature-selection information-theory mutual-information time-series forecasting simulation classification boosting ensemble adaboost normal-distribution multivariate-analysis covariance gini clustering text-mining distance-functions information-retrieval similarities regression logistic stata group-differences r anova confidence-interval repeated-measures r logistic lme4-nlme inference fiducial kalman-filter classification discriminant-analysis linear-algebra computing statistical-significance time-series panel-data missing-data uncertainty probability multivariate-analysis r classification spss k-means discriminant-analysis poisson-distribution average r random-forest importance probability conditional-probability distributions standard-deviation time-series machine-learning online forecasting r pca dataset data-visualization bayes distributions mathematical-statistics degrees-of-freedom

1

অনুপস্থিত পূরবাচক পরিবর্তনশীল সহ একাধিক রিগ্রেশন

ধরুন আমাদের ফর্মের একটি সেট দেওয়া হয়েছে (y,x1,x2,⋯,xn)(y,x1,x2,⋯,xn)(y,x_{1},x_{2},\cdots, x_{n})এবং । মানের উপর ভিত্তি করে এর পূর্বাভাস দেওয়ার কাজটি আমাদের দেওয়া হয় । আমরা দুটি রিগ্রেশন অনুমান করি যেখানে: (y,x1,x2,⋯,xn−1)(y,x1,x2,⋯,xn−1)(y,x_{1},x_{2},\cdots, x_{n-1})yyyxxxYY=চ1(এক্স1, ⋯ ,এক্সn - 1,এক্সএন)=চ2(এক্স1, ⋯ ,এক্সn - 1)(1)(2)(1)y=f1(x1,⋯,xn−1,xn)(2)y=f2(x1,⋯,xn−1) \begin{align} y &=f_{1}(x_{1},\cdots, x_{n-1}, x_{n}) \tag{1} \\ y &=f_{2}(x_{1},\cdots, x_{n-1}) \tag{2} \end{align} …

9 regression multiple-regression missing-data multicollinearity multiple-imputation

4

স্বতঃসিদ্ধকরণ এবং নিউরাল নেটওয়ার্কগুলির জন্য মতলব ব্যবহার করার সময় টাইম সিরিজের ডেটাতে ফাঁক / NaN গুলি কীভাবে মোকাবেলা করবেন?

আমার পরিমাপের একটি সময় সিরিজ রয়েছে (হাইটস-ওয়ান ডাইমেনশনাল সিরিজ)। পর্যবেক্ষণের সময়কালে পরিমাপ প্রক্রিয়াটি কিছু সময়ের জন্য নিচে নেমে গিয়েছিল। সুতরাং ফলস্বরূপ ডেটা NaNs সহ একটি ভেক্টর যেখানে ডেটার ফাঁক ছিল। ম্যাটল্যাব ব্যবহার করে, স্বতঃসংশ্লিষ্টকরণ ( autocorr) গণনা করার সময় এবং নিউরাল নেটওয়ার্ক ( nnstart) প্রয়োগ করার সময় এটি আমার সমস্যার …

9 time-series dataset matlab autocorrelation missing-data

3

শ্রেণীবদ্ধ ভেরিয়েবলগুলির স্তর 'জানেন না / অস্বীকার করেছেন' এর চিকিত্সা করা হচ্ছে

আমি লজিস্টিক রিগ্রেশন ব্যবহার করে ডায়াবেটিস প্রেডিকশন মডেলিং করছি। ব্যবহৃত ডেটাসেটটি হ'ল সেন্টার ফর ডিজিজ কন্ট্রোল (সিডিসি) এর আচরণগত ঝুঁকি ফ্যাক্টর নজরদারি সিস্টেম (বিআরএফএসএস )। স্বাধীন ভেরিয়েবলগুলির মধ্যে একটি হ'ল ব্লাড প্রেসার। এটি নিম্ন স্তরের 'হ্যাঁ', 'না', 'জানেন না / অস্বীকার করেছেন' এর সাথে শ্রেণিবদ্ধ। মডেলটি তৈরি করার সময় আমি …

9 logistic missing-data

7

অসম আকারের দুটি ভেরিয়েবলের মধ্যে সম্পর্ক

যে সমস্যায় আমি কাজ করছি, আমার দুটি এলোমেলো ভেরিয়েবল, এক্স এবং ওয়াই রয়েছে I এগুলির দুটি দুটি কতটা ঘনিষ্ঠভাবে সম্পর্কযুক্ত তা নির্ধারণ করতে হবে তবে সেগুলি ভিন্ন মাত্রার are X এর সারি স্পেসের র‌্যাঙ্ক 4350, এবং Y এর সারি স্পেসের র‌্যাঙ্ক হাজার হাজারে যথেষ্ট বড়। এক্স এবং ওয়াই উভয়ের উভয়ই …

9 time-series correlation missing-data finance

2

হারানো ডেটা সহ বেঁচে থাকার মডেলটি উপযুক্ত কিনা তা আমি কীভাবে নির্ধারণ করব?

কিছুটা পর্যবেক্ষণ করে, আমার প্রায় দশ মিলিয়ন রেকর্ড রয়েছে যা প্রায় দশ বছর ব্যাপী একটি সিস্টেমে মানুষের প্রবেশের সময় এবং প্রস্থান সময় রেকর্ড করে। প্রতিটি রেকর্ডে একটি প্রবেশের সময় থাকে তবে প্রতিটি রেকর্ডের প্রস্থান সময় হয় না। সিস্টেমে গড় সময় ~ 1 বছর। নিখোঁজ প্রস্থান দুটি কারণে ঘটে: ডেটা ক্যাপচারের …

9 survival missing-data

প্রশ্ন ট্যাগ «missing-data»