পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
কেন আমরা কেবল
আমি কেবল কৌতূহল বোধ করি কেন সাধারণত কেবলমাত্র এল1L1L_1 এবং এল2L2L_2 নিয়মাবলী নিয়মিত হয়। এগুলি আরও ভাল কেন তার প্রমাণ রয়েছে?

1
মেট্রোপলিস হেস্টিংস, গীবস, গুরুত্ব এবং প্রত্যাখ্যানের নমুনার মধ্যে পার্থক্য কী?
আমি MCMC পদ্ধতি শিখতে চেষ্টা করছি এবং মহানগর হেস্টিংস, গীবস, গুরুত্ব এবং প্রত্যাখ্যান নমুনা জুড়ে এসেছি। যদিও এর মধ্যে কিছু পার্থক্য স্পষ্ট, যেমন গিবস কীভাবে মেট্রোপলিস হেস্টিংসের একটি বিশেষ ঘটনা যখন আমাদের সম্পূর্ণ শর্ত থাকে তখন অন্যরা কম স্পষ্ট হয় যেমন আমরা যখন গিবস স্যাম্পলারের মধ্যে এমএইচ ব্যবহার করতে চাই …

1
কখন নেস্টেড ক্রস-বৈধকরণের প্রয়োজন হয় এবং ব্যবহারিক পার্থক্য করতে পারে?
মডেল নির্বাচন করতে যেমন ক্রস-বৈধকরণ ব্যবহার করা হয় (যেমন উদাহরণস্বরূপ হাইপারপ্যারামিটার টিউনিং) এবং সেরা মডেলের কর্মক্ষমতা মূল্যায়ন করতে, একজনকে নেস্টেড ক্রস-বৈধকরণ ব্যবহার করা উচিত । বাইরের লুপটি মডেলটির কার্যকারিতা মূল্যায়ন করা এবং অভ্যন্তরীণ লুপটি সেরা মডেলটি নির্বাচন করা হয়; মডেলটি প্রতিটি বাহ্যিক-প্রশিক্ষণ সেটে নির্বাচিত হয় (অভ্যন্তরীণ সিভি লুপ ব্যবহার করে) …

6
বিজ্ঞানীরা কীভাবে সাধারণ বিতরণের সম্ভাব্যতা ঘনত্বের কার্যকারিতাটি আবিষ্কার করলেন?
এটি সম্ভবত একটি অপেশাদার প্রশ্ন, তবে আমি আগ্রহী যে বিজ্ঞানীরা কীভাবে সাধারণ বিতরণ সম্ভাবনার ঘনত্বের ফাংশনটির আকার নিয়ে এসেছিলেন? মূলত আমার বাগগুলি কী কারও পক্ষে এটি সম্ভবত আরও স্বজ্ঞাত হবে যে সাধারণত বিতরণ করা ডেটার সম্ভাব্যতা ফাংশনটি বেল বাঁকানোর চেয়ে আইসোসিল ত্রিভুজের আকার ধারণ করে এবং আপনি কীভাবে এমন ব্যক্তির …

6
কোভেরিয়েন্স অনুমানের ডিনোমিনিটারটি এন -1 এর পরিবর্তে এন -2 হওয়া উচিত নয় কেন?
(নিরপেক্ষ) ভেরিয়েন্স অনুমানের ডিনোমেনেটর হ'ল সেখানে পর্যবেক্ষণ রয়েছে এবং কেবলমাত্র একটি পরামিতি অনুমান করা হচ্ছে।এনn−1n−1n-1nnn V(X)=∑ni=1(Xi−X¯¯¯¯)2n−1V(X)=∑i=1n(Xi−X¯)2n−1 \mathbb{V}\left(X\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)^{2}}{n-1} একই টোকেন দিয়ে আমি ভাবছি যে যখন দুটি পরামিতি অনুমান করা হচ্ছে তখন কেন কোভারিয়েন্সের ডিনোমিনিটারটি হওয়া উচিত নয় ?n−2n−2n-2 Cov(X,Y)=∑ni=1(Xi−X¯¯¯¯)(Yi−Y¯¯¯¯)n−1Cov(X,Y)=∑i=1n(Xi−X¯)(Yi−Y¯)n−1 \mathbb{Cov}\left(X, Y\right)=\frac{\sum_{i=1}^{n}\left(X_{i}-\overline{X}\right)\left(Y_{i}-\overline{Y}\right)}{n-1}

5
পি-ভ্যালুটি কি মূলত অকেজো এবং ব্যবহারে বিপজ্জনক?
এনওয়াই টাইমসের " দ্য অডস, ক্রমাগত আপডেট" নিবন্ধটি আমার দৃষ্টি আকর্ষণ করার জন্য ঘটেছে। সংক্ষেপে বলা যায় যে এটি [বায়েশিয়ান পরিসংখ্যান] জটিল সমস্যাগুলির কাছে বিশেষত কার্যকর হিসাবে প্রমাণিত হচ্ছে, ২০১৩ সালে নিখোঁজ জেলে, জন অলড্রিজ (যদিও এখনও পর্যন্ত, মালয়েশিয়া এয়ারলাইন্সের ফ্লাইট ৩ 37০ এর সন্ধানে) খুঁজে পেতে কোস্ট গার্ডের মতো …

10
বেঁচে থাকার সময়গুলি কেন তাড়াতাড়ি বিতরণ করা হবে বলে ধরে নেওয়া হয়?
আমি ইউসিএলএ আইডিআরএতে এই পোস্টটি থেকে বেঁচে থাকার বিশ্লেষণ শিখছি এবং ১.২.১ বিভাগে বিভক্ত হয়েছি। টিউটোরিয়ালটি বলে: ... যদি বেঁচে থাকার সময়গুলি তাত্পর্যপূর্ণভাবে বিতরণ করা হত তবে বেঁচে থাকার সময়টি পর্যবেক্ষণের সম্ভাবনা ... বেঁচে থাকার সময়গুলি কেন তাড়াতাড়ি বিতরণ করা হবে বলে ধরে নেওয়া হয়? এটা আমার কাছে খুব অপ্রাকৃত …

2
লজিস্টিক রিগ্রেশন বনাম এলডিএ দ্বি-শ্রেণীর শ্রেণিবদ্ধ হিসাবে
আমি লিনিয়ার বৈষম্যমূলক বিশ্লেষণ এবং লজিস্টিক রিগ্রেশন মধ্যে পরিসংখ্যানগত পার্থক্য প্রায় আমার মাথা মোড়ানো চেষ্টা করছি । আমার বোধগম্যটি কি ঠিক যে, দুটি শ্রেণির শ্রেণিবদ্ধকরণ সমস্যার জন্য, এলডিএ দুটি সাধারণ ঘনত্বের ফাংশন (প্রতিটি শ্রেণীর জন্য একটি) পূর্বাভাস দেয় যা একটি লিনিয়ার সীমানা তৈরি করে যেখানে তারা ছেদ করে, যেখানে লজিস্টিক …

2
প্রভাব প্যাকেজটির মাধ্যমে লার আইটেমগুলির জন্য আস্থা অন্তর কতটা বিশ্বাসযোগ্য?
Effectsপ্যাকেজ প্যাকেজ মাধ্যমে প্রাপ্ত রৈখিক মিশ্র প্রভাব মডেল ফলাফল প্লট করার জন্য খুব দ্রুত এবং সুবিধাজনক উপায় সরবরাহ করে । ফাংশন গণনা করে আস্থা অন্তর (সিআইএস) খুব দ্রুত, কিন্তু কিভাবে বিশ্বস্ত এই আস্থা অন্তর কি?lme4effect উদাহরণ স্বরূপ: library(lme4) library(effects) library(ggplot) data(Pastes) fm1 <- lmer(strength ~ batch + (1 | cask), …

2
ক্রস বৈধকরণের কোন পদ্ধতিটি সেরা তা আমি কীভাবে জানতে পারি?
আমি আমার ক্রুশের বৈধতা যাচাইয়ের পদ্ধতিটি আমার পরিস্থিতির পক্ষে সেরা তা বের করার চেষ্টা করছি। নিম্নলিখিত তথ্যগুলি ইস্যুটি (আরে) এর মাধ্যমে কাজ করার জন্য কেবল উদাহরণ, তবে আমার আসল Xতথ্য ( xmat) একে অপরের সাথে সম্পর্কিত এবং yভেরিয়েবল ( ymat) এর সাথে বিভিন্ন ডিগ্রি সম্পর্কিত । আমি আর কোড সরবরাহ …

4
বহুবর্ষীয় মডেল ফিট থেকে সহগের কীভাবে ব্যাখ্যা করবেন?
আমি আমার কাছে থাকা কিছু ডেটাতে দ্বিতীয় ক্রমের বহুবর্ষীয় ফিট তৈরি করার চেষ্টা করছি। আসুন আমি বলি যে আমি এইগুলির সাথে এটি ফিট করে ggplot(): ggplot(data, aes(foo, bar)) + geom_point() + geom_smooth(method="lm", formula=y~poly(x, 2)) আমি পাই: সুতরাং, একটি দ্বিতীয় ক্রম ফিট বেশ ভাল কাজ করে। আমি আর দিয়ে এটি গণনা …

5
এফডিআর নিয়ন্ত্রণের জন্য সাধারণ পদ্ধতি ব্যবহার করার শর্ত হিসাবে "ইতিবাচক নির্ভরতা" এর অর্থ
বেনজামিনী এবং হচবার্গ মিথ্যা আবিষ্কারের হার (এফডিআর) নিয়ন্ত্রণের জন্য প্রথম (এবং এখনও সর্বাধিক ব্যবহৃত, আমি মনে করি) পদ্ধতিটি তৈরি করেছিলাম। আমি পৃথক তুলনার জন্য প্রতিটি পি মানগুলির একটি গুচ্ছ দিয়ে শুরু করতে চাই এবং সিদ্ধান্ত নিতে পারি কোনটি "আবিষ্কার" বলা কম, কোন নির্দিষ্ট মান (10% বলুন) এফডিআর নিয়ন্ত্রণ করে। সাধারণ …

2
0 বা 1 এর দ্বিপদী অনুমানের চারপাশে আত্মবিশ্বাসের বিরতি
দ্বিপদী পরীক্ষার একটি আত্মবিশ্বাসের ব্যবধান গণনা করার জন্য সেরা কৌশলটি কী, যদি আপনার অনুমান হয় যে (বা একইভাবে ) এবং নমুনার আকার তুলনামূলকভাবে ছোট, উদাহরণস্বরূপ ?পি = 1 এন = 25p=0পি=0p=0p=1p=1p=1n=25n=25n=25

1
ভিন্ন ভিন্ন উপাত্তের ডেটাগুলির জন্য একমুখী আনোভা বিকল্প
শৈবাল বায়োমাসের তিনটি গোষ্ঠীর ( একজনএকজনA , বিবিB , সিসিC ) ডেটা রয়েছে যার মধ্যে অসম নমুনার আকার রয়েছে ( এনএকজন= 15এনএকজন=15n_A=15 , এনবি= 13এনবি=13n_B=13 , এনসি= 12এনসি=12n_C=12 ) এবং আমি যদি এই গোষ্ঠীগুলি একই জনসংখ্যার থেকে থাকে তবে আমি তুলনা করতে চাই । একমুখী আনোভা অবশ্যই যাওয়ার উপায় হবে, …

3
লিনিয়ার রিগ্রেশন-এ সহগের বৈচিত্র্য-কোভেরিয়েন্স ম্যাট্রিক্স কীভাবে প্রাপ্ত করবেন
আমি লিনিয়ার রিগ্রেশন সম্পর্কিত একটি বই পড়ছি এবং of এর ভেরিয়েন্স-কোভারিয়েন্স ম্যাট্রিক্স বুঝতে কিছু সমস্যা হচ্ছে :bb\mathbf{b} তির্যক আইটেমগুলি যথেষ্ট সহজ, তবে বন্ধ কিছুটা বেশি কঠিন, আমার কী ধাঁধাটি সে σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1σ(b0,b1)=E(b0b1)−E(b0)E(b1)=E(b0b1)−β0β1 \sigma(b_0, b_1) = E(b_0 b_1) - E(b_0)E(b_1) = E(b_0 b_1) - \beta_0 \beta_1 তবে এখানে এবং এর কোনও চিহ্ন …
36 regression 

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.