পরিসংখ্যান এবং বড় তথ্য

4

সফটম্যাক্স বনাম সিগময়েড ফাংশন লজিস্টিক শ্রেণিবদ্ধে?

কোন লজিস্টিক শ্রেণিবদ্ধে ফাংশনের (সফটম্যাক্স বনাম সিগময়েড) পছন্দ কী সিদ্ধান্ত নেয়? ধরুন এখানে 4 টি আউটপুট ক্লাস রয়েছে। উপরের প্রতিটি ফাংশন প্রতিটি শ্রেণীর সঠিক আউটপুট হওয়ার সম্ভাবনা দেয়। তাহলে কোনটি ক্লাসিফায়ারের জন্য নেওয়া উচিত?

62 machine-learning logistic classification softmax

4

ক্ষুদ্র

কিছু পরীক্ষার জন্য R, সেখানে একটি নিম্ন সীমা P-মান এর গণনার । আমি নিশ্চিত নই কেন এটি এই নম্বর, যদি এর কোনও ভাল কারণ থাকে বা এটি যদি স্বেচ্ছাচারিতা হয়। অন্যান্য প্রচুর পরিসংখ্যান প্যাকেজগুলি কেবলমাত্র যায় , তাই এটি নির্ভুলতার অনেক বেশি স্তর। কিন্তু আমি রিপোর্ট অনেকগুলি কাগজপত্র দেখিনি বা …

62 r p-value reporting precision

4

একটি যোগফলের ভেরিয়েন্সগুলি বৈকল্পগুলির সমষ্টিটির সমান?

এটি কি (সর্বদা) সত্য যে ভি এ আর ( ∑i = 1মিএক্সআমি) = ∑i = 1মিভি এ আর ( এক্সআমি)?Var(∑i=1mXi)=∑i=1mVar(Xi)?\mathrm{Var}\left(\sum\limits_{i=1}^m{X_i}\right) = \sum\limits_{i=1}^m{\mathrm{Var}(X_i)} \>?

62 variance

3

প্রথম স্ট্যান্ডার্ড সাধারণ টেবিলটি কে তৈরি করেছেন?

আমি আমার প্রারম্ভিক পরিসংখ্যান শ্রেণিতে স্ট্যান্ডার্ড সাধারণ টেবিলটি প্রবর্তন করতে চলেছি এবং এটি আমাকে অবাক করে দিয়েছিল: প্রথম স্ট্যান্ডার্ডের সাধারণ টেবিলটি কে তৈরি করেছে? কম্পিউটারগুলি আসার আগে তারা কীভাবে এটি করেছিল? আমি কাউকে হাত থেকে হাজার হাজার রিমেনের অঙ্কের সংক্ষিপ্ত-জোরের কথা ভেবে কাঁপছি।

61 normal-distribution algorithms history tables

5

জেফরিজ কেন আগে দরকারী?

আমি বুঝতে পেরেছি যে জেফরি পূর্বে প্যারামিটারাইজেশন অধীনে আক্রমণাত্মক। যাইহোক, আমি যা বুঝতে পারি না কেন এই সম্পত্তিটি পছন্দসই। ভেরিয়েবলের পরিবর্তনের অধীনে আপনি কেন পূর্বের পরিবর্তনটি চান না?

61 bayesian prior

10

"বিজ্ঞানীরা পরিসংখ্যানগত তাত্পর্যের বিরুদ্ধে উঠেছেন" এর অর্থ কী? (প্রকৃতিতে মন্তব্য)

প্রকৃতি বিজ্ঞানীদের মন্তব্যে শিরোনামটি পরিসংখ্যানগত তাত্পর্যগুলির বিরুদ্ধে উঠে আসে : ভ্যালেন্টিন আমরহেইন, স্যান্ডার গ্রিনল্যান্ড, ব্লেক ম্যাকশেন এবং ৮০০ এরও বেশি স্বাক্ষরকারীরা হাইপড দাবির অবসান এবং সম্ভবত গুরুত্বপূর্ণ প্রভাবগুলি বরখাস্ত করার আহ্বান জানিয়েছেন। এবং পরে বিবৃতি ধারণ করে: আবার, আমরা পি মান, আত্মবিশ্বাসের ব্যবধান বা অন্যান্য পরিসংখ্যানমূলক পদক্ষেপের উপর নিষেধাজ্ঞার পক্ষে …

61 statistical-significance p-value bias

2

সম্ভাবনা অনুপাত বনাম বয়েস ফ্যাক্টর

আমি বরং কোনও প্রদত্ত ঘটনার পক্ষে / বিপরীতে উদ্দেশ্যমূলক প্রমাণ উপস্থাপনের জন্য সম্ভাবনা অনুপাতের ব্যবহারের সাথে সম্পর্কিত সুসমাচার প্রচার করছি। যাইহোক, আমি সম্প্রতি শিখেছি যে বেয়েস ফ্যাক্টর বায়েসীয় পদ্ধতিগুলির প্রসঙ্গে একই ধরণের কাজ করে (অর্থাত্ত্বিক পূর্বে উদ্দেশ্য বায়েস ফ্যাক্টরের সাথে একত্রিত হয়ে একটি অবজেক্টিভ আপডেটেড সাবজেক্টিভ স্টেট অব বিশ্বাস অর্জন …

61 likelihood-ratio bayes-factors

2

কেন কেবল তিনটি পার্টিশন? (প্রশিক্ষণ, বৈধতা, পরীক্ষা)

আপনি যখন একটি বড় ডেটাসেটে মডেলগুলি ফিট করার চেষ্টা করছেন, তখন সাধারণ পরামর্শটি হ'ল ডেটাটিকে তিন ভাগে বিভক্ত করা: প্রশিক্ষণ, বৈধতা এবং পরীক্ষা ডেটাসেট। এটি কারণ মডেলগুলির সাধারণত প্যারামিটারগুলির তিনটি "স্তর" থাকে: প্রথম "পরামিতি" হ'ল মডেল বর্গ (যেমন এসভিএম, নিউরাল নেটওয়ার্ক, এলোমেলো বন), পরামিতিগুলির দ্বিতীয় সেট হ'ল "নিয়মিতকরণ" পরামিতি বা …

61 machine-learning model-selection data-mining

6

"নেস্টেড" এবং "অবহেলিত" মডেলের মধ্যে পার্থক্য কী?

শ্রেণিবদ্ধ / বহুস্তর মডেলগুলির সাহিত্যে আমি প্রায়শই "নেস্টেড মডেল" এবং "অ-নেস্টেড মডেল" সম্পর্কে পড়েছি, তবে এর অর্থ কী? কেউ কি আমাকে কিছু উদাহরণ দিতে বা এই ফ্রেসিংয়ের গাণিতিক প্রভাব সম্পর্কে বলতে পারেন?

61 hypothesis-testing terminology nested-models nested-data

5

সঙ্কুচিত পদ্ধতিগুলি কী সমস্যার সমাধান করে?

ছুটির মরসুমটি আমাকে এলিমেটিকাল লার্নিংয়ের সাথে আগুনের পাশে কুঁকানোর সুযোগ দিয়েছে । একটি (ঘন ঘনবাদী) একনোমেট্রিক্সের দৃষ্টিকোণ থেকে আসা, রিজ রিগ্রেশন, লাসো এবং কমপক্ষে অ্যাঙ্গেল রিগ্রেশন (এলএআর) এর মতো সঙ্কুচিত পদ্ধতির ব্যবহার উপলব্ধিতে আমার সমস্যা হচ্ছে। সাধারণত, আমি নিজেরাই প্যারামিটারের অনুমানগুলিতে এবং নিরপেক্ষতা বা কমপক্ষে ধারাবাহিকতা অর্জনে আগ্রহী। সঙ্কুচিত পদ্ধতিগুলি …

61 lasso ridge-regression shrinkage lars

7

একাধিক নির্ভরশীল ভেরিয়েবলগুলির সাথে রিগ্রেশন?

দুই বা ততোধিক নির্ভরশীল ভেরিয়েবলগুলির সাথে একটি (একাধিক) রিগ্রেশন সমীকরণ থাকা কি সম্ভব? অবশ্যই, আপনি দুটি ডিভির জন্য একটি পৃথক দুটি রিগ্রেশন সমীকরণ চালনা করতে পারেন, তবে এটি দুটি ডিভির মধ্যে কোনও সম্পর্ককে ক্যাপচার করবে বলে মনে হয় না?

61 regression

15

কেন প্যারামেট্রিক পরিসংখ্যানগুলিকে ননপ্যারমেট্রিকের চেয়ে বেশি পছন্দ করা হবে?

কেউ আমাকে ব্যাখ্যা করতে পারেন কেন কেউ হাইপোথিসিস টেস্টিং বা রিগ্রেশন বিশ্লেষণের জন্য কেন একটি ননপ্যারমেট্রিক স্ট্যাটিস্টিকাল পদ্ধতিতে প্যারাম্যাট্রিক বেছে নেবেন? আমার মনে, এটি রাফটিংয়ের জন্য যাওয়া এবং জলবিহীন প্রতিরোধী ঘড়ি চয়ন করার মতো, কারণ আপনি এটি ভিজা নাও পারেন । কেন প্রতিটি উপলক্ষে কাজ করে সেই সরঞ্জামটি ব্যবহার করবেন …

60 regression hypothesis-testing mathematical-statistics estimation nonparametric

6

আর ব্যবহার করে লাসো ভবিষ্যদ্বাণী করার মানক ত্রুটি

আমি পূর্বাভাসের জন্য একটি লাসো মডেল ব্যবহার করার চেষ্টা করছি এবং আমার স্ট্যান্ডার্ড ত্রুটিগুলি অনুমান করতে হবে। নিশ্চয়ই এটি করার জন্য কেউ ইতিমধ্যে একটি প্যাকেজ লিখেছেন। তবে যতদূর আমি দেখতে পাচ্ছি, ল্যাশো ব্যবহার করে ভবিষ্যদ্বাণী করে এমন CRAN- র কোনও প্যাকেজই সেই ভবিষ্যদ্বাণীগুলির জন্য মানক ত্রুটিগুলি ফিরিয়ে দেবে না। সুতরাং …

60 r standard-error prediction lasso

5

উল্লেখযোগ্য ফলাফল না পাওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা টাইপ আই ত্রুটির হার বাড়ায়?

আমি ঠিক ভাবছিলাম যে কোনও গুরুত্বপূর্ণ ফলাফল (যেমন, ) প্রাপ্ত না হওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা (যেমন, পি-হ্যাকিং) টাইপ আই ত্রুটির হার বৃদ্ধি করে?পি < .05p<.05p \lt .05 আমি Rএই ঘটনার একটি প্রদর্শনের জন্য অত্যন্ত প্রশংসা করব ।

60 r hypothesis-testing p-value simulation type-i-and-ii-errors

4

কেন স্থায়ী স্বতঃসংশোধনের জন্য কোনও জিএএম অ্যাকাউন্টে অক্ষাংশ এবং দ্রাঘিমাংশ অন্তর্ভুক্ত করে?

আমি বন উজানের জন্য সাধারণীকরণযোগ্য মডেল তৈরি করেছি। স্থানিক-স্বতঃসংশোধনের জন্য অ্যাকাউন্ট করতে আমি অক্ষাংশ এবং দ্রাঘিমাংশকে স্মুথড, ইন্টারঅ্যাকশন শব্দ (অর্থাত্ s (x, y)) হিসাবে অন্তর্ভুক্ত করেছি। আমি এটি অনেকগুলি কাগজপত্র পড়ার উপর ভিত্তি করে তৈরি করেছি যেখানে লেখকরা বলছেন 'স্থানিক স্বতঃসংশোধনের জন্য অ্যাকাউন্টিং করতে, পয়েন্টের স্থানাঙ্কগুলি স্মুথ পদ হিসাবে অন্তর্ভুক্ত …

60 r modeling spatial autocorrelation gam