পরিসংখ্যান এবং বড় তথ্য

8

উদ্দেশ্য ফাংশন, ব্যয় ফাংশন, ক্ষতি ফাংশন: তারা কি একই জিনিস?

মেশিন লার্নিংয়ে লোকেরা অবজেক্টিভ ফাংশন, ব্যয় ফাংশন, লোকসানের কাজ সম্পর্কে কথা বলে। তারা কি একই জিনিসটির আলাদা আলাদা নাম? এগুলি কখন ব্যবহার করবেন? যদি তারা সবসময় একই জিনিস উল্লেখ না করা হয়, পার্থক্য কি?

80 machine-learning terminology artificial-intelligence

2

দুটি অচিরাচরিত গৌসিয়ানদের মধ্যে কেএল বৈচিত্র

আমাকে দুটি গৌসিয়ার মধ্যে কেএল-বিভাজন নির্ধারণ করতে হবে। আমি আমার ফলাফল তুলনা করছি এইসব , কিন্তু আমি তাদের ফলাফলের পুনর্গঠন করতে পারবে না। আমার ফলাফল স্পষ্টতই ভুল, কারণ KL কেএল (পি, পি) এর জন্য 0 নয়। আমি ভাবছি যেখানে আমি কোন ভুল করছি এবং জিজ্ঞাসা করে কেউ এটির জায়গা খুঁজে …

79 normal-distribution kullback-leibler

7

জুডিয়া পার্ল এর বইয়ের বই: কেন তিনি পরিসংখ্যানকে মারছেন?

আমি পড়া করছি কেন বই যিহূদিয়া পার্ল দ্বারা, এবং এটা আমার চামড়ার নিচে হচ্ছে 1 । বিশেষত, আমার কাছে এটি প্রতীয়মান হয় যে তিনি শর্তহীনভাবে "ধ্রুপদী" পরিসংখ্যানগুলিকে মারাত্মকভাবে স্ট্র ম্যান যুক্তি দিয়ে বলছেন যে পরিসংখ্যান কখনই কার্যকারণীয় সম্পর্কের বিষয়ে তদন্ত করতে সক্ষম হয় না, কারণ এটি কখনও কার্যকারণীয় সম্পর্কের ক্ষেত্রে …

79 causality

9

একক বাস্তব জীবনের ভবিষ্যতের ইভেন্টের সম্ভাবনা: তারা যখন বলে যে "হিলারির জয়ের সম্ভাবনা আছে 75%" তখন এর অর্থ কী?

নির্বাচন যেহেতু এক সময়ের ঘটনা, তাই এটি পুনরুক্ত করা যায় এমন কোনও পরীক্ষা নয়। সুতরাং প্রযুক্তিগতভাবে "হিলারি জয়ের 75% সুযোগ আছে" উক্তিটির সঠিক অর্থ কী? আমি একটি পরিসংখ্যানগতভাবে সঠিক সংজ্ঞাটি খুঁজছি যা কোনও স্বজ্ঞাত বা ধারণা সংক্রান্ত নয়। আমি একজন অপেশাদার পরিসংখ্যান ভক্ত যিনি একটি আলোচনায় উঠে আসা এই প্রশ্নের …

79 probability prediction politics

8

একটি হিস্টোগ্রামে বিনের অনুকূল সংখ্যা গণনা করা

হিস্টোগ্রামে আমার কয়টি বিন ব্যবহার করা উচিত তা নির্ধারণের জন্য আমি যতটা পদ্ধতি ব্যবহার করতে পারি তার সর্বোত্তম হিসাবে অনুসন্ধান করতে আগ্রহী। আমার ডেটা সর্বাধিক 30 থেকে 350 টি অবজেক্টের মধ্যে হওয়া উচিত এবং বিশেষত আমি থ্রোসোল্ডিং (ওটসুর পদ্ধতির মতো) প্রয়োগ করার চেষ্টা করছি যেখানে "ভাল" অবজেক্ট, যা আমার কম …

79 rule-of-thumb histogram

5

অফ-পলিসি এবং অন-পলিসি শেখার মধ্যে পার্থক্য কী?

কৃত্রিম বুদ্ধিমত্তা ওয়েবসাইট নীতির হিসাবে অফ-পলিসি এবং অন-পলিসি শিক্ষার সংজ্ঞা দেয়: "একজন অফ-পলিসি লার্নার এজেন্টের ক্রিয়াকলাপের থেকে স্বতন্ত্র নীতিমালার মান শিখতে পারে Q । " আমি এই বিষয়ে আপনার স্পষ্টতা জিজ্ঞাসা করতে চাই, কারণ তারা আমার সাথে কোনও পার্থক্য করে বলে মনে হয় না। উভয় সংজ্ঞা দেখতে অভিন্ন বলে মনে …

78 machine-learning reinforcement-learning artificial-intelligence

6

কীভাবে বলতে হবে যে ডেটাগুলি "ক্লাস্টারড" যথেষ্ট পরিমাণে ক্লাস্টারিং অ্যালগরিদমগুলিকে অর্থবহ ফলাফল দেওয়ার জন্য রয়েছে?

আপনি কীভাবে জানবেন যে আপনার (উচ্চ মাত্রিক) ডেটা যথেষ্ট পরিমাণে ক্লাস্টারিং প্রদর্শন করে যাতে কমিয়ান বা অন্যান্য ক্লাস্টারিং অ্যালগরিদম থেকে প্রাপ্ত ফলাফলগুলি আসলে অর্থবহ হয়? বিশেষত কে-মানে অ্যালগরিদমের জন্য, প্রকৃতির ক্লাস্টারিংয়ের ফলাফলগুলি অর্থবহ (এবং উদ্দীপক নয়) হওয়ার জন্য-ক্লাস্টারের বৈকল্পিকতার মধ্যে হ্রাসের পরিমাণ কত হওয়া উচিত? যখন ক্লাস্টারিংটি ভিজ্যুয়ালাইজ করা যায় …

78 clustering k-means

21

আর শেখার জন্য নিখরচায় সংস্থান

আমি সস্তাে আর শিখতে আগ্রহী । আর শেখার জন্য সেরা নিখরচায় সংস্থান / বই / টিউটোরিয়াল কোনটি?

78 r references

5

হাতের সাহায্যে বক্ররেখার আওতাধীন অঞ্চল (এউসি) বা সি-স্ট্যাটিস্টিক কীভাবে গণনা করা যায়

বাইনারি লজিস্টিক রিগ্রেশন মডেলটির জন্য হাত বক্ররেখার (এউসি), বা সি-স্ট্যাটিস্টিকের অধীনে অঞ্চল গণনা করতে আমি আগ্রহী। উদাহরণস্বরূপ, বৈধতা ডেটাসেটে, নির্ভরশীল ভেরিয়েবল, রিটেনশন (1 = ধরে রাখা; 0 = ধরে রাখা হয়নি) এর সত্যিকারের মূল্য আমার আছে, পাশাপাশি প্রতিটি পর্যবেক্ষণের জন্য আমার প্রতিরোধ বিশ্লেষণের দ্বারা উত্পাদিত একটি মডেল ব্যবহার করে পূর্বাভাস …

78 regression logistic classification roc auc

7

অবিচ্ছিন্নভাবে ভবিষ্যদ্বাণীকারী ভেরিয়েবলটি ভাঙার সুবিধা কী?

আমি ভাবছি যে কোনও মডেল ব্যবহার করার আগে একটি অবিচ্ছিন্ন ভবিষ্যদ্বাণী ভেরিয়েবল গ্রহণ এবং এটি ভেঙে ফেলার (উদাহরণস্বরূপ, কুইন্টাইলগুলিতে) মান কী is ভেরিয়েবলটি বিন্যস্ত করে আমার কাছে তথ্য হারাবে বলে মনে হয়। এটি কি তাই আমরা অ-লিনিয়ার প্রভাবগুলি মডেল করতে পারি? যদি আমরা চলকটিকে অবিচ্ছিন্নভাবে রাখি এবং এটি সত্যিকারের সরল …

78 regression modeling continuous-data binning regression-strategies

1

নামমাত্র (চতুর্থ) এবং একটি অবিচ্ছিন্ন (ডিভি) ভেরিয়েবলের মধ্যে সম্পর্ক

আমার কাছে নামমাত্র পরিবর্তনশীল (কথোপকথনের বিভিন্ন বিষয়, টপিক ০ = 0 ইত্যাদি হিসাবে কোডেড) এবং একটি কথোপকথনের দৈর্ঘ্যের মতো অনেকগুলি স্কেল ভেরিয়েবল (ডিভি) রয়েছে। আমি কীভাবে নামমাত্র এবং স্কেল ভেরিয়েবলের মধ্যে পারস্পরিক সম্পর্ক স্থাপন করতে পারি?

77 correlation continuous-data categorical-data

3

একটি উদাহরণ: বাইনারি ফলাফলের জন্য গ্ল্যামনেট ব্যবহার করে লাসো রিগ্রেশন

আমি লাসো রিগ্রেশন সহ যেখানে আমার আগ্রহের ফলাফলটি দ্বিধাহীন তা ব্যবহার glmnetকরে ধকল শুরু করছি । আমি নীচে একটি ছোট মক ডেটা ফ্রেম তৈরি করেছি: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, …

77 r self-study lasso regression interpretation anova statistical-significance survey conditional-probability independence naive-bayes graphical-model r time-series forecasting arima r forecasting exponential-smoothing bootstrap outliers r regression poisson-distribution zero-inflation genetic-algorithms machine-learning feature-selection cart categorical-data interpretation descriptive-statistics variance multivariate-analysis covariance-matrix r data-visualization generalized-linear-model binomial proportion pca matlab svd time-series correlation spss arima chi-squared curve-fitting text-mining zipf probability categorical-data distance group-differences bhattacharyya regression variance mean data-visualization variance clustering r standard-error association-measure somers-d normal-distribution integral numerical-integration bayesian clustering python pymc nonparametric-bayes machine-learning svm kernel-trick hyperparameter poisson-distribution mean continuous-data univariate missing-data dag python likelihood dirichlet-distribution r anova hypothesis-testing statistical-significance p-value rating data-imputation censoring threshold

3

আর স্কোয়ারটি কখন নেতিবাচক?

আমার বোধগম্যতা হ'ল নেতিবাচক হতে পারে না কারণ এটি আর এর বর্গক্ষেত্র However তবে আমি এসপিএসএসে একটি সাধারণ স্বতন্ত্র ভেরিয়েবল এবং নির্ভরশীল ভেরিয়েবল সহ একটি সাধারণ লিনিয়ার রিগ্রেশন চালিয়েছিলাম। আমার এসপিএসএস আউটপুট আমাকে আর 2 এর জন্য একটি নেতিবাচক মান দেয় । আমি যদি আর থেকে হাত দিয়ে এটি গণনা …

77 regression spss r-squared

3

কে-মানে ক্লাস্টার বিশ্লেষণের ফলাফলগুলির একটি সুন্দর প্লট কীভাবে উত্পাদন করা যায়?

আমি আর-কে ক্লাস্টারিং-এর জন্য ব্যবহার করছি। আমি কে-মানে চালাতে 14 ভেরিয়েবল ব্যবহার করছি কে-মানে ফলাফলগুলি প্লট করার একটি দুর্দান্ত উপায় কী? কোন বাস্তবায়ন আছে কি? 14 ভেরিয়েবল থাকা ফলাফল কীভাবে জটিল করে তোলে? আমি জিজি ক্লাসটার নামে কিছু পেয়েছি যা দেখতে দুর্দান্ত দেখাচ্ছে তবে এটি এখনও বিকাশে রয়েছে। আমি সামন …

77 data-visualization classification k-means unsupervised-learning

7

টি অ-সাধারণের জন্য পরীক্ষা যখন এন> 50?

অনেক আগেই আমি জানতে পেরেছিলাম যে দুটি বিতরণের দুটি নমুনা টি-পরীক্ষা ব্যবহারের জন্য সাধারণ বন্টন প্রয়োজন। আজ একজন সহকর্মী আমাকে জানিয়েছিলেন যে তিনি শিখলেন যে এন> 50 এর জন্য সাধারণ বিতরণ জরুরি ছিল না। এটা কি সত্যি? যদি সত্য হয় তবে কেন্দ্রীয় সীমাবদ্ধতার কারণে?

77 normal-distribution t-test central-limit-theorem