পরিসংখ্যান এবং বড় তথ্য

3

(কেন) কোহোনেন স্টাইলের এসওএমের পক্ষে নাম পড়েছে?

আমি যতদূর বলতে পারি, কোহোনেন স্টাইলের এসওএমগুলি প্রায় ২০০৫ এর কাছাকাছি পৌঁছেছিল এবং সম্প্রতি তেমন পছন্দ দেখেনি। আমি এমন কোনও কাগজ পাইনি যা বলছে যে এসওএমগুলি অন্য পদ্ধতিতে গ্রাহ্য হয়েছে, বা অন্য কোনও কিছুর সমতুল্য প্রমাণিত হয়েছে (উচ্চ মাত্রায়, যেভাবেই হোক)। তবে মনে হচ্ছে টিএসএনই এবং অন্যান্য পদ্ধতিগুলি আজকাল অনেক …

33 clustering self-organizing-maps

3

এমন কোনও তদারকি-শেখার সমস্যা রয়েছে যা (গভীর) নিউরাল নেটওয়ার্কগুলি সম্ভবত অন্য কোনও পদ্ধতিকে ছাড়িয়ে যেতে পারে না?

আমি দেখেছি লোকেরা এসভিএম এবং কার্নেলগুলিতে প্রচুর প্রচেষ্টা করেছে এবং তারা মেশিন লার্নিংয়ের একটি স্টার্টার হিসাবে বেশ আকর্ষণীয় দেখায়। তবে আমরা যদি আশা করি যে প্রায়-সর্বদা আমরা (গভীর) নিউরাল নেটওয়ার্কের ক্ষেত্রে কার্যকর ফলাফল খুঁজে পেতে পারি তবে এই যুগে অন্যান্য পদ্ধতির চেষ্টা করার অর্থ কী? এই বিষয়টিতে আমার সীমাবদ্ধতা এখানে। …

33 machine-learning svm kernel-trick supervised-learning

3

গভীর সমঝোতা নিউরাল নেটওয়ার্কের প্রাক প্রশিক্ষণ?

গভীর সমঝোতা সংক্রান্ত নিউরাল নেটওয়ার্কের প্রাক-প্রশিক্ষণ সম্পর্কিত কোনও সাহিত্যিক কি কেউ দেখেছেন? আমি কেবল অটেনকোডার বা সীমাবদ্ধ বল্টজম্যান মেশিনগুলিতে অপ্রচারিত প্রাক-প্রশিক্ষণ দেখেছি।

33 machine-learning neural-networks deep-learning conv-neural-network autoencoders

2

আরে কোয়ার্টাইল সন্ধান করা

আর শেখার সময় আমি একটি পরিসংখ্যান পাঠ্যপুস্তকের মধ্য দিয়ে কাজ করছি এবং আমি নিম্নলিখিত উদাহরণে হোঁচট খেয়েছি: দেখার পরে ?quantileআমি নিম্নলিখিত দিয়ে আর এ এটি পুনরায় তৈরি করার চেষ্টা করেছি: > nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, 10, 15, 16, 104) > quantile(nuclear) …

33 r quantiles

2

ভট্টাচার্য দূরত্ব এবং কেএল বৈচিত্রের মধ্যে পার্থক্য

আমি নিম্নলিখিত প্রশ্নের জন্য একটি স্বজ্ঞাত ব্যাখ্যা খুঁজছি: পরিসংখ্যান এবং তথ্য তত্ত্বে, দুটি পৃথক সম্ভাব্যতা বিতরণের পার্থক্যের ব্যবস্থা হিসাবে ভট্টাচার্য দূরত্ব এবং কেএল বৈচিত্রের মধ্যে পার্থক্য কী? তাদের কি একেবারে কোনও সম্পর্ক নেই এবং দুটি সম্ভাব্য বিতরণের মধ্যকার দূরত্বটি সম্পূর্ণ ভিন্ন উপায়ে মাপুন?

33 mathematical-statistics information-theory kullback-leibler bhattacharyya

8

ডেটা থেকে আউটলিয়ারগুলি অপসারণ করা কি ঠিক আছে?

আমি একটি ডেটাসেট থেকে আউটলিয়ারগুলি সরানোর জন্য একটি উপায় অনুসন্ধান করেছি এবং আমি এই প্রশ্নটি পেয়েছি । তবে এই প্রশ্নের কয়েকটি মন্তব্য এবং উত্তরে লোকেরা উল্লেখ করেছে যে তথ্য থেকে বহিরাগতদের অপসারণ করা খারাপ অভ্যাস। আমার ডেটাসেটে আমার বেশ কয়েকটি আউটলিয়ার রয়েছে যা খুব সম্ভবত পরিমাপের ত্রুটির কারণে। এমনকি তাদের …

33 outliers

1

ফ্যাক্টর অ্যানালাইসিস / পিসিএতে ঘূর্ণন করার পিছনে স্বজ্ঞাত কারণ এবং কীভাবে উপযুক্ত ঘূর্ণনটি নির্বাচন করবেন?

আমার প্রশ্নগুলো ফ্যাক্টর অ্যানালাইসিসের (বা পিসিএর উপাদানগুলি) উপাদানগুলির ঘূর্ণন করার পিছনে স্বজ্ঞাত কারণ কী? আমার বোধগম্যতা হল, শীর্ষস্থানীয় উপাদানগুলিতে (বা উপাদানগুলি) যদি ভেরিয়েবলগুলি প্রায় সমানভাবে লোড হয় তবে অবশ্যই উপাদানগুলির পার্থক্য করা শক্ত। সুতরাং এক্ষেত্রে উপাদানগুলির আরও ভাল পার্থক্য পেতে রোটেশনটি ব্যবহার করা যেতে পারে। এটা কি সঠিক? ঘূর্ণন করার …

33 pca interpretation factor-analysis dimensionality-reduction factor-rotation

7

একটি (বিশাল) মোড় দিয়ে জন্মদিনের প্যারাডক্স: অংশীদারের সাথে সঠিক জন্মের একই তারিখ ভাগ করে নেওয়ার সম্ভাবনা?

আমি আমার বয়ফ্রেন্ডের মতো একই জন্ম তারিখটি ভাগ করি, একই তারিখটিও একই বছর, আমাদের জন্মগুলি কেবল 5 ঘন্টা বা তার বেশি দ্বারা বিচ্ছিন্ন হয়। আমি জানি যে আমার চেয়ে একই তারিখে জন্মগ্রহণকারী কারও সাথে সাক্ষাত হওয়ার সম্ভাবনা মোটামুটি বেশি এবং আমি কয়েকজনকে জানি যাদের সাথে আমি আমার জন্মদিনটি ভাগ করে …

33 probability birthday-paradox

4

(কেন) ওভারফিটেড মডেলগুলিতে বড় সহগ রয়েছে?

আমি কল্পনা করতে পারি যে একটি চলকটির উপর বৃহত্তর গুণফল, মডেলটির সেই মাত্রায় "সুইং" করার ক্ষমতা আরও বেশি, শব্দের সাথে মানিয়ে যাওয়ার আরও একটি সুযোগ সরবরাহ করে। যদিও আমি মনে করি যে মডেল এবং বড় সহগের মধ্যে পার্থক্য সম্পর্কে আমি যুক্তিসঙ্গত ধারণা পেয়েছি, তবে কেন তারা ওভারফিট মডেলগুলিতে ঘটে তা …

33 regression variance linear-model bias regularization

4

সীমাবদ্ধ এবং অসীম প্রকরণের মধ্যে পার্থক্য কী

সীমাবদ্ধ এবং অসীম প্রকরণের মধ্যে পার্থক্য কী? আমার পরিসংখ্যান জ্ঞান বরং মৌলিক; উইকিপিডিয়া / গুগল এখানে খুব একটা সাহায্য করেনি।

33 variance intuition partial-moments

3

গ্ল্যাম মডেলগুলির জন্য অবশিষ্টাংশ ডায়াগনস্টিক প্লটগুলির ব্যাখ্যা করা?

আমি কীভাবে গ্ল্যাম মডেলের অবশিষ্ট প্লটগুলি ব্যাখ্যা করতে পারি তার গাইডলাইন সন্ধান করছি। বিশেষত পোয়েসন, নেতিবাচক দ্বিপদী, দ্বিপদী মডেল। মডেলগুলি "সঠিক" হলে আমরা এই প্লটগুলি থেকে কী আশা করতে পারি? (উদাহরণস্বরূপ, আমরা পূর্বাভাসের মানটি বাড়ার সাথে সাথে বৈচিত্রটি বাড়তে আশা করি, যখন কোনও পইসন মডেল নিয়ে কাজ করার জন্য) আমি …

33 generalized-linear-model diagnostic residuals

3

পরিসংখ্যানগতভাবে সংখ্যাগুলি এলোমেলো হয়?

মনে করুন আপনি ক্রমটি পর্যবেক্ষণ করেছেন: 7, 9, 0, 5, 5, 5, 4, 8, 0, 6, 9, 5, 3, 8, 7, 8, 5, 4, 0, 0, 6, 6, 4, 5, 3, 3, 7, 5, 9, 8, 1, 8, 6, 2, 8, 4, 6, 4, 1, 9, 9, 0, 5, 2, …

33 random-generation randomness

7

একনোমেট্রিক্সে ফাংশন নির্দিষ্ট করে 10 বেসে লগ করার পরিবর্তে আমরা প্রাকৃতিক লোগারিদম (এলএন) ব্যবহার করার কারণ কী?

ইকোনোমেট্রিক্সে ফাংশন নির্দিষ্ট করে 10 বেস করতে লগ করার পরিবর্তে আমরা প্রাকৃতিক লোগারিদম (এলএন) ব্যবহার করার কারণ কী?

33 econometrics

1

কীভাবে একটি নিউরাল নেটওয়ার্ক মডেলটিকে প্রশিক্ষণ এবং যাচাই করবেন?

আমি নিউরাল নেটওয়ার্কগুলির সাথে মডেলিংয়ে নতুন, তবে আমি পর্যবেক্ষণের ডেটা ভালভাবে ফিট করে এমন সমস্ত উপলভ্য ডেটা পয়েন্ট সহ একটি নিউরাল নেটওয়ার্ক স্থাপন করতে সক্ষম হয়েছি। নিউটাল প্যাকেজটির সাহায্যে নিউরাল নেটওয়ার্কটি আরয়ে করা হয়েছিল: require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ ., data = MyData, size = …

33 r neural-networks

5

একটি নমুনা covariance ম্যাট্রিক্স সবসময় প্রতিসম এবং ধনাত্মক সুনির্দিষ্ট হয়?

যখন কোনও নমুনার কোভেরিয়েন্স ম্যাট্রিক্স গণনা করা হয় তখন কি একটি প্রতিসাম্য এবং ধনাত্মক-নির্দিষ্ট ম্যাট্রিক্স পাওয়ার নিশ্চয়তা দেওয়া হয়? বর্তমানে আমার সমস্যার 4600 টি পর্যবেক্ষণ ভেক্টর এবং 24 টি মাত্রার নমুনা রয়েছে।

33 sampling covariance