পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
(কেন) কোহোনেন স্টাইলের এসওএমের পক্ষে নাম পড়েছে?
আমি যতদূর বলতে পারি, কোহোনেন স্টাইলের এসওএমগুলি প্রায় ২০০৫ এর কাছাকাছি পৌঁছেছিল এবং সম্প্রতি তেমন পছন্দ দেখেনি। আমি এমন কোনও কাগজ পাইনি যা বলছে যে এসওএমগুলি অন্য পদ্ধতিতে গ্রাহ্য হয়েছে, বা অন্য কোনও কিছুর সমতুল্য প্রমাণিত হয়েছে (উচ্চ মাত্রায়, যেভাবেই হোক)। তবে মনে হচ্ছে টিএসএনই এবং অন্যান্য পদ্ধতিগুলি আজকাল অনেক …

3
এমন কোনও তদারকি-শেখার সমস্যা রয়েছে যা (গভীর) নিউরাল নেটওয়ার্কগুলি সম্ভবত অন্য কোনও পদ্ধতিকে ছাড়িয়ে যেতে পারে না?
আমি দেখেছি লোকেরা এসভিএম এবং কার্নেলগুলিতে প্রচুর প্রচেষ্টা করেছে এবং তারা মেশিন লার্নিংয়ের একটি স্টার্টার হিসাবে বেশ আকর্ষণীয় দেখায়। তবে আমরা যদি আশা করি যে প্রায়-সর্বদা আমরা (গভীর) নিউরাল নেটওয়ার্কের ক্ষেত্রে কার্যকর ফলাফল খুঁজে পেতে পারি তবে এই যুগে অন্যান্য পদ্ধতির চেষ্টা করার অর্থ কী? এই বিষয়টিতে আমার সীমাবদ্ধতা এখানে। …

3
গভীর সমঝোতা নিউরাল নেটওয়ার্কের প্রাক প্রশিক্ষণ?
গভীর সমঝোতা সংক্রান্ত নিউরাল নেটওয়ার্কের প্রাক-প্রশিক্ষণ সম্পর্কিত কোনও সাহিত্যিক কি কেউ দেখেছেন? আমি কেবল অটেনকোডার বা সীমাবদ্ধ বল্টজম্যান মেশিনগুলিতে অপ্রচারিত প্রাক-প্রশিক্ষণ দেখেছি।

2
আরে কোয়ার্টাইল সন্ধান করা
আর শেখার সময় আমি একটি পরিসংখ্যান পাঠ্যপুস্তকের মধ্য দিয়ে কাজ করছি এবং আমি নিম্নলিখিত উদাহরণে হোঁচট খেয়েছি: দেখার পরে ?quantileআমি নিম্নলিখিত দিয়ে আর এ এটি পুনরায় তৈরি করার চেষ্টা করেছি: > nuclear <- c(7, 20, 16, 6, 58, 9, 20, 50, 23, 33, 8, 10, 15, 16, 104) > quantile(nuclear) …
33 r  quantiles 

2
ভট্টাচার্য দূরত্ব এবং কেএল বৈচিত্রের মধ্যে পার্থক্য
আমি নিম্নলিখিত প্রশ্নের জন্য একটি স্বজ্ঞাত ব্যাখ্যা খুঁজছি: পরিসংখ্যান এবং তথ্য তত্ত্বে, দুটি পৃথক সম্ভাব্যতা বিতরণের পার্থক্যের ব্যবস্থা হিসাবে ভট্টাচার্য দূরত্ব এবং কেএল বৈচিত্রের মধ্যে পার্থক্য কী? তাদের কি একেবারে কোনও সম্পর্ক নেই এবং দুটি সম্ভাব্য বিতরণের মধ্যকার দূরত্বটি সম্পূর্ণ ভিন্ন উপায়ে মাপুন?

8
ডেটা থেকে আউটলিয়ারগুলি অপসারণ করা কি ঠিক আছে?
আমি একটি ডেটাসেট থেকে আউটলিয়ারগুলি সরানোর জন্য একটি উপায় অনুসন্ধান করেছি এবং আমি এই প্রশ্নটি পেয়েছি । তবে এই প্রশ্নের কয়েকটি মন্তব্য এবং উত্তরে লোকেরা উল্লেখ করেছে যে তথ্য থেকে বহিরাগতদের অপসারণ করা খারাপ অভ্যাস। আমার ডেটাসেটে আমার বেশ কয়েকটি আউটলিয়ার রয়েছে যা খুব সম্ভবত পরিমাপের ত্রুটির কারণে। এমনকি তাদের …
33 outliers 

1
ফ্যাক্টর অ্যানালাইসিস / পিসিএতে ঘূর্ণন করার পিছনে স্বজ্ঞাত কারণ এবং কীভাবে উপযুক্ত ঘূর্ণনটি নির্বাচন করবেন?
আমার প্রশ্নগুলো ফ্যাক্টর অ্যানালাইসিসের (বা পিসিএর উপাদানগুলি) উপাদানগুলির ঘূর্ণন করার পিছনে স্বজ্ঞাত কারণ কী? আমার বোধগম্যতা হল, শীর্ষস্থানীয় উপাদানগুলিতে (বা উপাদানগুলি) যদি ভেরিয়েবলগুলি প্রায় সমানভাবে লোড হয় তবে অবশ্যই উপাদানগুলির পার্থক্য করা শক্ত। সুতরাং এক্ষেত্রে উপাদানগুলির আরও ভাল পার্থক্য পেতে রোটেশনটি ব্যবহার করা যেতে পারে। এটা কি সঠিক? ঘূর্ণন করার …

7
একটি (বিশাল) মোড় দিয়ে জন্মদিনের প্যারাডক্স: অংশীদারের সাথে সঠিক জন্মের একই তারিখ ভাগ করে নেওয়ার সম্ভাবনা?
আমি আমার বয়ফ্রেন্ডের মতো একই জন্ম তারিখটি ভাগ করি, একই তারিখটিও একই বছর, আমাদের জন্মগুলি কেবল 5 ঘন্টা বা তার বেশি দ্বারা বিচ্ছিন্ন হয়। আমি জানি যে আমার চেয়ে একই তারিখে জন্মগ্রহণকারী কারও সাথে সাক্ষাত হওয়ার সম্ভাবনা মোটামুটি বেশি এবং আমি কয়েকজনকে জানি যাদের সাথে আমি আমার জন্মদিনটি ভাগ করে …

4
(কেন) ওভারফিটেড মডেলগুলিতে বড় সহগ রয়েছে?
আমি কল্পনা করতে পারি যে একটি চলকটির উপর বৃহত্তর গুণফল, মডেলটির সেই মাত্রায় "সুইং" করার ক্ষমতা আরও বেশি, শব্দের সাথে মানিয়ে যাওয়ার আরও একটি সুযোগ সরবরাহ করে। যদিও আমি মনে করি যে মডেল এবং বড় সহগের মধ্যে পার্থক্য সম্পর্কে আমি যুক্তিসঙ্গত ধারণা পেয়েছি, তবে কেন তারা ওভারফিট মডেলগুলিতে ঘটে তা …

4
সীমাবদ্ধ এবং অসীম প্রকরণের মধ্যে পার্থক্য কী
সীমাবদ্ধ এবং অসীম প্রকরণের মধ্যে পার্থক্য কী? আমার পরিসংখ্যান জ্ঞান বরং মৌলিক; উইকিপিডিয়া / গুগল এখানে খুব একটা সাহায্য করেনি।

3
গ্ল্যাম মডেলগুলির জন্য অবশিষ্টাংশ ডায়াগনস্টিক প্লটগুলির ব্যাখ্যা করা?
আমি কীভাবে গ্ল্যাম মডেলের অবশিষ্ট প্লটগুলি ব্যাখ্যা করতে পারি তার গাইডলাইন সন্ধান করছি। বিশেষত পোয়েসন, নেতিবাচক দ্বিপদী, দ্বিপদী মডেল। মডেলগুলি "সঠিক" হলে আমরা এই প্লটগুলি থেকে কী আশা করতে পারি? (উদাহরণস্বরূপ, আমরা পূর্বাভাসের মানটি বাড়ার সাথে সাথে বৈচিত্রটি বাড়তে আশা করি, যখন কোনও পইসন মডেল নিয়ে কাজ করার জন্য) আমি …


7
একনোমেট্রিক্সে ফাংশন নির্দিষ্ট করে 10 বেসে লগ করার পরিবর্তে আমরা প্রাকৃতিক লোগারিদম (এলএন) ব্যবহার করার কারণ কী?
ইকোনোমেট্রিক্সে ফাংশন নির্দিষ্ট করে 10 বেস করতে লগ করার পরিবর্তে আমরা প্রাকৃতিক লোগারিদম (এলএন) ব্যবহার করার কারণ কী?

1
কীভাবে একটি নিউরাল নেটওয়ার্ক মডেলটিকে প্রশিক্ষণ এবং যাচাই করবেন?
আমি নিউরাল নেটওয়ার্কগুলির সাথে মডেলিংয়ে নতুন, তবে আমি পর্যবেক্ষণের ডেটা ভালভাবে ফিট করে এমন সমস্ত উপলভ্য ডেটা পয়েন্ট সহ একটি নিউরাল নেটওয়ার্ক স্থাপন করতে সক্ষম হয়েছি। নিউটাল প্যাকেজটির সাহায্যে নিউরাল নেটওয়ার্কটি আরয়ে করা হয়েছিল: require(nnet) ##33.8 is the highest value mynnet.fit <- nnet(DOC/33.80 ~ ., data = MyData, size = …

5
একটি নমুনা covariance ম্যাট্রিক্স সবসময় প্রতিসম এবং ধনাত্মক সুনির্দিষ্ট হয়?
যখন কোনও নমুনার কোভেরিয়েন্স ম্যাট্রিক্স গণনা করা হয় তখন কি একটি প্রতিসাম্য এবং ধনাত্মক-নির্দিষ্ট ম্যাট্রিক্স পাওয়ার নিশ্চয়তা দেওয়া হয়? বর্তমানে আমার সমস্যার 4600 টি পর্যবেক্ষণ ভেক্টর এবং 24 টি মাত্রার নমুনা রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.