পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

1
উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি কী এবং সেগুলি কী দরকারী করে?
আমি উত্তরোত্তর ভবিষ্যদ্বাণীমূলক বিতরণ কি তা বুঝতে পেরেছি , এবং আমি উত্তরোত্তর ভবিষ্যদ্বাণীমূলক চেকগুলি সম্পর্কে পড়ছি , যদিও এটি এখনও কী করে তা আমার কাছে পরিষ্কার নয়। উত্তরবর্তী ভবিষ্যদ্বাণীমূলক চেকটি ঠিক কী? কিছু লেখক কেন পোস্টেরিয়ের ভবিষ্যদ্বাণীমূলক চেকগুলি "ডেটা দু'বার ব্যবহার করা" এবং অপব্যবহার করা উচিত নয় বলে মন্তব্য করেন? …

10
দুটি এলোমেলো ভেরিয়েবলের যোগফল কেন একটি সমঝোতা?
দীর্ঘ সময়ের জন্য বুঝলাম না কেন দুই র্যান্ডম ভেরিয়েবল "সমষ্টি" হয় তাদের সংবর্তন , যেহেতু মিশ্রণ ঘনত্ব ফাংশন সমষ্টি f(x)f(x)f(x) এবং g(x)g(x)g(x) হয় pf(x)+(1−p)g(x)pf(x)+(1−p)g(x)p\,f(x)+(1-p)g(x); পাটিগণিত যোগফল এবং না তাদের সমঝোতা। "দুটি এলোমেলো ভেরিয়েবলের যোগফল" এর সঠিক বাক্যটি গুগলে ১৪ 14,০০০ বার প্রদর্শিত হয়েছে এবং নিম্নরূপে উপবৃত্তাকার। যদি কোনও আরভিটিকে একটি …

2
সময় সিরিজের ডেটা দিয়ে আপনি কীভাবে বুটস্ট্র্যাপিং করবেন?
আমি সম্প্রতি অনুমানকারীদের জন্য স্ট্যান্ডার্ড ত্রুটি এবং আত্মবিশ্বাসের অন্তরগুলি গণনা করতে বুটস্ট্র্যাপিং কৌশলগুলি ব্যবহার সম্পর্কে শিখেছি। আমি যা শিখেছি তা হ'ল যদি ডেটা আইআইডি হয় তবে আপনি নমুনা ডেটাটিকে জনসংখ্যা হিসাবে বিবেচনা করতে পারেন এবং প্রতিস্থাপনের সাথে নমুনা করতে পারেন এবং এটি আপনাকে পরীক্ষার পরিসংখ্যানের একাধিক সিমুলেশন পেতে অনুমতি দেবে। …

7
স্বাভাবিকতা কী?
বিভিন্ন বিভিন্ন পরিসংখ্যান পদ্ধতিতে একটি "স্বাভাবিকতার অনুমান" রয়েছে। "নরমালটি" কী এবং আমি কীভাবে জানব যদি স্বাভাবিকতা থাকে?

7
পরিবর্তনের সহগ কীভাবে ব্যাখ্যা করবেন?
আমি পরিবর্তনের সহগ বোঝার চেষ্টা করছি । আমি যখন নিম্নলিখিত দুটি নমুনায় এটি প্রয়োগ করার চেষ্টা করি তখন আমি ফলাফলগুলি কীভাবে ব্যাখ্যা করতে পারি তা বুঝতে অক্ষম। ধরা যাক নমুনা 1 হ'ল এবং নমুনা 2 হ'ল 10 , 15 , 17 , 22 , 21 , 27 । এখানে নমুনা …

1
যদি আমি একটি এলোমেলো প্রতিসাম্য ম্যাট্রিক্স উত্পন্ন করি তবে এটি ইতিবাচক নিশ্চিত হওয়ার কী সুযোগ আছে?
যখন আমি কিছু উত্তল অপ্টিমাইজেশান পরীক্ষা করছিলাম তখন আমি একটি অদ্ভুত প্রশ্ন পেয়েছি। প্রশ্ন হচ্ছে: ধরুন আমি এলোমেলোভাবে (স্ট্যান্ডার্ড সাধারণ বিতরণ বলি) একটি সিমেট্রিক ম্যাট্রিক্স উত্পন্ন করি, (উদাহরণস্বরূপ, আমি উচ্চতর ত্রিভুজাকৃতির ম্যাট্রিক্স উত্পন্ন করি, এবং এটি প্রতিসাম্য কিনা তা নিশ্চিত করার জন্য নীচের অর্ধেকটি পূরণ করি), এটি সম্ভাবনা কতটা সম্ভব …

8
আমার প্রথমে বায়েশিয়ান বা ঘন ঘন পরিসংখ্যান শেখানো উচিত?
আমি আমার ছেলেদের, বর্তমানে উচ্চ বিদ্যালয়ে, পরিসংখ্যান বোঝার জন্য সাহায্য করছি এবং আমি তত্ত্বের কিছু ঝলক উপেক্ষা না করে কিছু সহজ উদাহরণ দিয়ে শুরু করার বিষয়ে বিবেচনা করছি। আমার লক্ষ্য হ'ল তাদের পরিসংখ্যান এবং পরিমাণগত শিক্ষার দিকে আরও আগ্রহী হওয়ার জন্য তাদের আগ্রহকে উত্সাহিত করার জন্য, স্ক্র্যাচ থেকে পরিসংখ্যানগুলি শিখতে …

6
কেন্দ্রীয় সীমাবদ্ধতা উপপাদ্যটি ধারণ করে না এমন কোনও উদাহরণ রয়েছে কি?
উইকিপিডিয়া বলেছে - সম্ভাব্যতা তত্ত্বে, কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য (সিএলটি) প্রতিষ্ঠিত করে যে, বেশিরভাগ পরিস্থিতিতে যখন স্বতন্ত্র র্যান্ডম ভেরিয়েবলগুলি যুক্ত করা হয় , তখন তাদের সঠিকভাবে স্বাভাবিক অঙ্কটি একটি সাধারণ বিতরণ (অনানুষ্ঠানিকভাবে একটি "বেল কার্ভ") দিকে ঝোঁক দেয় এমনকি মূল ভেরিয়েবলগুলি না হলেও themselves সাধারণভাবে বন্টনকৃত... যখন এটি "বেশিরভাগ পরিস্থিতিতে" বলে …

2
জের্গেন শ্মিধুবার দ্বারা উত্পাদিত অ্যাডভারসিয়াল নেটওয়ার্কগুলি চালু করা হয়েছিল?
আমি https://en.wikedia.org/wiki/Generative_adversarial_networks এ পড়েছি : [জেনারেটর অ্যাডভারসিয়াল নেটওয়ার্ক] 2014 সালে ইয়ান গুডফেলো এট আল দ্বারা প্রবর্তিত হয়েছিল। কিন্তু জার্গেন Schmidhuber দাবি অনুরূপ কাজ যে দিক আগে সম্পাদিত হয়েছে (যেমন, সেখানে সৃজক adversarial নেটওয়ার্ক সময় nips 2016 কিছু বিতর্ক ছিল টিউটোরিয়াল: https://channel9.msdn.com/Events/Neural-Information-Processing-Systems- সম্মেলন / নিউরাল-ইনফরমেশন-প্রসেসিং-সিস্টেমস-কনফারেন্স-এনআইপিএস -2016 / জেনারেটিভ-অ্যাডভারসিয়াল-নেটওয়ার্কগুলি দেখুন 1h03 মিনিট)। …

3
বড় গবেষণায় ক্ষুদ্র প্রভাবগুলি কেন প্রকাশনা পক্ষপাতিত্ব নির্দেশ করে?
বেশ কয়েকটি পদ্ধতিগত কাগজপত্র (উদাঃ এগার এট আল 1997a, 1997 বি) মেটা-বিশ্লেষণ দ্বারা প্রকাশিত প্রকাশনার পক্ষপাত নিয়ে আলোচনা করে নীচের মত একটি ফানেল প্লট ব্যবহার করে। ১৯৯৯ বি গবেষণাপত্রে আরও বলা হয়েছে যে "যদি প্রকাশনা পক্ষপাত উপস্থিত থাকে তবে প্রত্যাশিত যে প্রকাশিত গবেষণার মধ্যে সবচেয়ে বড়গুলি ক্ষুদ্রতম প্রভাবগুলির প্রতিবেদন করবে।" …

3
মৌলিক হাইপোথিসিস টেস্টিং কেন মধ্যের দিকে মনোযোগ দেয় না এবং কেন?
প্রাথমিক আন্ডার-গ্রেড পরিসংখ্যান কোর্সে শিক্ষার্থীরা একটি জনসংখ্যার গড় জন্য অনুমানের পরীক্ষা শেখানো হয় (সাধারণত?) কেন এটি কেন কেন্দ্রীকরণের দিকে মনোযোগ কেন্দ্রীভূত হয় না? আমার অনুমান যে কেন্দ্রীয় সীমাবদ্ধ উপপাদ্যের কারণে গড়টি পরীক্ষা করা আরও সহজ তবে আমি কিছু শিক্ষিত ব্যাখ্যা পড়তে চাই।

5
কিছু লোক কেন অনুপস্থিত মানগুলি প্রতিস্থাপন করতে -999 বা -9999 ব্যবহার করেন?
আমার একটি ডেটাসেট আছে প্রচুর মূল্যবোধ নেই। কিছু কলামের জন্য, অনুপস্থিত মান -৯৯৯ দ্বারা প্রতিস্থাপিত হয়েছিল, তবে অন্যান্য কলামগুলিতে, অনুপস্থিত মানটিকে 'এনএ' হিসাবে চিহ্নিত করা হয়েছিল। কেন আমরা অনুপস্থিত মানটি প্রতিস্থাপন করতে -999 ব্যবহার করব?

3
পি-মান একটি পয়েন্ট অনুমান?
যেহেতু কেউ পি-মানগুলির জন্য আত্মবিশ্বাসের অন্তরগুলি গণনা করতে পারে এবং যেহেতু বিরতি অনুমানের বিপরীতটি বিন্দু অনুমান: পি-মানটি কোনও বিন্দুর অনুমান হয়?

2
এন্ট্রপি আমাদের কী বলে?
আমি এন্ট্রপির বিষয়ে পড়ছি এবং ধারাবাহিক ক্ষেত্রে এর অর্থ কী তা ধারণা করে নেওয়ার জন্য খুব কঠিন সময় পার করছি। উইকি পৃষ্ঠাতে নিম্নলিখিতটি উল্লেখ করা হয়েছে: ইভেন্টগুলির সম্ভাব্যতা বন্টন, প্রতিটি ইভেন্টের তথ্য পরিমাণের সাথে মিলিয়ে একটি এলোমেলো ভেরিয়েবল গঠন করে যার প্রত্যাশিত মান এই বন্টন দ্বারা উত্পন্ন তথ্যগুলির গড় পরিমাণ …
32 entropy 

7
কেন সিএসভি ফাইলগুলিতে কমা একটি খারাপ রেকর্ড বিভাজক / ডিলিমিটার?
আমি এই নিবন্ধটি পড়ছিলাম এবং আমি এই প্রশ্নের সঠিক উত্তরের জন্য আগ্রহী। আমার মনে যে বিষয়টি আসে কেবল এটিই সম্ভবত যে কয়েকটি দেশে দশমিক বিভাজক একটি কমা এবং সিএসভিতে ডেটা ভাগ করার সময় সমস্যা হতে পারে তবে আমি আমার উত্তর সম্পর্কে সত্যই নিশ্চিত নই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.