পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

8
'বড় ডেটা'র সময়ে স্যাম্পলিং কি প্রাসঙ্গিক?
বা আরও কিছু "তাই হবে"? বিগ ডেটা পরিসংখ্যান এবং প্রাসঙ্গিক জ্ঞানকে আরও গুরুত্বপূর্ণ করে তোলে তবে স্যাম্পলিং থিওরিটিকে আন্ডারপ্লে করে বলে মনে হয়। আমি 'বিগ ডেটা' এর আশেপাশে এই হাইপ দেখেছি এবং ভাবতে পারি না যে "কেন" আমি সবকিছু বিশ্লেষণ করতে চাই ? "স্যাম্পলিং থিওরি" ডিজাইন / প্রয়োগ / আবিষ্কার …

5
নমুনা মিডিয়ানদের জন্য কেন্দ্রীয় সীমাবদ্ধ উপপাদ্য
যদি আমি একই বন্টন থেকে অঙ্কিত পর্যাপ্ত পরিমাণে পর্যবেক্ষণের মাঝারিটি গণনা করি, তবে কেন্দ্রীয় সীমাবদ্ধতাটি কি মধ্যযুগীয়দের বন্টনকে প্রায় কোনও সাধারণ বন্টনকে আনুমানিক বলবে? আমার বোধগম্যতা যে প্রচুর পরিমাণে নমুনার মাধ্যমের সাথে এটি সত্য, তবে এটি মেডিয়ানদের ক্ষেত্রেও সত্য? যদি তা না হয়, স্যাম্পল মিডিয়ানদের অন্তর্নিহিত বিতরণ কী?

9
লিনিয়ার বীজগণিতের জন্য রেফারেন্স বই পরিসংখ্যানের জন্য প্রয়োগ করা হয়?
আমি কিছুটা সময়ের জন্য আরে কাজ করছি এবং পিসিএ, এসভিডি, কিউআর পচন এবং এ জাতীয় অনেক লিনিয়ার বীজগণিতের ফলাফলগুলির সাথে মুখোমুখি হয়েছি (যখন ভারী রেজিস্ট্রেশনগুলি অনুমান করার সময় এবং এরকম পরীক্ষা করা হয়) তাই আমি জানতে চেয়েছিলাম যে কারওর জন্য কোনও সুপারিশ আছে কিনা? বিস্তৃত লিনিয়ার বীজগণিত গ্রন্থ যা খুব …

10
ক্লাস্টারের সঠিক সংখ্যা সম্পর্কে কীভাবে সিদ্ধান্ত নেবেন?
আমরা ক্লাস্টার কেন্দ্রগুলি খুঁজে পাই এবং কে-মানে ক্লাস্টারিংয়ে কে বিভিন্ন ক্লাস্টার বিনগুলিতে পয়েন্টগুলি অর্পণ করি যা একটি খুব সুপরিচিত অ্যালগরিদম এবং নেটটিতে প্রায় প্রতিটি মেশিন লার্নিং প্যাকেজে পাওয়া যায়। তবে আমার মতে অনুপস্থিত এবং সবচেয়ে গুরুত্বপূর্ণ অংশটি হ'ল একটি সঠিক কে। এটির জন্য সর্বোত্তম মান কী? এবং, সর্বোত্তম বলতে কী …

2
এই পোস্ট পোস্টের আগে আমাদের কি বিশ্বব্যাপী পরীক্ষা দরকার?
আমি প্রায়শই শুনি যে কোনও আনোভা পরে পোস্ট হকের পরীক্ষাগুলি কেবল তখনই ব্যবহার করা যেতে পারে যদি আনোভা নিজেই তাৎপর্যপূর্ণ ছিল। তবে, এই পোস্টের পরীক্ষাগুলি গ্লোবাল টাইপ আই ত্রুটির হারকে 5% রাখার জন্য ভ্যালুগুলি সামঞ্জস্য করে , তাই না?ppp তাহলে আমাদের প্রথম বিশ্বব্যাপী পরীক্ষা কেন দরকার? আমাদের যদি বিশ্বব্যাপী পরীক্ষার …


5
একাধিক তুলনায় একাধিক রিগ্রেশনে পি-মানগুলি সামঞ্জস্য করা কি ভাল ধারণা?
ধরে নেওয়া যাক আপনি কোনও সামাজিক বিজ্ঞান গবেষক / একনোমেট্রিকিয়ান কোনও পরিষেবার জন্য চাহিদার প্রাসঙ্গিক ভবিষ্যদ্বাণী খুঁজে পাওয়ার চেষ্টা করছেন Le আপনার কাছে চাহিদা অনুসারে বর্ণিত দুটি ফলাফল / নির্ভরশীল ভেরিয়েবল রয়েছে (হ্যাঁ / না পরিষেবা এবং অনুষ্ঠানের সংখ্যাটি ব্যবহার করে)। আপনার কাছে 10 ভবিষ্যদ্বাণী / স্বতন্ত্র ভেরিয়েবল রয়েছে যা …

6
গণিতবিদদের জন্য পরিসংখ্যানের ভূমিকা
যে গণিতবিদ ইতিমধ্যে সম্ভাব্যতার বিষয়ে পারদর্শী তার পরিসংখ্যানগুলির একটি ভাল ভূমিকা কী? জিজ্ঞাসা করার জন্য আমার দুটি স্বতন্ত্র প্রেরণা রয়েছে, যা বিভিন্ন পরামর্শকে ভালভাবে পরিচালিত করতে পারে: আমি সম্ভাব্যবিদদের দ্বারা বিবেচিত অনেক সমস্যার পিছনে পরিসংখ্যান প্রেরণাকে আরও ভালভাবে বুঝতে চাই। আমি মন্টি কার্লো সিমুলেশনগুলির ফলাফলগুলির কীভাবে আরও ভালভাবে ব্যাখ্যা করতে …
54 references 

7
বিশাল সংখ্যক বৈশিষ্ট্যগুলির জন্য সেরা পিসিএ অ্যালগরিদম (> 10 কে)?
আমি এটি স্ট্যাকওভারফ্লোতে জিজ্ঞাসা করেছি, তবে এটি এসও-তে কোনও উত্তর না পেলে এটি এখানে আরও উপযুক্ত হতে পারে বলে মনে হয়। এটি পরিসংখ্যান এবং প্রোগ্রামিংয়ের ছেদ এ এক ধরণের। আমার পিসিএ করার জন্য কিছু কোড লিখতে হবে (প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস)। আমি বিখ্যাত আলগোরিদিম মাধ্যমে ব্রাউজ এবং বাস্তবায়িত করেছি এই এক …

19
গাণিতিক পরিসংখ্যান ভিডিও
একটি প্রশ্ন আগে গণিতের পরিসংখ্যান সম্পর্কিত পাঠ্যপুস্তকের জন্য সুপারিশ চেয়েছিল কারো কাছে কি কোন ভাল অনলাইন জানি না ভিডিও লেকচার উপর গাণিতিক পরিসংখ্যান ? আমি যে নিকটতম সন্ধান করেছি তা হ'ল: মেশিন লার্নিং অর্থনীতি আপডেট: নীচে উল্লিখিত বেশ কয়েকটি পরামর্শ হ'ল ভাল পরিসংখ্যান -১১১ ধরণের ভিডিও। তবে আমি বিশেষভাবে ভাবছি …

3
নিউরাল নেটওয়ার্ক বনাম মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন?
দেখে মনে হয় যে কিছু ক্ষেত্রে মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন সহ নিউরাল নেটওয়ার্কের সাথে একই রকম ফলাফল পাওয়া সম্ভব এবং মাল্টিভারিয়েট লিনিয়ার রিগ্রেশন অত্যন্ত দ্রুত এবং সহজ। কোন পরিস্থিতিতে নিউরাল নেটওয়ার্কগুলি মাল্টিভারিয়েট লিনিয়ার রিগ্রেশনের চেয়ে ভাল ফলাফল দিতে পারে?

5
জ্যামিতিক সমস্যা (দূরত্ব সহ) থেকে পিসিএ কীভাবে রৈখিক বীজগণিত সমস্যায় পরিণত হয় (ইগেনভেেক্টরগুলির সাথে) তার একটি স্বজ্ঞাত ব্যাখ্যা কী?
আমি বিভিন্ন টিউটোরিয়াল এবং প্রশ্ন (যেমন সহ পিসিএ সম্পর্কে অনেক, পড়েছি এই এক , এই এক , এই এক , এবং এই এক )। পিসিএ যে জ্যামিতিক সমস্যাটি অপ্টিমাইজ করার চেষ্টা করছে তা আমার কাছে স্পষ্ট: পিসিএ পুনর্নির্মাণের (প্রক্ষেপণ) ত্রুটিটি হ্রাস করে প্রথম প্রধান উপাদানটি অনুসন্ধান করার চেষ্টা করে, যা …

10
হোল্ড আউট বৈধকরণ বনাম ক্রস-বৈধতা
আমার কাছে মনে হয় হোল্ড-আউট বৈধতা অকেজো। অর্থাত, মূল ডেটাसेटকে দুটি ভাগে ভাগ করা (প্রশিক্ষণ ও পরীক্ষা) এবং পরীক্ষার স্কোরকে সাধারণীকরণের ব্যবস্থা হিসাবে ব্যবহার করা কিছুটা অকেজো। কে-ভাঁজ ক্রস-বৈধকরণ সাধারণীকরণের আরও ভাল অনুমান দেয় (যেমন এটি প্রতিটি পয়েন্টে প্রশিক্ষণ দেয় এবং পরীক্ষা করে তোলে)। সুতরাং, আমরা কেন স্ট্যান্ডার্ড হোল্ড-আউট বৈধতা …

4
স্বৈরশাসন এবং স্বাধীনতা?
আমি আমার পাঠ্যপুস্তক থেকে পড়েছি যে এক্স এবং ওয়াই স্বতন্ত্র হওয়ার গ্যারান্টি দেয় না। তবে তারা যদি স্বতন্ত্র থাকে তবে তাদের ovকতাকে অবশ্যই 0 হতে হবে any কেউ একটি সরবরাহ করতে পারে?cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0

5
পরিসংখ্যানগত শিক্ষায় আইআইডি অনুমানের গুরুত্ব সম্পর্কে
পরিসংখ্যান শেখার সালে পরোক্ষভাবে বা স্পষ্টভাবে, এক সবসময় ধরে নেয় যে ট্রেনিং সেট D={X,y}D={X,y}\mathcal{D} = \{ \bf {X}, \bf{y} \} গঠিত হয় NএনN ইনপুট / প্রতিক্রিয়া tuples (Xi,yi)(Xi,yi)({\bf{X}}_i,y_i) যে স্বাধীনভাবে একই যৌথ বন্টন থেকে টানা P(X,y)P(X,y)\mathbb{P}({\bf{X}},y) সাথে p(X,y)=p(y|X)p(X)p(X,y)=p(y|এক্স)পি(এক্স) p({\bf{X}},y) = p( y \vert {\bf{X}}) p({\bf{X}}) এবং p(y|X)পি(Y|এক্স)p( y \vert {\bf{X}}) …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.