পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

14
জেনেরিক সময় সিরিজের অনলাইন আউটলেট সনাক্তকরণের জন্য সাধারণ অ্যালগরিদম
আমি প্রচুর সময়ের সিরিজ নিয়ে কাজ করছি। এই সময়ের সিরিজটি মূলত প্রতি 10 মিনিটে আসে নেটওয়ার্ক পরিমাপ এবং এর মধ্যে কিছুগুলি পর্যায়ক্রমিক (যেমন ব্যান্ডউইথ) হয়, অন্যদিকে কিছু থাকে না (যেমন রাউটিং ট্র্যাফিকের পরিমাণ)। একটি অনলাইন "আউটলেট সনাক্তকরণ" করার জন্য আমি একটি সাধারণ অ্যালগরিদম চাই। মূলত, আমি প্রতিটি সময়ের সিরিজের পুরো …

30
টাইপ আই এবং টাইপ II ত্রুটির সংজ্ঞাগুলি মনে রাখার কোনও উপায় আছে?
আমি শিক্ষার দ্বারা পরিসংখ্যানবিদ নই, আমি একজন সফটওয়্যার ইঞ্জিনিয়ার। তবুও পরিসংখ্যান অনেক আসে। প্রকৃতপক্ষে, টাইপ আই এবং টাইপ II ত্রুটি সম্পর্কে বিশেষত প্রশ্নপত্রগুলি প্রত্যয়িত সফ্টওয়্যার ডেভলপমেন্ট অ্যাসোসিয়েট পরীক্ষার জন্য আমার অধ্যয়নকালীন সময়ে প্রচুর পরিমাণে উপস্থিত হচ্ছে (গণিত এবং পরিসংখ্যান পরীক্ষার 10%)। আমি প্রথম টাইপ এবং টাইপ II ত্রুটির জন্য সঠিক …

2
Lme4 এ কনভার্জেন্স সতর্কতা সম্পর্কে আমাদের কতটা ভয় পাওয়া উচিত
যদি আমরা একটি গ্লোমারের উপযোগী হয়ে উঠি তবে আমরা একটি সতর্কতা পেতে পারি যা আমাদের জানিয়েছে যে মডেলটি রূপান্তরিত করতে খুব কঠিন সময় খুঁজে নিচ্ছে ... উদাহরণস্বরূপ >Warning message: In checkConv(attr(opt, "derivs"), opt$par, ctrl = control$checkConv, : Model failed to converge with max|grad| = 0.00389462 (tol = 0.001) @ বেন …

3
র‌্যাঙ্কের ঘাটতি কী এবং কীভাবে এটি মোকাবেলা করতে হবে?
Lme4 ব্যবহার করে একটি লজিস্টিক রিগ্রেশন ফিটিংয়ের সাথে শেষ হয় Error in mer_finalize(ans) : Downdated X'X is not positive definite. এই ত্রুটির সম্ভাব্য কারণ সম্ভবত র‍্যাঙ্কের ঘাটতি। র‌্যাঙ্কের ঘাটতি কী এবং আমি কীভাবে এটি সমাধান করব?
87 r  logistic  lme4-nlme 

5
কে-মানে এবং কে-নিকটতম প্রতিবেশীদের মধ্যে প্রধান পার্থক্যগুলি কী?
আমি জানি যে কে-উপায়গুলি নিরীক্ষণযোগ্য এবং এটি ক্লাস্টারিং ইত্যাদির জন্য ব্যবহৃত হয় এবং কে-এনএন তদারকি করা হয়। তবে আমি জানতে চেয়েছিলাম দুজনের মধ্যে কড়া পার্থক্য?

2
এই দিনগুলিতে কম্পিউটারের শক্তি দেওয়া, ফিশারের নির্ভুল পরীক্ষার চেয়ে চি-স্কোয়ার্ড পরীক্ষা করার কি কোনও কারণ আছে?
সফটওয়্যারটি আজকাল এত সহজেই ফিশারের নির্ভুল পরীক্ষার গণনা করতে পারে এমনটি দেওয়া হলেও, এমন কোনও পরিস্থিতি আছে যেখানে, তাত্ত্বিকভাবে বা ব্যবহারিকভাবে, চি-স্কোয়ার্ড পরীক্ষাটি আসলে ফিশারের সঠিক পরীক্ষার চেয়ে বেশি পছন্দনীয়? ফিশারের সঠিক পরীক্ষার সুবিধার মধ্যে রয়েছে: 2x2 এর চেয়ে বড় কন্টিজেন্সি টেবিলগুলিতে স্কেলিং (উদাহরণস্বরূপ যে কোনও r x c টেবিল) …

3
একটি "নিষ্পাপ বুটস্ট্র্যাপ" ব্যর্থ হয় যেখানে উদাহরণ কি?
মনে করুন অজানা বা জটিল বিতরণ থেকে আমার কাছে নমুনা ডেটার একটি সেট রয়েছে এবং আমি তথ্যের একটি পরিসংখ্যান কিছুটা অনুমান করতে চাই । আমার ডিফল্ট প্রবণতা শুধু প্রতিস্থাপন সঙ্গে বুটস্ট্র্যাপ নমুনা একটি গুচ্ছ উৎপন্ন এবং আমার পরিসংখ্যাত নিরূপণ করা হয় প্রতিটি বুটস্ট্র্যাপ নমুনার উপর জন্য আনুমানিক বিতরণ তৈরি করতে …

9
স্পষ্টতই, একটি আস্থা অন্তর কি?
আত্মবিশ্বাসের ব্যবধান কী তা আমি মোটামুটি এবং অনানুষ্ঠানিকভাবে জানি। তবে, আমি মনে করতে পারি না যে তার চেয়ে গুরুত্বপূর্ণ একটি বিশদটি আমার মাথা জড়িয়ে আছে: উইকিপিডিয়া অনুসারে: একটি আত্মবিশ্বাসের ব্যবধানটি ভবিষ্যদ্বাণী করে না যে প্যারামিটারের সত্যিকারের মানটি আসলে প্রাপ্ত ডেটা প্রদত্ত আত্মবিশ্বাসের ব্যবধানে থাকার বিশেষ সম্ভাবনা থাকে। আমি এই সাইটে …

9
লিনিয়ার রিগ্রেশনটিতে মাল্টিকোলাইনারিটি সমস্যা হওয়ায় এর কোন অন্তর্নিহিত ব্যাখ্যা আছে?
উইকি সমস্যাগুলি নিয়ে আলোচনা করে যেগুলি যখন বহুবিধ লাইনারি রেজিস্ট্রেশনের একটি সমস্যা হয়ে থাকে arise মূল সমস্যাটি অস্থির প্যারামিটার অনুমানের বহুবিধ লাইনারিটির ফলাফল যা নির্ভরশীল ভেরিয়েবলগুলির উপর স্বতন্ত্র ভেরিয়েবলের প্রভাব মূল্যায়ন করা খুব কঠিন করে তোলে। আমি সমস্যার পিছনে প্রযুক্তিগত কারণগুলি বুঝতে পারি ( , অসুস্থ শর্তযুক্ত ইত্যাদি রূপান্তর করতে …

17
কথোপকথন অন্তর্ভুক্ত তবে কোনও মডেলের প্রধান প্রভাব নয়
মূল প্রভাবগুলি বাদ দিয়ে কোনও মডেলটিতে দ্বিমুখী ইন্টারঅ্যাকশন অন্তর্ভুক্ত করা কি কখনও বৈধ? যদি আপনার হাইপোথিসিসটি কেবল ইন্টারঅ্যাকশন সম্পর্কে হয় তবে কী আপনার এখনও প্রধান প্রভাবগুলি অন্তর্ভুক্ত করতে হবে?

24
"আধুনিক" পরিসংখ্যানগুলির জন্য থাম্বের বিধি
ফিলিপ আই গুড এবং জেমস ডব্লিউ হার্ডিনের স্ট্যাটিস্টিকালাল বিধি সম্পর্কে জি ভ্যান বেলের বই এবং কিছুটা হলেও পরিসংখ্যানের সাধারণ ত্রুটিগুলি (এবং কীভাবে তাদের এড়ানো উচিত) পছন্দ করি। পরীক্ষামূলক এবং পর্যবেক্ষণমূলক গবেষণার ফলাফলগুলির ব্যাখ্যা করার সময় এবং পরিসংখ্যানগত অনুমান, বা অনুসন্ধানের ডেটা বিশ্লেষণের জন্য ব্যবহারিক প্রস্তাবনা সরবরাহ করার সময় এগুলি সাধারণ …

16
কোন অবস্থার অধীনে পারস্পরিক সম্পর্ক কার্যকারিতা বোঝায়?
আমরা সবাই জানি মন্ত্রটি "পারস্পরিক সম্পর্ককে কারণ হিসাবে বোঝায় না" যা প্রথম বছরের সমস্ত পরিসংখ্যান শিক্ষার্থীদের মধ্যে intoোল। ধারণাটি চিত্রিত করার জন্য এখানে কিছু সুন্দর উদাহরণ রয়েছে । কিন্তু কখনো কখনো পারস্পরিক সম্পর্ক আছে করণ পরোক্ষভাবে। নিম্নলিখিত উদাহরণটি এই উইকিপিডিয়া পৃষ্ঠা থেকে নিচ্ছে উদাহরণস্বরূপ, কেউ অভিন্ন যমজদের উপর একটি পরীক্ষা …

4
মিশ্রিত প্রভাবগুলির মডেলগুলির জন্য কীভাবে এনএলএম বা lme4 আর লাইব্রেরি চয়ন করবেন?
আমি কয়েকটি মিশ্র ইফেক্ট মডেল (বিশেষত অনুদৈর্ঘ্য মডেল) ব্যবহার lme4করে ফিট করেছি Rতবে মডেলগুলি এবং তাদের সাথে যে কোডটি চলেছে তা সত্যিই আয়ত্ত করতে চাই। তবে উভয় পায়ে ডুব দিয়ে (এবং কিছু বই কেনার আগে) আমি নিশ্চিত হতে চাই যে আমি সঠিক লাইব্রেরি শিখছি। আমি lme4এখন পর্যন্ত ব্যবহার করেছি কারণ …

8
যদি মাধ্যমটি এত সংবেদনশীল হয় তবে কেন এটি প্রথম স্থানে ব্যবহার করবেন?
এটি একটি পরিচিত সত্য যে মিডিয়ান বিদেশিদের প্রতিরোধী। যদি এটি হয় তবে আমরা কখন এবং কেন প্রথম স্থানে অর্থটি ব্যবহার করব? আমি যে বিষয়টি সম্ভবত ভাবতে পারি তা হ'ল বিদেশীদের উপস্থিতি বুঝতে পারা অর্থাত্ যদি মধ্যমা গড় থেকে দূরে থাকে তবে বিতরণটি স্কিউড হয় এবং বহিরাগতদের সাথে কী করা উচিত …

1
সময় সিরিজের পূর্বাভাসে কীভাবে নিউরাল নেটওয়ার্ক প্রয়োগ করবেন?
আমি মেশিন লার্নিংয়ে নতুন, এবং সময় সিরিজের পূর্বাভাসে কীভাবে নিউরাল নেটওয়ার্ক প্রয়োগ করতে পারি তা জানার চেষ্টা করছি। আমি আমার প্রশ্নের সাথে সম্পর্কিত সংস্থান পেয়েছি, তবে আমি এখনও কিছুটা হারিয়েছি বলে মনে হচ্ছে। আমি মনে করি খুব বেশি বিশদ ছাড়াই একটি প্রাথমিক ব্যাখ্যা সাহায্য করবে। ধরা যাক কয়েক বছরের মধ্যে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.