পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

17
মেশিন লার্নিং কুকবুক / রেফারেন্স কার্ড / চিটশিট?
আমি সম্ভাব্যতা এবং পরিসংখ্যান কুকবুক এবং ডেটা মাইনিংয়ের জন্য রেফারেন্স কার্ডের মতো সংস্থানগুলি অবিশ্বাস্যভাবে দরকারী বলে খুঁজে পাই । তারা স্পষ্টতই রেফারেন্স হিসাবে ভাল পরিবেশন করে তবে একটি বিষয়ে আমার চিন্তাভাবনাগুলি সংগঠিত করতে এবং জমির লেওটি পেতে আমাকে সহায়তা করে। প্রশ্ন: মেশিন লার্নিং পদ্ধতির জন্য কি এই সংস্থানগুলির মতো কিছু …

8
ধারাবাহিক তথ্যটিকে অবিচ্ছিন্ন হিসাবে গণ্য করা কি কখনও বুদ্ধিযুক্ত?
পৃথক এবং অবিচ্ছিন্ন ডেটা সম্পর্কে এই প্রশ্নের উত্তর দেওয়ার জন্য আমি গম্ভীরভাবে দৃserted়ভাবে জানিয়েছিলাম যে বিভাগগত তথ্যটিকে ধারাবাহিক হিসাবে গণ্য করা খুব কমই বোধগম্য। এটির মুখটি যা স্বতঃস্ফূর্ত বলে মনে হয় তবে স্বজ্ঞাততা প্রায়শই পরিসংখ্যানগুলির জন্য একটি দুর্বল গাইড বা কমপক্ষে আমার mine তাই এখন আমি ভাবছি: এটা কি সত্য? …

2
বেয়েস রিগ্রেশন: স্ট্যান্ডার্ড রিগ্রেশন এর তুলনায় এটি কীভাবে হয়?
বায়সিয়ান রিগ্রেশন সম্পর্কে আমি কিছু প্রশ্ন পেয়েছি: হিসাবে একটি মানক রিগ্রেশন দেওয়া হয়েছে । যদি আমি এটিকে কোনও বায়েশিয়ান রিগ্রেশনে পরিবর্তন করতে চাই তবে আমার কি এবং উভয়ের জন্য পূর্ব বিতরণ দরকার (বা এটি এভাবে কাজ করে না)?y=β0+β1x+εy=β0+β1x+εy = \beta_0 + \beta_1 x + \varepsilonβ0β0\beta_0β1β1\beta_1 স্ট্যান্ডার্ড রিগ্রেশন-এ এবং একক মান …

10
প্রশিক্ষণের ত্রুটির চেয়ে বৈধতা ত্রুটি কম?
আমি এই সমস্যাটি সম্পর্কে এখানে এবং এখানে দুটি প্রশ্ন পেয়েছি তবে এখনও পর্যন্ত এর সুস্পষ্ট উত্তর বা ব্যাখ্যা নেই I আমি একই সমস্যাটি কার্যকর করি যেখানে আমার কনভোলিউশন নিউরাল নেটওয়ার্কের প্রশিক্ষণের ত্রুটির চেয়ে বৈধতা ত্রুটি কম। ওটার মানে কি?

3
লগ আইশ কখন উপযুক্ত?
আমি পড়েছি যে টাইম সিরিজের চার্টে y- অক্ষের মতো নির্দিষ্ট পরিস্থিতিতে যেমন লেখচিত্র / গ্রাফিংয়ের জন্য লগ স্কেল ব্যবহার করা উপযুক্ত। যাইহোক, আমি কেন এটি ক্ষেত্রে, বা কখন এটি উপযুক্ত হবে সে সম্পর্কে একটি নির্দিষ্ট ব্যাখ্যা খুঁজে পাইনি। দয়া করে মনে রাখবেন, আমি কোনও পরিসংখ্যানবিদ নই তাই আমি পয়েন্টটি পুরোপুরি …

3
কেন নমুনা স্ট্যান্ডার্ড বিচ্যুতি
স্ট্যান্ডার্ড বিচ্যুতি সম্পর্কে নিরপেক্ষ অনুমান সম্পর্কিত উইকিপিডিয়া নিবন্ধ অনুসারে নমুনা এসডি s = 1n - 1Σi = 1এন( এক্সআমি- এক্স¯¯¯)2---------------√s=1n−1∑i=1n(xi−x¯)2s = \sqrt{\frac{1}{n-1} \sum_{i=1}^n (x_i - \overline{x})^2} জনসংখ্যার এসডির পক্ষপাতদুষ্ট অনুমানকারী। এতে বলা হয়েছে যে ।ই( গুলি)2--√) ≠ ই( গুলি)2)-----√E(s2)≠E(s2)E(\sqrt{s^2}) \neq \sqrt{E(s^2)} বিশেষ দ্রষ্টব্য। র্যান্ডম ভেরিয়েবলগুলি স্বতন্ত্র এবং প্রতিটি এক্সআমি। এন( …

7
শিল্প বনাম কাগল চ্যালেঞ্জ। অভিনব মডেলিংয়ের চেয়ে আরও বেশি পর্যবেক্ষণ সংগ্রহ করা এবং আরও ভেরিয়েবলের অ্যাক্সেস পাওয়া কি আরও গুরুত্বপূর্ণ?
আমি আশা করি শিরোনামটি স্বতঃস্ফূর্ত। কেগল-এ, বেশিরভাগ বিজয়ীরা মাঝে মাঝে শত শত বেস মডেলগুলির সাথে স্ট্যাকিং ব্যবহার করেন, এমএসইর কয়েকটি অতিরিক্ত% নিখুঁত করে নিন, যথার্থতা ... সাধারণভাবে, আপনার অভিজ্ঞতা হিসাবে, স্ট্যাকিং বনাম কেবল আরও ডেটা এবং আরও বৈশিষ্ট্য সংগ্রহ করার মতো অভিনব মডেলিং কতটা গুরুত্বপূর্ণ? তথ্য জন্য?

9
"গাড়ী দুর্ঘটনার ফলে ৮০ জনের মধ্যে ১ জন মারা যায়" এটিকে আবার ভুল বলা কি "কার দুর্ঘটনার ফলে ৮০ জনের মধ্যে ১ জন মারা যায়?"
বিবৃতি ওয়ান (এস 1): "গাড়ি দুর্ঘটনার কারণে ৮০ জনের মধ্যে একজনের মৃত্যু হয়" " বিবৃতি দুটি (এস 2): "গাড়ি দুর্ঘটনার ফলে ৮০ জনের মধ্যে একজন মারা যায়।" এখন, আমি ব্যক্তিগতভাবে এই দুটি বক্তব্যের মধ্যে খুব বেশি পার্থক্য দেখছি না। লেখার সময়, আমি তাদের একটি শ্রোতা শ্রোতার কাছে বিনিময়যোগ্য বিবেচনা করব। …

4
পিসিএ এবং অটোরকোডারের মধ্যে পার্থক্য কী?
পিসিএ এবং অটোরকোডার উভয়ই ডিমেনশন হ্রাস করতে পারে, তবে তাদের মধ্যে পার্থক্য কী? কোন পরিস্থিতিতে আমার একে অপরের ব্যবহার করা উচিত?

6
এল 2 নিয়মিতকরণ গাউসিয়ান পূর্বের সমতুল্য
আমি এটি পড়তে থাকি এবং স্বজ্ঞাতভাবে আমি এটি দেখতে পারি তবে এল 2 নিয়মিতকরণ থেকে কেউ কীভাবে বলতে পারেন যে এটি বিশ্লেষণাত্মকভাবে গাউসিয়ান প্রাইমার? একইভাবে এল 1 বলার আগে ল্যাপলেশনের সমান। পরবর্তী কোনও রেফারেন্স দুর্দান্ত হবে।

1
আর-এ লজিস্টিক রিগ্রেশনের ফলে নিখুঁত বিচ্ছেদ ঘটে (হ্যাক-ডোনার ঘটনা)। এখন কি?
আমি 50 ধারাবাহিক ব্যাখ্যামূলক ভেরিয়েবলগুলি ব্যবহার করে বাইনারি ফলাফলের পূর্বাভাস দেওয়ার চেষ্টা করছি (বেশিরভাগ ভেরিয়েবলের পরিসীমা to )আমার ডেটা সেটটিতে প্রায় 24,000 সারি রয়েছে। আমি যখন আর তে চালাই , তখন আমি পাই:−∞−∞-\infty∞∞\inftyglm Warning messages: 1: glm.fit: algorithm did not converge 2: glm.fit: fitted probabilities numerically 0 or 1 occurred …

6
ফিশার এবং নেইমন-পিয়ারসনের মধ্যে "হাইব্রিড" কি আসলেই পরিসংখ্যান পরীক্ষার দিকে যাচ্ছে?
একটি নির্দিষ্ট বিদ্যালয় রয়েছে যা অনুসারে পরিসংখ্যান পরীক্ষার সর্বাধিক বিস্তৃত পদ্ধতির দুটি পদ্ধতির মধ্যে একটি "সংকর": ফিশার এবং নেইমন-পিয়ারসনের; এই দুটি পন্থা, দাবিটি হিসাবে যায়, "বেমানান" এবং ফলস্বরূপ "সংকর" একটি "অন্তর্নিহিত মিশম্যাশ"। আমি নীচে একটি গ্রন্থপঞ্জি এবং কিছু উদ্ধৃতি সরবরাহ করব, তবে এখনই বলা বাহুল্য যে স্ট্যাটিস্টিকাল হাইপোথিসিস পরীক্ষার উইকিপিডিয়া …

4
95% আত্মবিশ্বাসের ব্যবধানের মধ্যে কি সমস্ত মান সমানভাবে সম্ভব?
আমি এই প্রশ্নের মতবিরোধমূলক তথ্য পেয়েছি: " যদি কোনও মাধ্যমে কোনও পার্থক্য বা অনুপাতের পার্থক্যের একটি 95% আত্মবিশ্বাস অন্তর্বর্তী (সিআই) তৈরি করে, তবে সিআইয়ের মধ্যে সমস্ত মান কি সমানভাবে সম্ভব? বা, বিন্দুটি অনুমান করা সবচেয়ে সম্ভবত , সিআই এর "লেজ" কাছাকাছি মানগুলি সিআই এর মাঝখানে অবস্থার চেয়ে কম সম্ভাবনা আছে? …

8
গভীর শিক্ষার জন্য গ্রন্থাগারগুলি
আমি ভাবছিলাম যে নিউরাল নেটওয়ার্কগুলি গভীর শেখার জন্য সেখানে কোনও ভাল আর লাইব্রেরি আছে কিনা? আমি সেখানে জানি nnet, neuralnetএবং RSNNS, কিন্তু এই কেউই গভীর শেখার পদ্ধতি বাস্তবায়ন বলে মনে হচ্ছে। আমি বিশেষত তদারকি করা শেখার পরে নিরীক্ষণ করা এবং সহ-অভিযোজন রোধে ড্রপআউট ব্যবহার করে বিশেষত আগ্রহী । / সম্পাদনা: …

9
কিভাবে একটি lme4 মিশ্র মডেল একটি প্রভাব এর p- মান (তাত্পর্য পরীক্ষা) পাবেন?
আমি মিশ্রিত মডেল ফিট করতে আর তে lme4 ব্যবহার করি lmer(value~status+(1|experiment))) যেখানে মান অবিচ্ছিন্ন থাকে, স্থিতি এবং পরীক্ষা ফ্যাক্টর এবং আমি পাই Linear mixed model fit by REML Formula: value ~ status + (1 | experiment) AIC BIC logLik deviance REMLdev 29.1 46.98 -9.548 5.911 19.1 Random effects: Groups Name …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.