পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
কখন (এবং কেন) আপনার কোনও বিতরণের লগ নেওয়া উচিত (সংখ্যার)?
বলুন আমার কাছে কিছু historicalতিহাসিক ডেটা রয়েছে যেমন, অতীতের শেয়ারের দাম, বিমানের টিকিটের দামের ওঠানামা, সংস্থার অতীতের আর্থিক তথ্য ... এখন কেউ (বা কোনও সূত্র) বরাবর এসে বলে "চলুন বিতরণটির লগটি ব্যবহার করি / ব্যবহার করি" এবং এখানে আমি কেন যাই ? প্রশ্নাবলী: কেন প্রথমে বিতরণটির লগ নেওয়া উচিত? মূল …

4
কিউকিউ প্লটের ব্যাখ্যা কীভাবে করা যায়
আমি একটি ছোট ডেটাসেট (21 টি পর্যবেক্ষণ) নিয়ে কাজ করছি এবং আর-তে নিম্নলিখিত সাধারণ কিউকিউ প্লট রয়েছে: প্লটটি স্বাভাবিকতা সমর্থন করে না তা দেখে, অন্তর্নিহিত বিতরণ সম্পর্কে আমি কী অনুমান করতে পারি? আমার কাছে মনে হয় যে বিতরণটি ডানদিকে আরও বেশি আঁকানো আরও ভাল ফিট হবে, তাই না? এছাড়াও, আমরা …

9
হঠাৎ টেনেসরের প্রতি মুগ্ধতা কেন?
আমি ইদানীং লক্ষ্য করেছি যে প্রচুর লোকেরা বিভিন্ন পদ্ধতির টেনসর সমতুল্য বিকাশ করছে (টেনসর ফ্যাক্টরিয়েশন, টেনসর কার্নেল, টপিক মডেলিংয়ের টেনার ইত্যাদি) আমি ভাবছি, হঠাৎ কেন টেনেসারে বিশ্ব মুগ্ধ হয়? বিশেষত অবাক হওয়ার মতো সাম্প্রতিক কাগজপত্র / মানক ফলাফল কি এগুলি নিয়ে এসেছে? এটি পূর্বে সন্দেহযুক্ত তুলনায় গণনাগতভাবে অনেক সস্তা? আমি …

3
লসো বনাম রিজ কখন ব্যবহার করা উচিত?
বলুন যে আমি প্রচুর পরিমাণে প্যারামিটার অনুমান করতে চাই এবং আমি তাদের কয়েকটিকে শাস্তি দিতে চাই কারণ আমার বিশ্বাস অন্যদের তুলনায় তাদের খুব কম প্রভাব ফেলতে হবে। কীভাবে পেনালাইজেশন স্কিম ব্যবহার করব তা আমি কীভাবে সিদ্ধান্ত নেব? রিজ রিগ্রেশন কখন বেশি উপযুক্ত? আমি কখন লসো ব্যবহার করব?


8
লিনিয়ার রিগ্রেশন-এ, প্রকৃত মানগুলির পরিবর্তে স্বতন্ত্র ভেরিয়েবলের লগটি ব্যবহার করা কখন উপযুক্ত?
আমি কি প্রশ্নে স্বতন্ত্র ভেরিয়েবলের জন্য আরও ভাল আচরণের বিতরণ খুঁজছি, বা বহিরাগতদের প্রভাব কমাতে বা অন্য কিছু?

8
লজিস্টিক রিগ্রেশন নিখুঁত পৃথকীকরণ মোকাবেলা কিভাবে?
আপনার যদি এমন একটি ভেরিয়েবল থাকে যা শূন্যগুলি এবং টার্গেট ভেরিয়েবলগুলিকে পুরোপুরি পৃথক করে, আর নিম্নলিখিত নীচের "নিখুঁত বা কোটির নিখুঁত বিচ্ছেদ" সতর্কতা বার্তা দেবে: Warning message: glm.fit: fitted probabilities numerically 0 or 1 occurred আমরা এখনও মডেলটি পাই তবে সহগের অনুমানগুলি স্ফীত হয়। বাস্তবে আপনি এটিকে কীভাবে মোকাবিলা করবেন?

21
জুলিয়া কি পরিসংখ্যানগত সম্প্রদায়ের মধ্যে স্টিকিং কোন আশা আছে?
আমি সম্প্রতি আর-ব্লগারদের একটি পোস্ট পড়েছি, যা জন মাইলস হোয়াইটের জুলিয়া নামক একটি নতুন ভাষা সম্পর্কে এই ব্লগ পোস্টের সাথে সংযুক্ত রয়েছে । জুলিয়া একটি সহজ-ইন-টাইম সংকলকের সুবিধা গ্রহণ করে যা এটিকে দ্রুত চালনার সময় দেয় এবং সি / সি ++ (একই ক্রম , সমান দ্রুত নয়) এর গতির পরিমাণের …

3
আর এর ল্যামার চিট শীট
এই ফোরামে বিভিন্ন শ্রেণিবদ্ধ মডেল ব্যবহার করে নির্দিষ্ট করার সঠিক উপায় সম্পর্কে অনেক আলোচনা চলছে lmer। আমি ভেবেছিলাম যে সমস্ত তথ্য এক জায়গায় রাখা ভাল হবে। প্রশ্ন দুটি শুরু করতে: একাধিক স্তর কীভাবে নির্দিষ্ট করা যায়, যেখানে একটি গোষ্ঠী অন্য দলের মধ্যে থাকে: এটি (1|group1:group2)নাকি (1+group1|group2)? মধ্যে পার্থক্য কি (~1 …

3
আরওসি বনাম যথার্থ এবং পুনরুদ্ধার বক্ররেখা
আমি তাদের মধ্যে আনুষ্ঠানিক পার্থক্য বুঝতে পারি, আমি যেটি জানতে চাই তা হ'ল যখন এটি একটি বনাম অন্যটি ব্যবহারের জন্য আরও প্রাসঙ্গিক। তারা কি সর্বদা প্রদত্ত শ্রেণিবদ্ধকরণ / সনাক্তকরণ সিস্টেমের কর্মক্ষমতা সম্পর্কে পরিপূরক অন্তর্দৃষ্টি সরবরাহ করে? কখন কাগজে এই দুটো সরবরাহ করা যুক্তিসঙ্গত? একটার বদলে? কোনও বিকল্প (সম্ভবত আরও আধুনিক) …

2
আমি কীভাবে আর এর মধ্যে একটি ডাটা.ফ্রেমের সারি সংখ্যা পেতে পারি? [বন্ধ]
একটি ডেটাसेट পড়ার পরে: dataset <- read.csv("forR.csv") এতে থাকা মামলার সংখ্যা আমাকে দিতে কীভাবে আমি আর পেতে পারি? এছাড়াও, প্রত্যাবর্তিত মানটি বাদ দেওয়া মামলাগুলি বাদ দেবে na.omit(dataset)?
157 r 

2
উত্পাদক বনাম বৈষম্যমূলক
আমি জানি যে জেনারেটরিভ অর্থ " ভিত্তিক " এবং বৈষম্যমূলক অর্থ " উপর ভিত্তি করে " তবে আমি কয়েকটি বিষয় নিয়ে বিভ্রান্ত হয়েছি:পি ( y | x )পি( x , y))পি(এক্স,Y)P(x,y)পি( y)| এক্স)পি(Y|এক্স)P(y|x) উইকিপিডিয়া (+ ওয়েবে অনেকগুলি হিট) এসভিএম এবং সিদ্ধান্ত গাছের মতো জিনিসকে বৈষম্যমূলক বলে শ্রেণীবদ্ধ করে। তবে এগুলির …

7
পারস্পরিক সম্পর্ক বা সমবায় নিয়ে পিসিএ?
পারস্পরিক সম্পর্ক মেট্রিক্স এবং কোভেরিয়েন্স ম্যাট্রিক্সের প্রধান উপাদান বিশ্লেষণ (পিসিএ) সম্পাদনের মধ্যে প্রধান পার্থক্যগুলি কী কী? তারা কি একই ফলাফল দেয়?

6
সম্ভাব্য বিতরণের মান 1 এর বেশি হওয়া কি ঠিক আছে?
উপর সাদাসিধা বায়েসের ক্লাসিফায়ার সম্পর্কে উইকিপিডিয়া পৃষ্ঠা , এই লাইন হল: p ( h e i g h t | m a l e ) = 1.5789p(height|male)=1.5789p(\mathrm{height}|\mathrm{male}) = 1.5789 (1 এর উপরে সম্ভাব্য বন্টন ঠিক আছে It এটি বেল বক্ররেখার অধীনে অঞ্চল যা 1 এর সমান) কীভাবে একটি মান ঠিক …

6
কে-ভাঁজ ক্রস-বৈধতার পরে কীভাবে ভবিষ্যদ্বাণীমূলক মডেল চয়ন করবেন?
আমি ভাবছি কে-ভাঁজ ক্রস-বৈধকরণের পরে কীভাবে ভবিষ্যদ্বাণীমূলক মডেলটি চয়ন করবেন। এটি অদ্ভুতভাবে বর্ণিত হতে পারে, সুতরাং আমাকে আরও বিশদে ব্যাখ্যা করতে দিন: আমি যখনই কে-ফোল্ড ক্রস-বৈধকরণ চালনা করি, তখন আমি প্রশিক্ষণের ডেটার K সাবসেটগুলি ব্যবহার করি এবং কে বিভিন্ন মডেলের সাথে শেষ করি। আমি কে মডেলগুলির মধ্যে কীভাবে বাছাই তা …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.