পরিসংখ্যান এবং বড় তথ্য

4

ডেটা 'নরমালাইজেশন' এবং ডেটা 'স্কেলিং' এর মধ্যে পার্থক্য কী? এখনও অবধি আমি ভেবেছিলাম উভয় পদই একই প্রক্রিয়াটিকে বোঝায় তবে এখন বুঝতে পারলাম এর বাইরে আরও কিছু আছে যা আমি জানি / বুঝতে পারি না। এছাড়াও যদি নরমালাইজেশন এবং স্কেলিংয়ের মধ্যে পার্থক্য থাকে তবে কখন আমরা নরমালাইজেশন ব্যবহার করব তবে স্কেলিং …

45 data-transformation scales normality-assumption normalization

1

I টাইপ II কীভাবে ব্যাখ্যা করবেন এবং III আনোভা এবং মনোভা টাইপ করবেন?

আমার প্রাথমিক প্রশ্নটি হ'ল টাইপ আই (অনুক্রমিক) আনোভা পরিচালনা করার সময় আউটপুট (সহগুণ, এফ, পি) কীভাবে ব্যাখ্যা করবেন? আমার নির্দিষ্ট গবেষণার সমস্যাটি আরও জটিল, তাই আমি আমার উদাহরণটি ভাগে ভাগ করে দেব। প্রথমত, যদি আমি উদ্ভিদ বৃদ্ধি (ওয়াই 1) বলার উপর স্পাইডার ডেনসিটি (এক্স 1) এর প্রভাবের বিষয়ে আগ্রহী এবং …

45 r hypothesis-testing anova manova sums-of-squares

6

বিতরণের মধ্যে কলমোগোরভ দূরত্বের জন্য প্রেরণা

দুটি সম্ভাবনার বিতরণ কতটা সমান তা পরিমাপ করার অনেকগুলি উপায় রয়েছে। জনপ্রিয় পদ্ধতিগুলির মধ্যে (বিভিন্ন মহলে) রয়েছে: কোলমোগোরভ দূরত্ব: বন্টন কার্যের মধ্যবর্তী দূরত্ব; ক্যান্টোরোভিচ-রুবিনস্টাইন দূরত্ব: প্রত্যাশার মধ্যে সর্বাধিক পার্থক্যটি লিপস্চিটজ ধ্রুবক সাথে দুটি ক্রিয়াকলাপ বন্টনকে আরও বাড়িয়ে তোলে, যা বিতরণ ফাংশনগুলির মধ্যে দূরত্ব হিসাবেও পরিণত হয় ;111L1L1L^1 বেষ্টিত-Lipschitz দূরত্ব: কে …

45 distributions probability hypothesis-testing mathematical-statistics

8

সব মডেল কি অকেজো? কোনও সঠিক মডেল কি সম্ভব - বা দরকারী?

এই প্রশ্নটি একমাস ধরে আমার মনে উদ্দীপনা জাগছে। আমস্ট্যাট নিউজের ফেব্রুয়ারী ২০১ issue সংখ্যায় বার্কলে অধ্যাপক মার্ক ভ্যান ডার লানের একটি নিবন্ধ রয়েছে যা অনর্থক মডেল ব্যবহারের জন্য লোকদের তিরস্কার করে। তিনি বলেছিলেন যে মডেলগুলি ব্যবহার করে পরিসংখ্যানগুলি তখন বিজ্ঞানের চেয়ে বরং একটি শিল্প। তাঁর মতে, একজন সর্বদা "সঠিক মডেল" …

45 machine-learning maximum-likelihood modeling nonparametric parametric

10

বিগ ডেটা ঠিক কী?

আমাকে বেশ কয়েকটি অনুষ্ঠানে প্রশ্ন করা হয়েছিল: বিগ-ডেটা কী? শিক্ষার্থী এবং আমার আত্মীয় উভয়ই যা পরিসংখ্যান এবং এমএল-এর কাছাকাছি বাজছে। আমি এই সিভি-পোস্ট পেয়েছি । এবং আমি অনুভব করি যে আমি সেখানে একমাত্র উত্তরের সাথে একমত। উইকিপিডিয়া পৃষ্ঠা এছাড়াও এটিতে কিছু মন্তব্য আছে, কিন্তু আমি নিশ্চিত যদি আমি সত্যিই সেখানে …

44 large-data

6

সম্ভাবনার পারস্পরিক ক্রিয়াকলাপ কি কিছু উপস্থাপন করে?

আমি ভাবছিলাম যে পি এর পারস্পরিক ক্রিয়াকলাপ (এক্স = 1) বিশেষভাবে কিছু উপস্থাপন করে?

44 probability

4

পরিসংখ্যানবিদরা কেন অ-তাত্পর্যপূর্ণ ফলাফলের অর্থ নাল অনুমানকে গ্রহণ করার বিরোধিতা করে "আপনি নালকে প্রত্যাখ্যান করতে পারবেন না"?

দুটি নমুনা টি-টেস্টের মতো Traতিহ্যগত পরিসংখ্যানগত পরীক্ষাগুলিও এই হাইপোথিসিসকে নির্মূল করার চেষ্টা করার দিকে মনোনিবেশ করে যে দুটি স্বতন্ত্র নমুনার ফাংশনের মধ্যে কোনও পার্থক্য নেই। তারপরে, আমরা একটি আত্মবিশ্বাসের স্তরটি বেছে নিই এবং বলি যে যদি উপায়গুলির পার্থক্যটি 95% স্তরের বাইরে হয় তবে আমরা নাল অনুমানটি বাতিল করতে পারি। যদি …

44 hypothesis-testing statistical-significance confidence-interval equivalence tost

4

অন্যান্য বৈশিষ্ট্য মানচিত্র উত্পাদন করতে বৈশিষ্ট্য মানচিত্রে কার্নেলগুলি কীভাবে প্রয়োগ করা হয়?

আমি কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলির কনভোলশন অংশটি বোঝার চেষ্টা করছি। নিম্নলিখিত চিত্রটি দেখছেন: আমাদের প্রথম কনভ্যুশন স্তরটি বুঝতে কোনও সমস্যা নেই যেখানে আমাদের 4 টি আলাদা কার্নেল রয়েছে (আকারের ), যা 4 টি বৈশিষ্ট্যযুক্ত মানচিত্র প্রাপ্ত করার জন্য আমরা ইনপুট চিত্রের সাথে মিলিত করি।k×kk×kk \times k আমি যা বুঝতে পারি না …

44 machine-learning neural-networks deep-learning conv-neural-network

6

আপনার প্রিয় পরিসংখ্যান গ্রাফ কি?

এটি আমার একটি প্রিয় এই উদাহরণটি একটি হাস্যকর শিরাতে রয়েছে (কৃতিত্বটি আমার প্রাক্তন প্রফেসর স্টিভেন গোর্টমেকারের কাছে) উত্তর প্রতি এক এন্ট্রি। অবশ্যই, এই প্রশ্নটি একই লাইনের পাশাপাশি আপনার প্রিয় "ডেটা বিশ্লেষণ" কার্টুনটি কী? দয়া করে আপনার সরবরাহিত কোনও চিত্রের সাথে যথাযথ ক্রেডিট / উদ্ধৃতি প্রদান করুন।

44 data-visualization

5

একাডেমিক পত্রগুলিতে প্রকাশিত পরিসংখ্যান

পাঠ্যপুস্তকের বাইরে 'বাস্তব বিশ্বে' কীভাবে পরিসংখ্যান ব্যবহার করা হচ্ছে তার সুনির্দিষ্ট লক্ষ্য নিয়ে আমি প্রচুর বিবর্তনীয় / পরিবেশগত একাডেমিক কাগজপত্র পড়েছি read আমি সাধারণত পত্রগুলিতে পরিসংখ্যানগুলিকে সুসমাচার হিসাবে গ্রহণ করি এবং আমার পরিসংখ্যানগত শিক্ষায় সহায়তা করার জন্য কাগজপত্রগুলি ব্যবহার করি। সর্বোপরি, যদি কোনও কাগজ লিখতে কয়েক বছর সময় নেয় এবং …

44 publication-bias academia

3

পি-মানগুলির সংমিশ্রণের সময়, কেন কেবল গড় হয় না?

আমি সম্প্রতি পি-মানগুলি সংযুক্ত করার জন্য ফিশারের পদ্ধতি সম্পর্কে শিখেছি। এটি নলের নীচে পি-মানটি একটি অভিন্ন বিতরণ অনুসরণ করে এবং এর ভিত্তিতে তৈরি হয় - যে যা আমি প্রতিভা হিসাবে মনে করি। তবে আমার প্রশ্ন হ'ল কেন এই বিভ্রান্তিকর পথে? এবং কেন পি-মানগুলির অর্থ ব্যবহার করে এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি …

44 hypothesis-testing p-value multiple-comparisons central-limit-theorem combining-p-values

1

একাধিক র্যান্ডম ভেরিয়েবলের পণ্যটির বৈচিত্র

আমরা দুটি স্বতন্ত্র ভেরিয়েবলের জন্য উত্তর জানি: Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm Var}(XY) = E(X^2Y^2) − (E(XY))^2={\rm Var}(X){\rm Var}(Y)+{\rm Var}(X)(E(Y))^2+{\rm Var}(Y)(E(X))^2 তবে, যদি আমরা বেশি ভেরিয়েবল, এর পণ্য গ্রহণ করি তবে প্রতিটি ভেরিয়েবলের বৈকল্পিক এবং প্রত্যাশিত মানগুলির ক্ষেত্রে উত্তরটি কী হবে?Var(X1X2⋯Xn)Var(X1X2⋯Xn){\rm Var}(X_1X_2 \cdots X_n)

44 variance random-variable independence

7

শাস্ত্রীয় পদ্ধতির পরিবর্তে কেউ কেন 'ননফর্মেশনাল' অনুচিতের সাথে বায়সিয়ান পদ্ধতির ব্যবহার করবেন?

যদি আগ্রহটি কেবলমাত্র কোনও মডেলের প্যারামিটারগুলি নির্ধারণ করে (পয়েন্টওয়াইস এবং / বা ব্যবধানের প্রাক্কলন) এবং পূর্ববর্তী তথ্য নির্ভরযোগ্য, দুর্বল না হয় (আমি জানি এটি কিছুটা অস্পষ্ট তবে আমি একটি দৃশ্যাবলী প্রতিষ্ঠার চেষ্টা করছি যেখানে একটি পছন্দ পছন্দ করে পূর্ববর্তী কঠিন) ... কেউ কেন শাস্ত্রীয় পদ্ধতির পরিবর্তে 'ননফর্মেশনাল' অনুচিত প্রিয়ারদের সাথে …

44 bayesian inference prior likelihood information

1

কোহেনের কাপ্পা বৈচিত্র্য (এবং মান ত্রুটিগুলি) গণনা করা হচ্ছে

কপ্প ( ) পরিসংখ্যানটি সালে কোহেন [১] দ্বারা দুটি বিদ্রোহীর মধ্যে চুক্তি পরিমাপ করার জন্য প্রবর্তন করেছিলেন। এর বৈকল্পিকতা বেশ কিছুদিন ধরেই দ্বন্দ্বের কারণ হয়ে দাঁড়িয়েছিল।κκ\kappa আমার প্রশ্নটি হ'ল বড় নমুনাগুলি সহ সবচেয়ে ভাল বৈকল্পিক গণনা। আমি বিশ্বাস করতে আগ্রহী যে ফ্লেইস [2] দ্বারা যাচাই করা হয়েছে এবং যাচাই করা …

44 estimation variance reliability cohens-kappa

5

র্যান্ডম ফরেস্ট অ্যালগরিদমের অনুকূলিতকরণগুলি

আমি লক্ষ্য করেছি যে এলোজিআইবি, ওয়াফলস এবং কিছু আর প্যাকেজগুলির মতো এলোমেলো বনের কয়েকটি বাস্তবায়ন রয়েছে randomForest। কেউ কি আমাকে বলতে পারেন যে এই লাইব্রেরিগুলি অত্যন্ত অনুকূলিত হয়েছে? এগুলি মূলত পরিসংখ্যান শিক্ষার উপাদানগুলির বিবরণ হিসাবে এলোমেলো বনগুলির সমতুল্য বা অতিরিক্ত অতিরিক্ত কৌশল যুক্ত হয়েছে? আমি আশা করি এই প্রশ্নটি যথেষ্ট …

44 random-forest algorithms model-evaluation