পরিসংখ্যান এবং বড় তথ্য

2

এলোমেলো বনাঞ্চলে উচ্চ-সম্পর্কিত সম্পর্কযুক্ত ভেরিয়েবলগুলি নির্ভুলতা এবং বৈশিষ্ট্য-নির্বাচনকে বিকৃত করবে না?

আমার বোধগম্যতা অনুসারে, অত্যন্ত সংযুক্ত ভেরিয়েবলগুলি এলোমেলো বন মডেলটিতে বহু-প্রান্তিক সমস্যা তৈরি করবে না (দয়া করে আমি ভুল হলে আমাকে সংশোধন করুন)। তবে, অন্যভাবে, আমার কাছে যদি একই রকম তথ্য সম্বলিত অনেকগুলি ভেরিয়েবল থাকে, তবে এই সেটটিতে মডেলগুলির ওজন কি অন্যদের চেয়ে বেশি হবে? উদাহরণস্বরূপ, একই ভবিষ্যদ্বাণীক শক্তি সহ তথ্য …

32 random-forest multicollinearity ensemble

4

কেন ডিগ্রি কমার পরিবর্তে বহুবর্ষীয় রিগ্রেশনে নিয়মিতকরণ ব্যবহার করবেন?

রিগ্রেশন করার সময়, উদাহরণস্বরূপ, দুটি হাইপার প্যারামিটারগুলি বেছে নিতে হ'ল প্রায়শই ফাংশনটির ক্ষমতা (যেমন: বহুত্বের বৃহত্তম ব্যয়কারী) এবং নিয়মিতকরণের পরিমাণ। আমি যা সম্পর্কে বিভ্রান্ত হয়েছি, তা কেন কেবলমাত্র একটি কম ক্ষমতার ফাংশনটি বেছে নিচ্ছেন না এবং তারপরে কোনও নিয়মিতকরণ উপেক্ষা করবেন না? এইভাবে, এটি উপকারী হবে না। নিয়মিতকরণের সাথে যদি …

32 regression machine-learning optimization regularization polynomial

5

মডেল নির্বাচনের ক্ষেত্রে এআইসির গাইডলাইন

আমি সাধারণত বিআইসি ব্যবহার করি কারণ আমার বোঝাপড়াটি এটি এআইসির চেয়ে পার্সিমনিটিকে আরও দৃ strongly়ভাবে মূল্য দেয়। যাইহোক, আমি এখন আরও ব্যাপক পদ্ধতির ব্যবহার করার সিদ্ধান্ত নিয়েছি এবং এটিও ব্যবহার করতে চাই। আমি জানি যে রাফ্টারি (1995) বিআইসি পার্থক্যের জন্য দুর্দান্ত দিকনির্দেশনা উপস্থাপন করেছিল: 0-2 দুর্বল, 2-2 একটি মডেল আরও …

32 r model-selection references aic bic

5

"হেটেরোস্কেস্টাস্টিক" বা "হেটেরোসেসটাস্টিক" এর দুটি বানান কেন?

আমি প্রায়শই দুটি "হিটারোস্কেস্টেস্টিক" এবং "হেটেরোসেসটাস্টিক" এবং একইভাবে "হোমোসেসেস্টেস্টিক" এবং "হোমোসেকাস্টেস্টিক" উভয়ের জন্য দেখতে পাই। "গ" এবং "কে" রূপগুলির মধ্যে অর্থের মধ্যে কোনও পার্থক্য নেই বলে মনে হয়, কেবল শব্দের গ্রীক ব্যুৎপত্তি সম্পর্কিত একটি গৌণ পার্থক্য। দুটি স্বতন্ত্র বানানের উত্স কি? একটি ব্যবহার কি অন্যের চেয়ে বেশি সাধারণ, এবং সেগুলি …

32 terminology heteroscedasticity etymology

2

লজিস্টিক রিগ্রেশন: বার্নোল্লি বনাম বনোমিয়াল রেসপন্স ভেরিয়েবল

আমি নিম্নোক্ত দ্বিপদী প্রতিক্রিয়ার সাথে এবং আমার ভবিষ্যদ্বাণীকারী হিসাবে এবং সাথে লজিস্টিক রিগ্রেশন করতে চাই । X1X1X_1X2X2X_2 আমি নীচের বিন্যাসে বার্নোল্লি প্রতিক্রিয়াগুলির মতো একই ডেটা উপস্থাপন করতে পারি। এই 2 ডেটা সেটগুলির জন্য লজিস্টিক রিগ্রেশন আউটপুটগুলি বেশিরভাগই একই। ডিভ্যান্সের অবশিষ্টাংশ এবং এআইসি আলাদা। (নাল বিচ্যুতি এবং অবশিষ্ট ডিভ্যান্সের মধ্যে পার্থক্য …

32 logistic binomial aic bernoulli-distribution deviance

3

পর্যবেক্ষণ করা ডেটা (ওরফে ফিশিং অভিযান) মেলানোর জন্য এবং টাইপ 1 ত্রুটির বৃদ্ধি এড়াতে অনুমানের পরিবর্তন করা কি সম্ভব?

এটি সুপরিচিত যে গবেষকগণ একটি অনুমান গঠন করার আগে বিদ্যমান তথ্য এবং গবেষণা পর্যবেক্ষণ এবং অন্বেষণে সময় ব্যয় করা উচিত এবং তারপরে সেই হাইপোথিসিস (নাল-হাইপোথিসিসের তাত্পর্য পরীক্ষার উল্লেখ করে) পরীক্ষা করার জন্য ডেটা সংগ্রহ করা উচিত। অনেকগুলি প্রাথমিক পরিসংখ্যান বই সতর্ক করে যে অনুমানগুলি অবশ্যই একটি প্রাইরি গঠন করা উচিত …

32 hypothesis-testing

1

টেম্পোরাল নেটওয়ার্কে অ্যানোমালি সনাক্তকরণের লিঙ্ক করুন

আমি এই কাগজটি জুড়ে এসেছি যা ট্রেন্ডিংয়ের বিষয়গুলির পূর্বাভাস দেওয়ার জন্য লিঙ্কটি অবিচ্ছিন্ন সনাক্তকরণ ব্যবহার করে এবং এটি আমার কাছে অবিশ্বাস্যরূপে আকর্ষণীয় বলে মনে হয়েছে: কাগজটি হ'ল লিংক অ্যানোমালি ডিটেকশনের মাধ্যমে সামাজিক প্রবাহে উদীয়মান বিষয়গুলি আবিষ্কার করা " । আমি এটি অন্য একটি ডেটা সেটে প্রতিলিপি করতে পছন্দ করব তবে …

32 time-series machine-learning outliers python change-point

3

কেন কোনও কোভারিয়েন্স ম্যাট্রিক্সের বিপরীতে র্যান্ডম ভেরিয়েবলের মধ্যে আংশিক পারস্পরিক সম্পর্ক রয়েছে?

আমি শুনেছি যে এলোমেলো ভেরিয়েবলের মধ্যে আংশিক পারস্পরিক সম্পর্কগুলি কোভেরিয়েন্স ম্যাট্রিক্সকে উল্টিয়ে দিয়ে এবং এর ফলে প্রাপ্ত নির্ভুলতা ম্যাট্রিক্স থেকে উপযুক্ত কোষ গ্রহণ করে (এই সত্যটি http://en.wikedia.org/wiki/Partial_correlation এ উল্লেখ করা হয়েছে , তবে একটি প্রমাণ ছাড়াই) । কেন এই ক্ষেত্রে?

32 covariance covariance-matrix linear-algebra partial-correlation matrix-inverse

1

আরে আনোভা () ফাংশন ব্যবহার করে দুটি মডেলের তুলনা করা

এর জন্য ডকুমেন্টেশন থেকে anova(): যখন অবজেক্টের ক্রম দেওয়া হয়, তখন 'আনোভা' নির্দিষ্ট ক্রমে মডেলগুলির একে অপরের বিরুদ্ধে পরীক্ষা করে ... একে অপরের বিরুদ্ধে মডেলগুলি পরীক্ষা করার অর্থ কী? এবং আদেশ কেন ব্যাপার? জেনাবেল টিউটোরিয়াল থেকে এখানে একটি উদাহরণ দেওয়া হয়েছে : > modelAdd = lm(qt~as.numeric(snp1)) > modelDom = lm(qt~I(as.numeric(snp1)>=2)) …

32 r anova

3

কার্নেল লজিস্টিক রিগ্রেশন বনাম এসভিএম

সবার জানা হিসাবে, এসভিএম উচ্চ স্থানগুলিতে ডেটা পয়েন্টগুলি প্রজেক্ট করতে কার্নেল পদ্ধতি ব্যবহার করতে পারে যাতে পয়েন্টগুলি লিনিয়ার স্পেস দ্বারা পৃথক করা যায়। তবে আমরা কার্নেল স্পেসে এই সীমানাটি চয়ন করতে লজিস্টিক রিগ্রেশনও ব্যবহার করতে পারি, সুতরাং এসভিএমের সুবিধা কী? যেহেতু এসভিএম একটি বিচ্ছিন্ন মডেল ব্যবহার করে যেখানে কেবলমাত্র সমর্থনকারী …

32 svm

1

কেন এল এম () সহগ হিসাবে এনএ ফেরত আসবে?

আমি lm()একটি ডেটা সেটে এমন একটি মডেল ফিট করছি যা আর্থিক ত্রৈমাসিকের জন্য সূচকগুলি অন্তর্ভুক্ত করে (Q1, Q2, Q3, Q4 কে একটি ডিফল্ট করে তোলে)। ব্যবহার করে lm(Y~., data = data) আমি NAকিউ 3 এর সহগ হিসাবে এবং একটি সতর্কতা পেয়েছি যে এককতার কারণে একটি পরিবর্তনশীল বাদ দেওয়া হয়েছিল। আমার …

32 r regression

3

অঙ্কসেম্বের চৌকোটির মতো একই উদ্দেশ্যে নির্মিত ডেটাসেটগুলি

আমি সবেমাত্র আনসকম্বের চৌকোমিটি জুড়ে এসেছি (চারটি ডেটাসেট যা প্রায় পৃথক বর্ণনামূলক বর্ণনামূলক পরিসংখ্যান রয়েছে তবে পরিকল্পনার সময় খুব আলাদা দেখায়) এবং যদি আমি আরও কিছু বা কম সুপরিচিত ডেটাসেটগুলি নির্দিষ্ট দিকগুলির গুরুত্ব প্রদর্শনের জন্য তৈরি করা হয়েছে তা জানতে আগ্রহী am পরিসংখ্যান বিশ্লেষণ।

32 regression data-visualization dataset

3

পরিচিত গ্রুপের বিভিন্ন রূপ, অর্থ এবং নমুনা আকারগুলি দেওয়া হলে দুটি বা আরও বেশি গোষ্ঠীর পোল করা বৈকল্পিক কীভাবে গণনা করা যায়?

বলুন যে উপাদান দুটি গ্রুপে বিভক্ত ( এবং ) রয়েছে। প্রথম গোষ্ঠীর বৈকল্পিকতা হ'ল এবং দ্বিতীয় গোষ্ঠীর বৈকল্পিকতা । উপাদানগুলি নিজেরাই অজানা বলে ধরে নেওয়া হয় তবে আমি এবং এর উপায়গুলি জানি ।m+nm+nm+nmmmnnnσ2mσm2\sigma_m^2σ2nσn2\sigma^2_nμmμm\mu_mμnμn\mu_n সম্মিলিত বৈকল্পিক গণনা করার কোনও উপায় আছে কি ?σ2(m+n)σ(m+n)2\sigma^2_{(m+n)} ভেরিয়েন্সটি পক্ষপাতহীন হতে হবে না তাই ডিনোমিনেটর এবং …

32 variance pooling

6

নিউরাল নেটওয়ার্কগুলি দিয়ে কীভাবে শুরু করবেন

আমি নিউরাল নেটওয়ার্কগুলিতে সম্পূর্ণ নতুন তবে সেগুলি বুঝতে আগ্রহী। তবে এটি শুরু করা মোটেও সহজ নয়। কেউ কি কোনও ভাল বই বা অন্য কোনও সংস্থার প্রস্তাব দিতে পারেন? একটি পড়া আবশ্যক আছে? আমি যেকোন ধরণের পরামর্শের জন্য কৃতজ্ঞ।

32 machine-learning neural-networks references

5

রাজনৈতিক পোলে কেন এত বড় নমুনার আকার থাকে?

আমি যখন সংবাদটি দেখি তখন আমি খেয়াল করেছি যে রাষ্ট্রপতি নির্বাচনের মতো জিনিসের গ্যালাপ পোলে [আমি এলোমেলোভাবে ধরে নিচ্ছি] নমুনা আকারের এক হাজারেরও বেশি রয়েছে। কলেজের পরিসংখ্যানগুলি থেকে আমি যা মনে করি তা থেকে 30 টির একটি নমুনা আকারটি "উল্লেখযোগ্যভাবে বড়" নমুনা ছিল। এটি দেখে মনে হয়েছিল যে 30 টিরও …

32 sampling sample-size power-analysis