পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
এলোমেলো বনাঞ্চলে উচ্চ-সম্পর্কিত সম্পর্কযুক্ত ভেরিয়েবলগুলি নির্ভুলতা এবং বৈশিষ্ট্য-নির্বাচনকে বিকৃত করবে না?
আমার বোধগম্যতা অনুসারে, অত্যন্ত সংযুক্ত ভেরিয়েবলগুলি এলোমেলো বন মডেলটিতে বহু-প্রান্তিক সমস্যা তৈরি করবে না (দয়া করে আমি ভুল হলে আমাকে সংশোধন করুন)। তবে, অন্যভাবে, আমার কাছে যদি একই রকম তথ্য সম্বলিত অনেকগুলি ভেরিয়েবল থাকে, তবে এই সেটটিতে মডেলগুলির ওজন কি অন্যদের চেয়ে বেশি হবে? উদাহরণস্বরূপ, একই ভবিষ্যদ্বাণীক শক্তি সহ তথ্য …

4
কেন ডিগ্রি কমার পরিবর্তে বহুবর্ষীয় রিগ্রেশনে নিয়মিতকরণ ব্যবহার করবেন?
রিগ্রেশন করার সময়, উদাহরণস্বরূপ, দুটি হাইপার প্যারামিটারগুলি বেছে নিতে হ'ল প্রায়শই ফাংশনটির ক্ষমতা (যেমন: বহুত্বের বৃহত্তম ব্যয়কারী) এবং নিয়মিতকরণের পরিমাণ। আমি যা সম্পর্কে বিভ্রান্ত হয়েছি, তা কেন কেবলমাত্র একটি কম ক্ষমতার ফাংশনটি বেছে নিচ্ছেন না এবং তারপরে কোনও নিয়মিতকরণ উপেক্ষা করবেন না? এইভাবে, এটি উপকারী হবে না। নিয়মিতকরণের সাথে যদি …

5
মডেল নির্বাচনের ক্ষেত্রে এআইসির গাইডলাইন
আমি সাধারণত বিআইসি ব্যবহার করি কারণ আমার বোঝাপড়াটি এটি এআইসির চেয়ে পার্সিমনিটিকে আরও দৃ strongly়ভাবে মূল্য দেয়। যাইহোক, আমি এখন আরও ব্যাপক পদ্ধতির ব্যবহার করার সিদ্ধান্ত নিয়েছি এবং এটিও ব্যবহার করতে চাই। আমি জানি যে রাফ্টারি (1995) বিআইসি পার্থক্যের জন্য দুর্দান্ত দিকনির্দেশনা উপস্থাপন করেছিল: 0-2 দুর্বল, 2-2 একটি মডেল আরও …

5
"হেটেরোস্কেস্টাস্টিক" বা "হেটেরোসেসটাস্টিক" এর দুটি বানান কেন?
আমি প্রায়শই দুটি "হিটারোস্কেস্টেস্টিক" এবং "হেটেরোসেসটাস্টিক" এবং একইভাবে "হোমোসেসেস্টেস্টিক" এবং "হোমোসেকাস্টেস্টিক" উভয়ের জন্য দেখতে পাই। "গ" এবং "কে" রূপগুলির মধ্যে অর্থের মধ্যে কোনও পার্থক্য নেই বলে মনে হয়, কেবল শব্দের গ্রীক ব্যুৎপত্তি সম্পর্কিত একটি গৌণ পার্থক্য। দুটি স্বতন্ত্র বানানের উত্স কি? একটি ব্যবহার কি অন্যের চেয়ে বেশি সাধারণ, এবং সেগুলি …

2
লজিস্টিক রিগ্রেশন: বার্নোল্লি বনাম বনোমিয়াল রেসপন্স ভেরিয়েবল
আমি নিম্নোক্ত দ্বিপদী প্রতিক্রিয়ার সাথে এবং আমার ভবিষ্যদ্বাণীকারী হিসাবে এবং সাথে লজিস্টিক রিগ্রেশন করতে চাই । X1X1X_1X2X2X_2 আমি নীচের বিন্যাসে বার্নোল্লি প্রতিক্রিয়াগুলির মতো একই ডেটা উপস্থাপন করতে পারি। এই 2 ডেটা সেটগুলির জন্য লজিস্টিক রিগ্রেশন আউটপুটগুলি বেশিরভাগই একই। ডিভ্যান্সের অবশিষ্টাংশ এবং এআইসি আলাদা। (নাল বিচ্যুতি এবং অবশিষ্ট ডিভ্যান্সের মধ্যে পার্থক্য …

3
পর্যবেক্ষণ করা ডেটা (ওরফে ফিশিং অভিযান) মেলানোর জন্য এবং টাইপ 1 ত্রুটির বৃদ্ধি এড়াতে অনুমানের পরিবর্তন করা কি সম্ভব?
এটি সুপরিচিত যে গবেষকগণ একটি অনুমান গঠন করার আগে বিদ্যমান তথ্য এবং গবেষণা পর্যবেক্ষণ এবং অন্বেষণে সময় ব্যয় করা উচিত এবং তারপরে সেই হাইপোথিসিস (নাল-হাইপোথিসিসের তাত্পর্য পরীক্ষার উল্লেখ করে) পরীক্ষা করার জন্য ডেটা সংগ্রহ করা উচিত। অনেকগুলি প্রাথমিক পরিসংখ্যান বই সতর্ক করে যে অনুমানগুলি অবশ্যই একটি প্রাইরি গঠন করা উচিত …

1
টেম্পোরাল নেটওয়ার্কে অ্যানোমালি সনাক্তকরণের লিঙ্ক করুন
আমি এই কাগজটি জুড়ে এসেছি যা ট্রেন্ডিংয়ের বিষয়গুলির পূর্বাভাস দেওয়ার জন্য লিঙ্কটি অবিচ্ছিন্ন সনাক্তকরণ ব্যবহার করে এবং এটি আমার কাছে অবিশ্বাস্যরূপে আকর্ষণীয় বলে মনে হয়েছে: কাগজটি হ'ল লিংক অ্যানোমালি ডিটেকশনের মাধ্যমে সামাজিক প্রবাহে উদীয়মান বিষয়গুলি আবিষ্কার করা " । আমি এটি অন্য একটি ডেটা সেটে প্রতিলিপি করতে পছন্দ করব তবে …

3
কেন কোনও কোভারিয়েন্স ম্যাট্রিক্সের বিপরীতে র্যান্ডম ভেরিয়েবলের মধ্যে আংশিক পারস্পরিক সম্পর্ক রয়েছে?
আমি শুনেছি যে এলোমেলো ভেরিয়েবলের মধ্যে আংশিক পারস্পরিক সম্পর্কগুলি কোভেরিয়েন্স ম্যাট্রিক্সকে উল্টিয়ে দিয়ে এবং এর ফলে প্রাপ্ত নির্ভুলতা ম্যাট্রিক্স থেকে উপযুক্ত কোষ গ্রহণ করে (এই সত্যটি http://en.wikedia.org/wiki/Partial_correlation এ উল্লেখ করা হয়েছে , তবে একটি প্রমাণ ছাড়াই) । কেন এই ক্ষেত্রে?

1
আরে আনোভা () ফাংশন ব্যবহার করে দুটি মডেলের তুলনা করা
এর জন্য ডকুমেন্টেশন থেকে anova(): যখন অবজেক্টের ক্রম দেওয়া হয়, তখন 'আনোভা' নির্দিষ্ট ক্রমে মডেলগুলির একে অপরের বিরুদ্ধে পরীক্ষা করে ... একে অপরের বিরুদ্ধে মডেলগুলি পরীক্ষা করার অর্থ কী? এবং আদেশ কেন ব্যাপার? জেনাবেল টিউটোরিয়াল থেকে এখানে একটি উদাহরণ দেওয়া হয়েছে : > modelAdd = lm(qt~as.numeric(snp1)) > modelDom = lm(qt~I(as.numeric(snp1)>=2)) …
32 r  anova 

3
কার্নেল লজিস্টিক রিগ্রেশন বনাম এসভিএম
সবার জানা হিসাবে, এসভিএম উচ্চ স্থানগুলিতে ডেটা পয়েন্টগুলি প্রজেক্ট করতে কার্নেল পদ্ধতি ব্যবহার করতে পারে যাতে পয়েন্টগুলি লিনিয়ার স্পেস দ্বারা পৃথক করা যায়। তবে আমরা কার্নেল স্পেসে এই সীমানাটি চয়ন করতে লজিস্টিক রিগ্রেশনও ব্যবহার করতে পারি, সুতরাং এসভিএমের সুবিধা কী? যেহেতু এসভিএম একটি বিচ্ছিন্ন মডেল ব্যবহার করে যেখানে কেবলমাত্র সমর্থনকারী …
32 svm 

1
কেন এল এম () সহগ হিসাবে এনএ ফেরত আসবে?
আমি lm()একটি ডেটা সেটে এমন একটি মডেল ফিট করছি যা আর্থিক ত্রৈমাসিকের জন্য সূচকগুলি অন্তর্ভুক্ত করে (Q1, Q2, Q3, Q4 কে একটি ডিফল্ট করে তোলে)। ব্যবহার করে lm(Y~., data = data) আমি NAকিউ 3 এর সহগ হিসাবে এবং একটি সতর্কতা পেয়েছি যে এককতার কারণে একটি পরিবর্তনশীল বাদ দেওয়া হয়েছিল। আমার …
32 r  regression 

3
অঙ্কসেম্বের চৌকোটির মতো একই উদ্দেশ্যে নির্মিত ডেটাসেটগুলি
আমি সবেমাত্র আনসকম্বের চৌকোমিটি জুড়ে এসেছি (চারটি ডেটাসেট যা প্রায় পৃথক বর্ণনামূলক বর্ণনামূলক পরিসংখ্যান রয়েছে তবে পরিকল্পনার সময় খুব আলাদা দেখায়) এবং যদি আমি আরও কিছু বা কম সুপরিচিত ডেটাসেটগুলি নির্দিষ্ট দিকগুলির গুরুত্ব প্রদর্শনের জন্য তৈরি করা হয়েছে তা জানতে আগ্রহী am পরিসংখ্যান বিশ্লেষণ।

3
পরিচিত গ্রুপের বিভিন্ন রূপ, অর্থ এবং নমুনা আকারগুলি দেওয়া হলে দুটি বা আরও বেশি গোষ্ঠীর পোল করা বৈকল্পিক কীভাবে গণনা করা যায়?
বলুন যে উপাদান দুটি গ্রুপে বিভক্ত ( এবং ) রয়েছে। প্রথম গোষ্ঠীর বৈকল্পিকতা হ'ল এবং দ্বিতীয় গোষ্ঠীর বৈকল্পিকতা । উপাদানগুলি নিজেরাই অজানা বলে ধরে নেওয়া হয় তবে আমি এবং এর উপায়গুলি জানি ।m+nm+nm+nmmmnnnσ2mσm2\sigma_m^2σ2nσn2\sigma^2_nμmμm\mu_mμnμn\mu_n সম্মিলিত বৈকল্পিক গণনা করার কোনও উপায় আছে কি ?σ2(m+n)σ(m+n)2\sigma^2_{(m+n)} ভেরিয়েন্সটি পক্ষপাতহীন হতে হবে না তাই ডিনোমিনেটর এবং …
32 variance  pooling 

6
নিউরাল নেটওয়ার্কগুলি দিয়ে কীভাবে শুরু করবেন
আমি নিউরাল নেটওয়ার্কগুলিতে সম্পূর্ণ নতুন তবে সেগুলি বুঝতে আগ্রহী। তবে এটি শুরু করা মোটেও সহজ নয়। কেউ কি কোনও ভাল বই বা অন্য কোনও সংস্থার প্রস্তাব দিতে পারেন? একটি পড়া আবশ্যক আছে? আমি যেকোন ধরণের পরামর্শের জন্য কৃতজ্ঞ।

5
রাজনৈতিক পোলে কেন এত বড় নমুনার আকার থাকে?
আমি যখন সংবাদটি দেখি তখন আমি খেয়াল করেছি যে রাষ্ট্রপতি নির্বাচনের মতো জিনিসের গ্যালাপ পোলে [আমি এলোমেলোভাবে ধরে নিচ্ছি] নমুনা আকারের এক হাজারেরও বেশি রয়েছে। কলেজের পরিসংখ্যানগুলি থেকে আমি যা মনে করি তা থেকে 30 টির একটি নমুনা আকারটি "উল্লেখযোগ্যভাবে বড়" নমুনা ছিল। এটি দেখে মনে হয়েছিল যে 30 টিরও …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.