পরিসংখ্যান এবং বড় তথ্য

5

চলক নির্বাচনের জন্য আর-এ লার্স (বা গ্ল্যামনেট) প্যাকেজ থেকে ল্যাসো ব্যবহার করা Using

দুঃখিত যদি এই প্রশ্নটি কিছুটা মৌলিক জুড়ে আসে। আমি আরে একাধিক লিনিয়ার রিগ্রেশন মডেলের জন্য ল্যাসো ভেরিয়েবল নির্বাচনটি ব্যবহার করতে চাইছি I আমার এবং সেট করার পরে আমি নিম্নলিখিত কমান্ডগুলি ব্যবহার করব:yএক্সxxYyy model = lars(x, y) coef(model) আমার সমস্যাটি যখন আমি ব্যবহার করি coef(model)। এটি 15 টি সারি সহ একটি …

39 feature-selection lasso glmnet lars

2

লজিস্টিক রিগ্রেশন শক্তি বিশ্লেষণের সিমুলেশন - ডিজাইন করা পরীক্ষাগুলি

এই প্রশ্নটি লজিস্টিক রিগ্রেশন এবং এসএএস-এর সাথে পাওয়ার বিশ্লেষণ সম্পর্কিত আমি জিজ্ঞাসা করা একটি প্রশ্নের জবাবে @ গ্রেগ স্নোয়ের দেওয়া উত্তরের প্রতিক্রিয়া হিসাবে Proc GLMPOWER। যদি আমি একটি পরীক্ষার নকশা করছি এবং ফলাফলগুলিকে যুক্তিযুক্ত লজিস্টিক রিগ্রেশনকে বিশ্লেষণ করব, তবে আমি কীভাবে শক্তি বিশ্লেষণ পরিচালনা করতে সিমুলেশন (এবং এখানে ) ব্যবহার …

39 r logistic generalized-linear-model simulation power-analysis

3

অ্যাপলের শেয়ারের দামের ক্ষেত্রে কেন বিপুল সংখ্যক আইন প্রয়োগ হয় না?

এখানে এনওয়াই টাইমের নিবন্ধটি "অ্যাপল প্রচুর সংখ্যার আইনকে মোকাবিলা করে" বলে । এটি বিপুল সংখ্যক আইন ব্যবহার করে অ্যাপল শেয়ারের দাম বৃদ্ধির ব্যাখ্যা করার চেষ্টা করে। এই নিবন্ধটি কোন পরিসংখ্যানগত (বা গাণিতিক) ত্রুটি করে?

39 probability central-limit-theorem law-of-large-numbers statistics-in-media

1

পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ এবং অ-তাত্পর্যপূর্ণ বিশ্লেষণগুলিতে কীভাবে এটা স্কোয়ার / আংশিক এটা স্কোয়ারের ব্যাখ্যা এবং প্রতিবেদন করবেন?

আমার কাছে ডেটা রয়েছে যা এটা স্কোয়ার মান এবং আংশিক এটা স্কোয়ারের মানগুলি গ্রুপ মানে পার্থক্যের জন্য প্রভাব আকারের পরিমাপ হিসাবে গণনা করে। এটা স্কোয়ার এবং আংশিক এটা স্কোয়ারের মধ্যে পার্থক্য কী? একই কোহেনের নির্দেশিকা (1988 আমার মনে হয়: 0.01 = ছোট, 0.06 = মাঝারি, 0.13 = বৃহত্তর) ব্যবহার করে …

39 anova statistical-significance effect-size

4

আর এ "।" (বিন্দু) এর অর্থ কী?

আমি কেবল "আর ইন সংক্ষেপে" বইটি পড়ছি। এবং দেখে মনে হচ্ছে আমি সেই অংশটি বাদ দিয়েছি যেখানে "।" যেমন "নমুনা.ফর্মুলা" ব্যাখ্যা করা হয়েছিল। > sample.formula <- as.formula(y~x1+x2) ক্ষেত্রের সূত্র সহ অন্যান্য ভাষাগুলির মতো নমুনা কি কোনও বিষয়? এবং যদি তা হয় তবে আমি কীভাবে এটি জানতে পারি যে এই অবজেক্টটির …

39 r

2

লজিস্টিক রিগ্রেশন মডেল রূপান্তর করে না

আমি বিমান সংস্থাগুলি সম্পর্কিত ফ্লাইটগুলি সম্পর্কে কিছু তথ্য পেয়েছি (নামক একটি ডেটা ফ্রেমে flights) এবং আমি দেখতে চাই যে ফ্লাইটের সময়টি উল্লেখযোগ্যভাবে বিলম্বিত আগমনের সম্ভাব্যতার উপর প্রভাব ফেলে কিনা (অর্থাত 10 বা তার বেশি মিনিট)। আমি অনুমান করেছি যে আমি লজিস্টিক রিগ্রেশন ব্যবহার করব, সাথে সাথে ভবিষ্যদ্বাণী হিসাবে ফ্লাইটের সময় …

39 r logistic separation

6

সবচেয়ে কম কোণ রিগ্রেশন বনাম লাসো o

স্বল্প-কোণে রিগ্রেশন এবং লাসো খুব একই নিয়মিত পাথ তৈরি করতে পারে (যখন সহগ শূন্যকে ছাড়িয়ে যায় তখন অভিন্ন)) এটি উভয়ই কার্যত অভিন্ন অ্যালগরিদমে দক্ষতার সাথে ফিট করতে পারেন। অন্য পদ্ধতির চেয়ে কোনও পদ্ধতির পছন্দ করার জন্য কি কখনও ব্যবহারিক কারণ রয়েছে?

39 regression lasso

3

মোড, শ্রেণি এবং আর অবজেক্টের ধরণ

আমি ভাবছিলাম মোড, শ্রেণি এবং আর অবজেক্টের ধরণের মধ্যে পার্থক্য কী? একটি আর অবজেক্টের ধরণ টাইপফ () ফাংশন, মোড মোড () দ্বারা এবং শ্রেণি দ্বারা শ্রেণি () দ্বারা প্রাপ্ত করা যেতে পারে। এছাড়াও অন্য কোনও অনুরূপ ফাংশন এবং ধারণাগুলি যা আমি মিস করেছি? ধন্যবাদ এবং শুভেচ্ছা!

39 r

8

গ্রাফিকাল ডেটা ওভারভিউ (সংক্ষিপ্তসার) ফাংশন আর

আমি নিশ্চিত যে আমি এর আগে কোনও আর প্যাকেজে এই জাতীয় কোনও ফাংশনটি পেরিয়ে এসেছি, তবে ব্যাপক গুগলিংয়ের পরে আমি এটি কোথাও খুঁজে পাচ্ছি না বলে মনে হয়। আমি যে ফাংশনটির কথা ভাবছি তার দেওয়া ভেরিয়েবলের জন্য একটি গ্রাফিকাল সংক্ষিপ্তসার তৈরি করেছি, কিছু গ্রাফ (একটি হিস্টগ্রাম এবং সম্ভবত একটি বাক্স …

39 r data-visualization descriptive-statistics eda

8

কোন গ্রুপ পার্থক্য অনুমানের পরীক্ষা কিভাবে?

আপনি দুটি গ্রুপ (যেমন, পুরুষ এবং মহিলা) একটি সংখ্যার উপর নির্ভরশীল ভেরিয়েবল (উদাহরণস্বরূপ, গোয়েন্দা পরীক্ষার স্কোর) খুঁজছেন এবং আপনার কোন অনুমান আছে যে কোন গ্রুপ পার্থক্য আছে সঙ্গে আপনার একটি অধ্যয়ন আছে কল্পনা করুন। প্রশ্ন: কোন গ্রুপ পার্থক্য আছে কিনা তা পরীক্ষা করার একটি ভাল উপায় কী? দলগত কোনও পার্থক্যের …

39 hypothesis-testing t-test equivalence tost

3

ক্লোজার জুম বনাম: ডেটা বিশ্লেষণের জন্য সুবিধা এবং অসুবিধা

আমার অদূর ভবিষ্যতে আর শেখার পরিকল্পনা ছিল। পড়া অপর এক প্রশ্নের আমি Clojure সম্পর্কে খুঁজে পাওয়া যায় নি। এখন কি করতে হবে জানি না। আমি মনে করি আমার কাছে আর এর বড় সুবিধা হ'ল অর্থনীতিতে কিছু লোক এটি ব্যবহার করে, আমার একজন সুপারভাইজার সহ (যদিও অন্যজন বলেছেন: আর থেকে দূরে …

39 r

4

দুটি নমুনা টি-টেস্টের সমান বেইশিয়ান?

আমি আর বেস্টের মতো প্লাগ এবং খেলার পদ্ধতি খুঁজছি না বরং দুটি নমুনার মধ্যকার পার্থক্য পরীক্ষা করতে আমি কিছু বায়েশিয়ান পদ্ধতি কী কী তা ব্যবহার করতে পারি তার গাণিতিক ব্যাখ্যা।

39 hypothesis-testing bayesian t-test

5

এবং সম্পর্কের সহগের মধ্যে সম্পর্ক

ধরা যাক আমার কাছে দুটি 1-মাত্রিক অ্যারে রয়েছে, একটি1a1a_1 এবং একটি2a2a_2 । প্রতিটিতে 100 টি ডাটা পয়েন্ট রয়েছে। একটি1a1a_1 প্রকৃত তথ্য, এবং একটি2a2a_2 মডেল ভবিষ্যদ্বাণী করা হয়। এই ক্ষেত্রে, আর2R2R^2 মানটি হবে: আর2= 1 - এসএসr ই এসএসএসt o t ( 1 ) ।আর2=1-এসএসRইগুলিএসএসটিণটি (1)। R^2 = 1 - \frac{SS_{res}}{SS_{tot}} …

39 correlation r-squared

1

কেন আমরা টি-এসএনই উদ্দেশ্যমূলক ক্রিয়ায় ক্রস এনট্রপির পরিবর্তে কুলব্যাক-লেবেলার ডাইভারজেন্স ব্যবহার করব?

আমার মনে, নমুনা বিতরণ থেকে সত্য বিতরণে কেএল ডাইভার্জেন্স কেবল ক্রস এনট্রপি এবং এন্ট্রপির মধ্যে পার্থক্য। আমরা কেন অনেকগুলি মেশিন লার্নিং মডেলগুলিতে ব্যয় ফাংশন হিসাবে ক্রস এনট্রপি ব্যবহার করি, তবে টি-সনে কুলব্যাক-লেবলার ডাইভারজেন্সটি ব্যবহার করি? শেখার গতিতে কি কোনও পার্থক্য আছে?

39 kullback-leibler tsne cross-entropy

5

স্কোয়ার ত্রুটি হ্রাস করা কি নিখুঁত ত্রুটি হ্রাস করার সমতুল্য? স্কোয়ার ত্রুটিটি পরবর্তীটির চেয়ে বেশি জনপ্রিয় কেন?

যখন আমরা লিনিয়ার রিগ্রেশন পরিচালনা করি যখন ডেটা পয়েন্টের একগুচ্ছ ফিট করতে , ক্লাসিক পদ্ধতির স্কোয়ার ত্রুটি হ্রাস করে। আমি দীর্ঘদিন ধরে এমন প্রশ্নে বিস্মিত হয়েছি যা স্কোয়ার ত্রুটিটি হ্রাস করে চূড়ান্ত ত্রুটি হ্রাস করার সমান ফল দেয় ? যদি তা না হয় তবে স্কোয়ার ত্রুটি হ্রাস করা কেন ভাল? …

39 least-squares error