পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

5
চলক নির্বাচনের জন্য আর-এ লার্স (বা গ্ল্যামনেট) প্যাকেজ থেকে ল্যাসো ব্যবহার করা Using
দুঃখিত যদি এই প্রশ্নটি কিছুটা মৌলিক জুড়ে আসে। আমি আরে একাধিক লিনিয়ার রিগ্রেশন মডেলের জন্য ল্যাসো ভেরিয়েবল নির্বাচনটি ব্যবহার করতে চাইছি I আমার এবং সেট করার পরে আমি নিম্নলিখিত কমান্ডগুলি ব্যবহার করব:yএক্সxxYyy model = lars(x, y) coef(model) আমার সমস্যাটি যখন আমি ব্যবহার করি coef(model)। এটি 15 টি সারি সহ একটি …

2
লজিস্টিক রিগ্রেশন শক্তি বিশ্লেষণের সিমুলেশন - ডিজাইন করা পরীক্ষাগুলি
এই প্রশ্নটি লজিস্টিক রিগ্রেশন এবং এসএএস-এর সাথে পাওয়ার বিশ্লেষণ সম্পর্কিত আমি জিজ্ঞাসা করা একটি প্রশ্নের জবাবে @ গ্রেগ স্নোয়ের দেওয়া উত্তরের প্রতিক্রিয়া হিসাবে Proc GLMPOWER। যদি আমি একটি পরীক্ষার নকশা করছি এবং ফলাফলগুলিকে যুক্তিযুক্ত লজিস্টিক রিগ্রেশনকে বিশ্লেষণ করব, তবে আমি কীভাবে শক্তি বিশ্লেষণ পরিচালনা করতে সিমুলেশন (এবং এখানে ) ব্যবহার …

3
অ্যাপলের শেয়ারের দামের ক্ষেত্রে কেন বিপুল সংখ্যক আইন প্রয়োগ হয় না?
এখানে এনওয়াই টাইমের নিবন্ধটি "অ্যাপল প্রচুর সংখ্যার আইনকে মোকাবিলা করে" বলে । এটি বিপুল সংখ্যক আইন ব্যবহার করে অ্যাপল শেয়ারের দাম বৃদ্ধির ব্যাখ্যা করার চেষ্টা করে। এই নিবন্ধটি কোন পরিসংখ্যানগত (বা গাণিতিক) ত্রুটি করে?

1
পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ এবং অ-তাত্পর্যপূর্ণ বিশ্লেষণগুলিতে কীভাবে এটা স্কোয়ার / আংশিক এটা স্কোয়ারের ব্যাখ্যা এবং প্রতিবেদন করবেন?
আমার কাছে ডেটা রয়েছে যা এটা স্কোয়ার মান এবং আংশিক এটা স্কোয়ারের মানগুলি গ্রুপ মানে পার্থক্যের জন্য প্রভাব আকারের পরিমাপ হিসাবে গণনা করে। এটা স্কোয়ার এবং আংশিক এটা স্কোয়ারের মধ্যে পার্থক্য কী? একই কোহেনের নির্দেশিকা (1988 আমার মনে হয়: 0.01 = ছোট, 0.06 = মাঝারি, 0.13 = বৃহত্তর) ব্যবহার করে …

4
আর এ "।" (বিন্দু) এর অর্থ কী?
আমি কেবল "আর ইন সংক্ষেপে" বইটি পড়ছি। এবং দেখে মনে হচ্ছে আমি সেই অংশটি বাদ দিয়েছি যেখানে "।" যেমন "নমুনা.ফর্মুলা" ব্যাখ্যা করা হয়েছিল। > sample.formula <- as.formula(y~x1+x2) ক্ষেত্রের সূত্র সহ অন্যান্য ভাষাগুলির মতো নমুনা কি কোনও বিষয়? এবং যদি তা হয় তবে আমি কীভাবে এটি জানতে পারি যে এই অবজেক্টটির …
39 r 

2
লজিস্টিক রিগ্রেশন মডেল রূপান্তর করে না
আমি বিমান সংস্থাগুলি সম্পর্কিত ফ্লাইটগুলি সম্পর্কে কিছু তথ্য পেয়েছি (নামক একটি ডেটা ফ্রেমে flights) এবং আমি দেখতে চাই যে ফ্লাইটের সময়টি উল্লেখযোগ্যভাবে বিলম্বিত আগমনের সম্ভাব্যতার উপর প্রভাব ফেলে কিনা (অর্থাত 10 বা তার বেশি মিনিট)। আমি অনুমান করেছি যে আমি লজিস্টিক রিগ্রেশন ব্যবহার করব, সাথে সাথে ভবিষ্যদ্বাণী হিসাবে ফ্লাইটের সময় …
39 r  logistic  separation 

6
সবচেয়ে কম কোণ রিগ্রেশন বনাম লাসো o
স্বল্প-কোণে রিগ্রেশন এবং লাসো খুব একই নিয়মিত পাথ তৈরি করতে পারে (যখন সহগ শূন্যকে ছাড়িয়ে যায় তখন অভিন্ন)) এটি উভয়ই কার্যত অভিন্ন অ্যালগরিদমে দক্ষতার সাথে ফিট করতে পারেন। অন্য পদ্ধতির চেয়ে কোনও পদ্ধতির পছন্দ করার জন্য কি কখনও ব্যবহারিক কারণ রয়েছে?
39 regression  lasso 

3
মোড, শ্রেণি এবং আর অবজেক্টের ধরণ
আমি ভাবছিলাম মোড, শ্রেণি এবং আর অবজেক্টের ধরণের মধ্যে পার্থক্য কী? একটি আর অবজেক্টের ধরণ টাইপফ () ফাংশন, মোড মোড () দ্বারা এবং শ্রেণি দ্বারা শ্রেণি () দ্বারা প্রাপ্ত করা যেতে পারে। এছাড়াও অন্য কোনও অনুরূপ ফাংশন এবং ধারণাগুলি যা আমি মিস করেছি? ধন্যবাদ এবং শুভেচ্ছা!
39 r 

8
গ্রাফিকাল ডেটা ওভারভিউ (সংক্ষিপ্তসার) ফাংশন আর
আমি নিশ্চিত যে আমি এর আগে কোনও আর প্যাকেজে এই জাতীয় কোনও ফাংশনটি পেরিয়ে এসেছি, তবে ব্যাপক গুগলিংয়ের পরে আমি এটি কোথাও খুঁজে পাচ্ছি না বলে মনে হয়। আমি যে ফাংশনটির কথা ভাবছি তার দেওয়া ভেরিয়েবলের জন্য একটি গ্রাফিকাল সংক্ষিপ্তসার তৈরি করেছি, কিছু গ্রাফ (একটি হিস্টগ্রাম এবং সম্ভবত একটি বাক্স …

8
কোন গ্রুপ পার্থক্য অনুমানের পরীক্ষা কিভাবে?
আপনি দুটি গ্রুপ (যেমন, পুরুষ এবং মহিলা) একটি সংখ্যার উপর নির্ভরশীল ভেরিয়েবল (উদাহরণস্বরূপ, গোয়েন্দা পরীক্ষার স্কোর) খুঁজছেন এবং আপনার কোন অনুমান আছে যে কোন গ্রুপ পার্থক্য আছে সঙ্গে আপনার একটি অধ্যয়ন আছে কল্পনা করুন। প্রশ্ন: কোন গ্রুপ পার্থক্য আছে কিনা তা পরীক্ষা করার একটি ভাল উপায় কী? দলগত কোনও পার্থক্যের …

3
ক্লোজার জুম বনাম: ডেটা বিশ্লেষণের জন্য সুবিধা এবং অসুবিধা
আমার অদূর ভবিষ্যতে আর শেখার পরিকল্পনা ছিল। পড়া অপর এক প্রশ্নের আমি Clojure সম্পর্কে খুঁজে পাওয়া যায় নি। এখন কি করতে হবে জানি না। আমি মনে করি আমার কাছে আর এর বড় সুবিধা হ'ল অর্থনীতিতে কিছু লোক এটি ব্যবহার করে, আমার একজন সুপারভাইজার সহ (যদিও অন্যজন বলেছেন: আর থেকে দূরে …
39 r 

4
দুটি নমুনা টি-টেস্টের সমান বেইশিয়ান?
আমি আর বেস্টের মতো প্লাগ এবং খেলার পদ্ধতি খুঁজছি না বরং দুটি নমুনার মধ্যকার পার্থক্য পরীক্ষা করতে আমি কিছু বায়েশিয়ান পদ্ধতি কী কী তা ব্যবহার করতে পারি তার গাণিতিক ব্যাখ্যা।

5
এবং সম্পর্কের সহগের মধ্যে সম্পর্ক
ধরা যাক আমার কাছে দুটি 1-মাত্রিক অ্যারে রয়েছে, একটি1a1a_1 এবং একটি2a2a_2 । প্রতিটিতে 100 টি ডাটা পয়েন্ট রয়েছে। একটি1a1a_1 প্রকৃত তথ্য, এবং একটি2a2a_2 মডেল ভবিষ্যদ্বাণী করা হয়। এই ক্ষেত্রে, আর2R2R^2 মানটি হবে: আর2= 1 - এসএসr ই এসএসএসt o t ( 1 ) ।আর2=1-এসএসRইগুলিএসএসটিণটি (1)। R^2 = 1 - \frac{SS_{res}}{SS_{tot}} …

1
কেন আমরা টি-এসএনই উদ্দেশ্যমূলক ক্রিয়ায় ক্রস এনট্রপির পরিবর্তে কুলব্যাক-লেবেলার ডাইভারজেন্স ব্যবহার করব?
আমার মনে, নমুনা বিতরণ থেকে সত্য বিতরণে কেএল ডাইভার্জেন্স কেবল ক্রস এনট্রপি এবং এন্ট্রপির মধ্যে পার্থক্য। আমরা কেন অনেকগুলি মেশিন লার্নিং মডেলগুলিতে ব্যয় ফাংশন হিসাবে ক্রস এনট্রপি ব্যবহার করি, তবে টি-সনে কুলব্যাক-লেবলার ডাইভারজেন্সটি ব্যবহার করি? শেখার গতিতে কি কোনও পার্থক্য আছে?

5
স্কোয়ার ত্রুটি হ্রাস করা কি নিখুঁত ত্রুটি হ্রাস করার সমতুল্য? স্কোয়ার ত্রুটিটি পরবর্তীটির চেয়ে বেশি জনপ্রিয় কেন?
যখন আমরা লিনিয়ার রিগ্রেশন পরিচালনা করি যখন ডেটা পয়েন্টের একগুচ্ছ ফিট করতে , ক্লাসিক পদ্ধতির স্কোয়ার ত্রুটি হ্রাস করে। আমি দীর্ঘদিন ধরে এমন প্রশ্নে বিস্মিত হয়েছি যা স্কোয়ার ত্রুটিটি হ্রাস করে চূড়ান্ত ত্রুটি হ্রাস করার সমান ফল দেয় ? যদি তা না হয় তবে স্কোয়ার ত্রুটি হ্রাস করা কেন ভাল? …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.