পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

8
বায়েশীয় বিশ্লেষণের কনস কী?
কোন প্রসঙ্গে বায়েশিয়ান পরিসংখ্যান পদ্ধতি ব্যবহার সম্পর্কে কিছু ব্যবহারিক আপত্তি কি? না, আমি পূর্বের পছন্দ সম্পর্কে সাধারণ কার্পিং বলতে চাইছি না। এর কোনও উত্তর না পেলে আমি আনন্দিত হব।
44 bayesian 

8
একজন আউটলারের কঠোর সংজ্ঞা?
লোকেরা প্রায়শই পরিসংখ্যানগুলিতে বিদেশীদের সাথে ডিল করার বিষয়ে কথা বলে talk যে বিষয়টি আমাকে সম্পর্কে বিরক্ত করে তা হ'ল আমি যতদূর বলতে পারি, একজন বহিরাগতের সংজ্ঞা সম্পূর্ণরূপে বিষয়গত। উদাহরণস্বরূপ, যদি কিছু এলোমেলো ভেরিয়েবলের সত্যিকারের বিতরণটি খুব ভারী-লেজযুক্ত বা বিমোডাল হয় তবে বহিরাগতদের সনাক্ত করার জন্য কোনও মানক দৃশ্যায়ন বা সংক্ষিপ্ত …

6
কীভাবে আর ব্যবহার করে পরীক্ষা করা যায় তা দেখার জন্য ডেটা স্বাভাবিক বিতরণ অনুসরণ করে কিনা to
নিম্নলিখিত কাঠামোর সাথে আমার একটি ডেটা সেট রয়েছে: a word | number of occurrence of a word in a document | a document id আর-তে সাধারণ বিতরণের জন্য আমি কীভাবে একটি পরীক্ষা করতে পারি? সম্ভবত এটি একটি সহজ প্রশ্ন তবে আমি একজন আর নবাগত।

4
পরিসংখ্যানের মডেলগুলি শীটকে ঠকায়
আমি ভাবছিলাম যে কোনও পরিসংখ্যানের মডেল "চিট শীট (গুলি)" আছে যা কোনও বা আরও তথ্য তালিকাভুক্ত করে: মডেল কখন ব্যবহার করবেন যখন মডেলটি ব্যবহার করবেন না প্রয়োজনীয় এবং alচ্ছিক ইনপুট প্রত্যাশিত ফলাফল মডেলটির বিভিন্ন ক্ষেত্রে (পলিসি, বায়ো, ইঞ্জিনিয়ারিং, উত্পাদন ইত্যাদি) পরীক্ষা করা হয়েছে? এটি কি অনুশীলন বা গবেষণায় গৃহীত হয়? …

5
একাধিক তুলনা কেন সমস্যা?
একাধিক তুলনা সহ সত্যই সমস্যাটি কী তা বুঝতে আমার কষ্ট হয় । একটি সাধারণ উপমা দিয়ে বলা হয় যে যে ব্যক্তি অনেক সিদ্ধান্ত নেবে সে অনেক ভুল করবে। বোনফেরোনি সংশোধনের মতো খুব রক্ষণশীল সাবধানতা প্রয়োগ করা হয়েছে, সম্ভাবনাটি তৈরি করার জন্য, এই ব্যক্তি যতটা সম্ভব কম ততই ভুল করবেন। তবে …

6
আধুনিক পরিসংখ্যান / মেশিন লার্নিংয়ে মাল্টিকোলাইনারিটি কেন পরীক্ষা করা হয় না
Traditionalতিহ্যগত পরিসংখ্যানগুলিতে, একটি মডেল তৈরি করার সময়, আমরা বৈকল্পিক মূল্যস্ফীতি ফ্যাক্টর (ভিআইএফ) এর প্রাক্কলন হিসাবে পদ্ধতি ব্যবহার করে বহুবিধ লাইনটি পরীক্ষা করে দেখি, তবে মেশিন লার্নিংয়ে আমরা পরিবর্তে বৈশিষ্ট্য নির্বাচনের জন্য নিয়মিতকরণ ব্যবহার করি এবং বৈশিষ্ট্যগুলি পরস্পর সম্পর্কিত কিনা তা পরীক্ষা করে দেখে মনে হয় না features মোটেই আমরা কেন …


6
আমি কীভাবে কোনও আর প্লটে ওভারল্যাপিং লেবেলগুলি এড়াতে পারি? [বন্ধ]
আমি আর তে একটি খুব সাধারণ স্ক্রেটারপ্লট লেবেল দেওয়ার চেষ্টা করছি I এটি আমি ব্যবহার করি: plot(SI, TI) text(SI, TI, Name, pos=4, cex=0.7) ফলাফলটি মধ্যযুগীয়, যেমন আপনি দেখতে পাচ্ছেন (প্রসারিত করতে ক্লিক করুন): আমি এই textxyফাংশনটি ব্যবহার করে এর জন্য ক্ষতিপূরণ দেওয়ার চেষ্টা করেছি , তবে এটি আরও ভাল নয় …

4
জিএলএম ওভারডিস্পেরেশনটি তাৎপর্যপূর্ণ কিনা তা নির্ধারণের জন্য কোনও পরীক্ষা আছে?
আমি আরয়ে পোইসন জিএলএম তৈরি করছি। অতিমাত্রায় নজরদারি পরীক্ষা করার জন্য আমি প্রদত্ত স্বাধীনতার ডিগ্রিগুলির মধ্যে অবশিষ্ট অবলম্বনের অনুপাতটি দেখছি summary(model.name)। এই অনুপাতটিকে "তাৎপর্যপূর্ণ" হিসাবে বিবেচনা করার জন্য কি কোনও কাট অফ মান বা পরীক্ষা আছে? আমি জানি যে এটি যদি> 1 হয় তবে তথ্যটি অতিরঞ্জিত হয় তবে আমার অনুপাত …

4
আউটপুট স্তর জন্য কোন সক্রিয়করণ ফাংশন?
লুকানো স্তরটির জন্য অ্যাক্টিভেশন ফাংশনগুলির পছন্দটি বেশ স্পষ্ট (বেশিরভাগ সিগময়েড বা তানহ), আউটপুট স্তরের অ্যাক্টিভেশন ফাংশন সম্পর্কে কীভাবে সিদ্ধান্ত নেবেন তা অবাক করি। সাধারণ পছন্দগুলি হ'ল লিনিয়ার ফাংশন, সিগময়েড ফাংশন এবং সফটম্যাক্স ফাংশন। তবে, আমি কখন কোনটি ব্যবহার করব?

3
দুটি পৃথক অঞ্চল থেকে সহগের সমতা পরীক্ষা করে Test
এটি একটি প্রাথমিক সমস্যা বলে মনে হচ্ছে, তবে আমি কেবল বুঝতে পেরেছি যে আমি দুটি পৃথক প্রকারের সহগের সমতা কীভাবে পরীক্ষা করতে পারি তা আমি জানি না। কেউ কি এটার উপর একটু আলো ফেলতে পারো? আরো আনুষ্ঠানিকভাবে, মনে হয় আমি নিম্নলিখিত দুটি রিগ্রেশন দৌড়াতে এবং যেখানে রিগ্রেশন নকশা ম্যাট্রিক্স বোঝায় …

5
ক্লাস্টারিংয়ের আগে ডেটা স্কেল করা কি গুরুত্বপূর্ণ?
আমি এই টিউটোরিয়ালটি পেয়েছি , যা পরামর্শ দেয় যে ক্লাস্টারিংয়ের আগে বৈশিষ্ট্যগুলিতে আপনার স্কেল ফাংশনটি চালানো উচিত (আমি বিশ্বাস করি যে এটি ডেটা জেড-স্কোরগুলিতে রূপান্তর করে)। আমি ভাবছি যে এটি প্রয়োজনীয় কিনা। আমি বেশিরভাগই জিজ্ঞাসা করছি কারণ আমি যখন ডেটা স্কেল করি না তখন একটি দুর্দান্ত কনুই পয়েন্ট থাকে তবে …

4
দ্বিপদী র্যান্ডম ভেরিয়েবলের একটি নমুনার গড়ের জন্য স্ট্যান্ডার্ড ত্রুটি
ধরুন আমি একটি পরীক্ষা চালিয়ে যাচ্ছি যার 2 টি ফলাফল হতে পারে এবং আমি ধরে নিচ্ছি যে 2 টি ফলাফলের অন্তর্নিহিত "সত্য" বিতরণ হল এনnn এবং সাথে প্যারামিটার সহ দ্বিপদী বিতরণ পিpp: বি আই এন ণ মি আমি একটি ঠ (এন,পি)Binomial(n,p){\rm Binomial}(n, p) । আমি স্ট্যান্ডার্ড ত্রুটিটি গণনা করতে পারি, …

5
ফরোয়ার্ড-ব্যাকওয়ার্ড এবং ভিটারবি অ্যালগরিদমের মধ্যে পার্থক্য কী?
লুকানো মার্কভ মডেলগুলিতে (এইচএমএম) অনুমানের জন্য ফরোয়ার্ড-পশ্চাদপদ অ্যালগরিদম এবং ভিটারবি অ্যালগরিদমের মধ্যে পার্থক্য কী তা জানতে চাই ।

4
প্রাকৃতিক লগ পরিবর্তনগুলি শতাংশের পরিবর্তন কেন হয়? লগগুলি এমন কী করে যা এটি করে?
কেউ কি ব্যাখ্যা করতে পারেন যে লগগুলির বৈশিষ্ট্যগুলি কীভাবে এটি তৈরি করে আপনি লিনিয়ার রেজিস্ট্রেশনগুলি করতে পারেন যেখানে সহগুণগুলি শতাংশ পরিবর্তন হিসাবে ব্যাখ্যা করা হয়?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.