পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
কোনও মডেল তৈরি করার আগে প্রায়শই ভেরিয়েবলগুলি অ্যাডজাস্ট করা হয় (যেমন মানসম্মত) - এটি কখন ভাল ধারণা এবং এটি কখন খারাপ?
কোন পরিস্থিতিতে আপনি মডেল ফিটিংয়ের আগে কোনও পরিবর্তনকে স্কেল বা মানক করতে চান না? এবং একটি পরিবর্তনশীল স্কেলিং এর সুবিধা / অসুবিধাগুলি কী কী?

6
ডেটাতে মৌসুমতা সনাক্ত করতে কোন পদ্ধতি ব্যবহার করা যেতে পারে?
আমি যে ডেটা পেয়েছি তাতে মৌসুমী সনাক্ত করতে চাই। এমন কিছু পদ্ধতি রয়েছে যা আমি মৌসুমী সাবরিজ প্লট এবং স্বতঃসংশ্লিষ্ট প্লটের মতো খুঁজে পেয়েছি তবে বিষয়টি হ'ল আমি বুঝতে পারি না যে গ্রাফটি কীভাবে পড়তে হয়, কেউ সাহায্য করতে পারে? অন্যটি বিষয় হ'ল, গ্রাফের চূড়ান্ত ফলাফলের সাথে বা ছাড়া মৌসুমতা …

8
হাইপোথিসিস টেস্টিং শেখানোর এবং কেন চালিয়ে যেতে (যখন আত্মবিশ্বাসের অন্তরগুলি পাওয়া যায়)?
অন্তর্বর্তী হিসাবরক্ষক (আত্মবিশ্বাস, বুটস্ট্র্যাপ, বিশ্বাসযোগ্যতা বা যাই হোক না কেন) এমন সমস্যার জন্য কেন হাইপোথিসিস টেস্টিং (তার সমস্ত কঠিন ধারণার সাথে এবং যা সবচেয়ে পরিসংখ্যানীয় পাপগুলির মধ্যে রয়েছে) পড়ানো এবং ব্যবহার চালিয়ে যান? শিক্ষার্থীদের দেওয়া সর্বোত্তম ব্যাখ্যা (যদি থাকে) কী? শুধু traditionতিহ্য? মতামত খুব স্বাগত জানানো হবে।

13
বিগত 15 বছরের পরিসংখ্যানের অগ্রগতিগুলি কী কী?
ফ্রেডম্যান-হাস্টি-তিবশিরানী বুস্টিংয়ের অ্যানালসস অফ স্ট্যাটিস্টিকস পেপার এবং এখনও অন্য লেখকরা (ফ্রেউন্ড এবং স্কাপায়ার সহ) সেই একই বিষয়ে মন্তব্যগুলি আমার মনে আছে। সেই সময়, সুস্পষ্টভাবে বুস্টিংকে অনেক ক্ষেত্রেই একটি যুগান্তকারী হিসাবে দেখা হত: গণ্যমান্যভাবে সম্ভব, একটি তাত্পর্যপূর্ণ পদ্ধতি, দুর্দান্ত তবুও রহস্যজনক পারফরম্যান্স সহ। একই সময়ে, এসভিএম বয়সে এসেছিল, কঠিন তত্ত্ব দ্বারা …

12
গ্রাফ [বন্ধ] থেকে ডেটা স্ক্র্যাপ করার জন্য সফ্টওয়্যারটির দরকার
কারও কারও কাছে এমন কোনও সফ্টওয়্যার রয়েছে (পছন্দমতো বিনামূল্যে, সবচেয়ে ভাল মুক্ত উত্স) যা কারটিশিয়ান স্থানাঙ্কে (একটি মানক, প্রতিদিনের প্লট) প্লট করা ডেটার একটি চিত্র নেবে এবং গ্রাফে প্লট করা পয়েন্টগুলির স্থানাঙ্কগুলি বের করবে? মূলত, এটি একটি ডেটা মাইনিং সমস্যা এবং একটি বিপরীত ডেটা-ভিজ্যুয়ালাইজেশন সমস্যা।

2
আংশিক সম্ভাবনা, প্রোফাইল সম্ভাবনা এবং প্রান্তিক সম্ভাবনার মধ্যে পার্থক্য কী?
আমি এই পদগুলি ব্যবহার করা দেখছি এবং আমি সেগুলি মিশ্রিত করতে থাকি। তাদের মধ্যে পার্থক্যের একটি সহজ ব্যাখ্যা আছে?


6
টি-পরীক্ষার পরিবর্তে আর-তে কোন ক্রোমুটেশন পরীক্ষার প্রয়োগকরণ (জোড়যুক্ত এবং অ-জোড়যুক্ত)?
টি-টেস্ট ব্যবহার করে বিশ্লেষণ করেছি এমন একটি পরীক্ষা থেকে আমার কাছে ডেটা রয়েছে। নির্ভরশীল ভেরিয়েবলটি অন্তরকৃত আকারযুক্ত এবং ডেটা হয় অবিযুক্ত (অর্থাত্, 2 গোষ্ঠী) বা জোড়যুক্ত (অর্থাত্-বিষয়গুলির মধ্যে)। যেমন (বিষয়গুলির মধ্যে): x1 <- c(99, 99.5, 65, 100, 99, 99.5, 99, 99.5, 99.5, 57, 100, 99.5, 99.5, 99, 99, 99.5, 89.5, …

5
একনোমেট্রিক্সে একটি "এলোমেলো প্রভাবের মডেল" কীভাবে একনোমেট্রিক্সের বাইরে মিশ্র মডেলগুলির সাথে সম্পর্কিত?
আমি ভাবতাম একনোমেট্রিক্সের "র্যান্ডম এফেক্টস মডেল" ইকোনোমেট্রিক্সের বাইরে "র্যান্ডম ইন্টারসেপ্ট সহ মিশ্র মডেল" এর সাথে মিলে যায় তবে এখন আমি নিশ্চিত নই। এটা কি পারে? ইকোনোমেট্রিক্স মিশ্রিত মডেলগুলির "সাহিত্যের থেকে কিছুটা পৃথক প্রভাব" এবং "র্যান্ডম এফেক্টস" এর মতো পদ ব্যবহার করে এবং এটি একটি কুখ্যাত বিভ্রান্তির কারণ হয়ে দাঁড়ায়। আসুন …

8
নির্দিষ্ট উপায়ে এবং স্ট্যান্ডার্ড বিচ্যুতি যেমন নির্দিষ্ট সীমাবদ্ধতাগুলি পূরণ করে এমন ডেটা কীভাবে অনুকরণ করবেন?
এই প্রশ্নটি মেটা-বিশ্লেষণে আমার প্রশ্ন দ্বারা অনুপ্রাণিত । তবে আমি কল্পনা করি যে এটি প্রাসঙ্গিক বিষয়গুলি শেখানোর ক্ষেত্রেও কার্যকর হবে যেখানে আপনি একটি ডেটাসেট তৈরি করতে চান যা কোনও বিদ্যমান প্রকাশিত ডেটাসেটকে হুবহু মিরর করে। আমি জানি যে প্রদত্ত বিতরণ থেকে এলোমেলো ডেটা কীভাবে তৈরি করা যায়। সুতরাং উদাহরণস্বরূপ, যদি …

2
পরিবর্তনশীল নির্বাচনের আরও সুস্পষ্ট আলোচনা
পটভূমি আমি মেডিসিনে ক্লিনিকাল গবেষণা করছি এবং বেশ কয়েকটি পরিসংখ্যান কোর্স নিয়েছি। আমি কখনও লিনিয়ার / লজিস্টিক রিগ্রেশন ব্যবহার করে একটি কাগজ প্রকাশ করি নি এবং সঠিকভাবে পরিবর্তনশীল নির্বাচন করতে চাই। ব্যাখ্যামূলকতা গুরুত্বপূর্ণ, সুতরাং অভিনব মেশিন শেখার কোনও কৌশল নেই। আমি ভেরিয়েবল সিলেকশন সম্পর্কে আমার বোঝার সংক্ষিপ্তসার করেছি - কেউ …

2
সংকোচনের কাজ কেন?
মডেল নির্বাচনের সমস্যাগুলি সমাধান করার জন্য, প্রচুর পদ্ধতি (এলএএসএসও, রিজ রিগ্রেশন ইত্যাদি) প্রেডিক্টর ভেরিয়েবলের সহগগুলি শূন্যের দিকে সঙ্কুচিত করবে। কেন এটি ভবিষ্যদ্বাণীপূর্ণ সক্ষমতা উন্নত করে তার একটি স্বজ্ঞাত ব্যাখ্যা খুঁজছি। যদি ভেরিয়েবলের আসল প্রভাবটি আসলে খুব বড় ছিল তবে পরামিতি সঙ্কুচিত হওয়ার কারণে আরও খারাপ ভবিষ্যদ্বাণী হবে না কেন?

10
পরিসংখ্যানে অ্যানাক্রোনস্টিক অনুশীলনের কয়েকটি উদাহরণ কী?
আমি সেই অনুশীলনের কথা উল্লেখ করছি যা এখনও তাদের উপস্থিতি বজায় রাখে, যদিও তারা যে সমস্যাগুলি (সাধারণত গণনা) মোকাবিলার জন্য ডিজাইন করেছিলেন তারা বেশিরভাগই সমাধান হয়েছে। উদাহরণস্বরূপ, ইয়েটসের ধারাবাহিকতা সংশোধনটি পরীক্ষার সাথে আনুমানিক ফিশারের সঠিক পরীক্ষার জন্য উদ্ভাবিত হয়েছিল , তবে এটি এখন আর ব্যবহারিক নয় কারণ সফ্টওয়্যারটি এখন বড় …

1
লজিস্টিক রিগ্রেশন জন্য ওয়াল্ড পরীক্ষা
আমি যতদূর বুঝতে পারি লজিস্টিক রিগ্রেশন প্রসঙ্গে ওয়াল্ড পরীক্ষাটি কোনও নির্দিষ্ট পূর্বাভাসকারী ভেরিয়েবল গুরুত্বপূর্ণ কিনা তা নির্ধারণ করতে ব্যবহৃত হয় । এটি সংশ্লিষ্ট সহগের শূন্য হওয়ার নাল অনুমানকে প্রত্যাখ্যান করে।XXX পরীক্ষায় সহগের মান স্ট্যান্ডার্ড ত্রুটি দ্বারা ভাগ করে ।σσ\sigma আমি যে সম্পর্কে বিভ্রান্ত হয়ে পড়েছি তা হল জেড স্কোর নামেও …

3
ডি ফিনেটির প্রতিনিধিত্বের উপপাদ্যটি সম্পর্কে এত দুর্দান্ত কী?
মার্ক জে শেরভিশ (পৃষ্ঠা 12) দ্বারা পরিসংখ্যানের তত্ত্ব থেকে : যদিও ডিফিনেটির উপস্থাপনা উপপাদ্য 1.49 প্যারামেট্রিক মডেলগুলিকে অনুপ্রাণিত করার কেন্দ্রস্থল, এটি বাস্তবে তাদের প্রয়োগে ব্যবহৃত হয় না। প্যারামেট্রিক মডেলগুলির উপপাদ্যটি কীভাবে কেন্দ্রীয়?

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.