পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

2
রৈখিক মডেলের অনুমান যাচাই করার জন্য অবশিষ্টাংশ বনাম ফিটেড ভ্যালু প্লটটির ব্যাখ্যা
আর (2005, পৃষ্ঠা 59) দিয়ে ফারাওয়ের লিনিয়ার মডেলগুলির নিম্নলিখিত চিত্রটি বিবেচনা করুন। প্রথম প্লটটি মনে হয় যে অবশিষ্টাংশ এবং লাগানো মানগুলি অসংলগ্ন, কারণ তারা সাধারণত বিতরণ করা ত্রুটিযুক্ত হোমোসিস্টেস্টিক লিনিয়ার মডেলে থাকতে হবে। সুতরাং, দ্বিতীয় এবং তৃতীয় প্লটগুলি, যা অবশিষ্টাংশ এবং লাগানো মানগুলির মধ্যে নির্ভরতা নির্দেশ করে বলে মনে হয়, …

3
পারস্পরিক সম্পর্ক মেট্রিক্সকে কেন ইতিবাচক অর্ধ-নির্দিষ্ট হওয়া দরকার এবং ইতিবাচক অর্ধ-নির্দিষ্ট হওয়া বা হওয়া বা বোঝার অর্থ কী?
আমি পারস্পরিক সম্পর্ক বা কোভেরিয়েন্স ম্যাট্রিক্সের ইতিবাচক আধা-নির্দিষ্ট সম্পত্তিটির অর্থ নিয়ে গবেষণা করছি। আমি কোন তথ্য খুঁজছি ইতিবাচক অর্ধ-নির্দিষ্টকরণের সংজ্ঞা; এর গুরুত্বপূর্ণ বৈশিষ্ট্য, ব্যবহারিক প্রভাব; নেতিবাচক নির্ধারক হওয়ার পরিণতি, মাল্টিভারিয়েট বিশ্লেষণে প্রভাব বা সিমুলেশন ফলাফল ইত্যাদি

3
কোনও মডেলের আকাইকে তথ্য মানদণ্ড (এআইসি) স্কোর বলতে কী বোঝায়?
এখানে সাধারণ প্রশ্নগুলির অর্থ কী তা সম্পর্কে আমি এখানে কিছু প্রশ্ন দেখেছি, তবে আমার উদ্দেশ্যটির জন্য এগুলি খুব সাধারণ। আমি এআইসির স্কোর বলতে কী বোঝায় তা গাণিতিকভাবে বোঝার চেষ্টা করছি। তবে একই সাথে, আমি এমন কঠোর প্রমাণ চাই না যা আমাকে আরও গুরুত্বপূর্ণ বিষয়গুলি না দেখায়। উদাহরণস্বরূপ, যদি এটি ক্যালকুলাস …


2
বেনজামিনী এবং হচবার্গ (1995) এবং বেনজামিনী এবং ইয়েকুটিয়ালি (2001) মিথ্যা আবিষ্কারের হারের পদ্ধতির মধ্যে ব্যবহারিক পার্থক্য কী?
আমার পরিসংখ্যান প্রোগ্রাম বেনজামিনী এবং হচবার্গ (1995) এবং বেনজামিনী এবং ইয়েকুটিয়ালি (2001) মিথ্যা আবিষ্কারের হার (এফডিআর) উভয় পদ্ধতি প্রয়োগ করে। আমি পরবর্তী কাগজের মাধ্যমে পড়ার জন্য যথাসাধ্য চেষ্টা করেছি, তবে এটি বেশ গাণিতিকভাবে ঘন এবং আমি যথাযথভাবে নিশ্চিত নই যে আমি পদ্ধতিগুলির মধ্যে পার্থক্যটি বুঝতে পারি। আমি আমার পরিসংখ্যান প্রোগ্রামের …

1
ডাউন-স্যাম্পলিং লজিস্টিক রিগ্রেশন সহগকে পরিবর্তন করে?
যদি আমার খুব বিরল ধনাত্মক শ্রেণীর সাথে একটি ডেটাসেট থাকে এবং আমি নেতিবাচক শ্রেণিকে নিম্ন-নমুনা করি, তবে লজিস্টিক রিগ্রেশন করান, আমি ইতিবাচক শ্রেণীর প্রসারকে পরিবর্তন করেছি এই প্রতিস্থাপনের জন্য আমার কি রিগ্রেশন সহগের সমন্বয় করা দরকার? উদাহরণস্বরূপ, ধরা যাক আমার 4 টি ভেরিয়েবল সহ একটি ডেটাসেট রয়েছে: ওয়াই, এ, বি …

2
মডেল নির্বাচন এবং ক্রস-বৈধকরণ: সঠিক উপায়
মডেল নির্বাচন এবং ক্রস বৈধকরণের বিষয়টিতে ক্রসভিলেটেডে অসংখ্য থ্রেড রয়েছে। এখানে কয়েকটি দেওয়া হল: অভ্যন্তরীণ বনাম বাহ্যিক ক্রস-বৈধকরণ এবং মডেল নির্বাচন বৈশিষ্ট্য নির্বাচন এবং ক্রস-বৈধকরণের জন্য ডিক্রানমারসুপিয়ালের শীর্ষ উত্তর তবে, এই থ্রেডগুলির উত্তরগুলি মোটামুটি জেনেরিক এবং বেশিরভাগ ক্ষেত্রে বৈধতা এবং মডেল নির্বাচনের ক্রস করার জন্য বিশেষ পদ্ধতির সাথে বিষয়গুলি হাইলাইট …

3
নির্ভরশীল চলকের স্বাভাবিকতা = অবশিষ্টাংশের স্বাভাবিকতা?
এই সমস্যাটি সর্বদা তার কুশল মাথাটিকে পিছনে ফেলেছে বলে মনে হচ্ছে এবং আমি আমার নিজস্ব পরিসংখ্যান (এবং বিবেকহীনতা) বোঝার জন্য এটিকে ছাড়িয়ে দেওয়ার চেষ্টা করছি। সাধারণ রৈখিক মডেলগুলির অনুমানগুলি (টি-টেস্ট, আনোভা, রিগ্রেশন ইত্যাদি) এর মধ্যে "স্বাভাবিকতার অনুমান" অন্তর্ভুক্ত থাকে তবে আমি খুঁজে পেয়েছি যে এটি খুব কমই পরিষ্কারভাবে বর্ণনা করা …

3
এলোমেলো প্রভাব উল্লেখযোগ্য কিনা তা আমি কীভাবে পরীক্ষা করতে পারি?
আমি কখন এলোমেলো প্রভাব ব্যবহার করব এবং কখন এটি অপ্রয়োজনীয় তা বোঝার চেষ্টা করছি। আমি আপনার কাছে 4 বা ততোধিক গোষ্ঠী / ব্যক্তি থাকি যা আমি করি (15 টি পৃথক মুজ) thumb এই মুজগুলির মধ্যে কিছু 29 টি মোট 29 টি পরীক্ষার জন্য 2 বা 3 বার পরীক্ষা করা হয়েছিল। …

5
নিউরোয়াল নেটওয়ার্ক প্রশিক্ষণের জন্য জিনেটিক অ্যালগরিদম ব্যাকপ্রপ্যাগেশন বনাম
আমি প্রতিটি পদ্ধতির উপকারিতা এবং কনস সম্পর্কে আলোচনা করে কয়েকটি কাগজপত্র পড়েছি, কেউ কেউ এই যুক্তি দিয়েছিলেন যে জিএ অনুকূল সমাধান সন্ধানে কোনও উন্নতি দেয় না অন্যরা দেখায় যে এটি আরও কার্যকর। মনে হয় সাহিত্যে জিএকে সাধারণত অগ্রাধিকার দেওয়া হয় (যদিও বেশিরভাগ লোকেরা প্রয়োজনীয় ফলাফল অর্জনের জন্য এটি কোনওভাবে পরিবর্তন …

3
একাধিক অনুমানের পরে প্রপেনসিটির স্কোর মিলছে
আমি এই কাগজটি উল্লেখ করি : হেইস জেআর, গ্রোনার জেআই। "ট্রমা রেজিস্ট্রি ডেটা থেকে আঘাতের তীব্রতার উপর গাড়ির আসন এবং সিট বেল্ট ব্যবহারের প্রভাব পরীক্ষা করার জন্য একাধিক অনুমান এবং প্রবণতা স্কোর ব্যবহার করা হচ্ছে।" জে পেডিয়াট্রিক সার্জ। 2008 মে; 43 (5): 924-7। এই সমীক্ষায়, 15 টি সম্পূর্ণ ডেটাসেটগুলি অর্জন …

2
মিশ্র প্রকারের ডেটা সহ শ্রেণিবিন্যাসের ক্লাস্টারিং - কোন দূরত্ব / মিল ব্যবহার করতে হবে?
আমার ডেটাসেটে আমাদের দুটি ধারাবাহিক এবং প্রাকৃতিকভাবে পৃথক পৃথক ভেরিয়েবল রয়েছে। আমি জানতে চাই যে আমরা উভয় প্রকারের ভেরিয়েবল ব্যবহার করে শ্রেণিবদ্ধ ক্লাস্টারিং করতে পারি কিনা। এবং যদি হ্যাঁ, তবে কোন দূরত্ব পরিমাপ উপযুক্ত?

3
জেনারাইজড লিনিয়ার মডেল এবং জেনারাইজড লিনিয়ার মিশ্রিত মডেলগুলির মধ্যে পার্থক্য
আমি ভাবছি মিশ্রিত এবং অমীমাংসিত জিএলএমগুলির মধ্যে পার্থক্যগুলি কী। উদাহরণস্বরূপ, এসপিএসএস-এ ড্রপ ডাউন মেনু ব্যবহারকারীদের যে কোনও একটিতে ফিট করতে দেয়: analyze-> generalized linear models-> generalized linear models & analyze-> mixed models-> generalized linear তারা কি অনুপস্থিত মানগুলির সাথে আলাদাভাবে আচরণ করে? আমার নির্ভরশীল পরিবর্তনশীল বাইনারি এবং আমার বেশ কয়েকটি …

5
আপনি কী সিভি / বুটস্ট্র্যাপ ব্যবহার করে মেশিন লার্নিং অ্যালগরিদম প্রশিক্ষণ দিয়ে অতিরিক্ত সাজাতে পারেন?
এই প্রশ্নটি একটি সুস্পষ্ট উত্তর পেতে খুব খোলামেলা হতে পারে, তবে আশা করি না। মেশিন লার্নিং অ্যালগরিদম, যেমন এসভিএম, জিবিএম, র‌্যান্ডম ফরেস্ট ইত্যাদি, সাধারণত কিছু ফ্রি প্যারামিটার থাকে যা থাম্ব গাইডেন্সের কিছু নিয়মের বাইরেও প্রতিটি ডেটা সেটে সুর করা দরকার। প্যারামিটারগুলির সেটটি সেরা জেনারেলাইজেশন ত্রুটি প্রদান করে যাতে এটি সাধারণত …

4
এক্স এবং ওয়াই পারস্পরিক সম্পর্কযুক্ত নয়, তবে এক্স একাধিক রিগ্রেশনে ওয়াইয়ের উল্লেখযোগ্য ভবিষ্যদ্বাণী। এর মানে কী?
এক্স এবং ওয়াই পারস্পরিক সম্পর্কযুক্ত নয় (-.01); যাইহোক, আমি যখন এক (এক, বি, সি) অন্যান্য (সম্পর্কিত) ভেরিয়েবলের পাশাপাশি Y, এবং অন্যান্য দুটি ভেরিয়েবল (এ, বি) এর পূর্বাভাস বহন করে এমন একাধিক রিগ্রেশনে যখন X রাখি তখন লক্ষ্য করুন যে দুটি অন্য ( এ, বি) ভেরিয়েবলগুলি রিগ্রেশনের বাইরে ওয়াইয়ের সাথে উল্লেখযোগ্যভাবে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.