পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
AIC, BIC, CIC, DIC, EIC, FIC, GIC, HIC, IIC - আমি কি সেগুলি পরস্পরের পরিবর্তে ব্যবহার করতে পারি?
পি। তাঁর পিআরএনএন ব্রায়ান রিপলির 34 জন মন্তব্য করেছেন যে "এআইসির নাম আকাইকে (1974) নামকরণ করেছিল 'একটি তথ্য মানদণ্ড' যদিও এটি সাধারণত বিশ্বাস করা হয় যে এটি আ আকাইকের পক্ষে দাঁড়িয়েছে"। আসলে, এআইসি পরিসংখ্যান প্রবর্তন করার সময়, আকাইকে (1974, p.719) এটি ব্যাখ্যা করে "IC stands for information criterion and A …

2
- ভাঁজ ক্রস-বৈধকরণে ভাঁজগুলির সর্বোত্তম সংখ্যার : কী সবসময় ছেড়ে যাওয়া সিভি সেরা পছন্দ?
গণনা শক্তি বিবেচনার দিক বিবেচনা করে, ক্রস-বৈধকরণে ভাঁজের সংখ্যা বাড়ানো আরও ভাল মডেল নির্বাচন / যাচাইকরণের দিকে পরিচালিত করে (যেমন ভাঁজের সংখ্যা আরও বেশি ভাল)? যুক্তিটিকে চূড়ান্ত দিকে নিয়ে যাওয়া, কী ছাড় -ওয়ান-আউট ক্রস-বৈধকরণের প্রয়োজনে ফোল্ড ক্রস-বৈধকরণের চেয়ে ভাল মডেলগুলির দিকে পরিচালিত করে?KKK এই প্রশ্নের কিছু পটভূমি: আমি খুব কম …

5
কিউকিপ্লটকে ব্যাখ্যা করা - অ-স্বাভাবিকতার সিদ্ধান্ত নেওয়ার জন্য কি কোনও থাম্বের নিয়ম রয়েছে?
আমি QQplots এ পর্যাপ্ত থ্রেড পড়েছি তা বুঝতে এখানে QQplot অন্যান্য স্বাভাবিকতা পরীক্ষার চেয়ে আরও তথ্যপূর্ণ হতে পারে। তবে আমি কিউকিপ্লটসের ব্যাখ্যার সাথে অনভিজ্ঞ। আমি অনেক গুগল; আমি প্রচলিত নন-কিউকিউপ্লোটের অনেকগুলি গ্রাফ পেয়েছি, তবে কীভাবে তাদের ব্যাখ্যা করতে হবে সে সম্পর্কে কোনও স্পষ্ট বিধি নেই, যা বিতরণগুলি জেনে রাখার সাথে …

5
আর - কিউকিপ্লট: কীভাবে ডেটা সাধারণত বিতরণ করা হয় তা দেখুন
আমি শাপিরো-উইলকের স্বাভাবিকতা পরীক্ষা করার পরে এটির পরিকল্পনা করেছি। পরীক্ষায় দেখা গেছে যে সম্ভবত জনসংখ্যার সাধারণত বিতরণ করা হয়। তবে এই প্লটটিতে এই "আচরণ" কীভাবে দেখবেন? হালনাগাদ ডেটার একটি সাধারণ হিস্টোগ্রাম: হালনাগাদ শাপিরো-উইলক পরীক্ষা বলে:

2
স্প্লাইসগুলি কি ডেটাটিকে উপচে ফেলেছে?
আমার সমস্যা : আমি সম্প্রতি একজন পরিসংখ্যানবিদের সাথে সাক্ষাত করেছিলাম যা আমাকে জানিয়েছিল যে স্প্লাইনগুলি কেবল ডেটা অন্বেষণের জন্য কার্যকর এবং অতিরিক্ত মানানসইয়ের শিকার হয়, সুতরাং ভবিষ্যদ্বাণীতে এটি কার্যকর নয়। তিনি সরল বহুবর্ষের সাথে অন্বেষণকে পছন্দ করেছেন ... যেহেতু আমি স্প্লাইনের একটি বড় অনুরাগী, এবং এটি আমার অন্তর্নিহিতের বিপরীতে যায় …

4
প্রত্যাশা পাটিগণিতের অর্থের সমান কেন?
আজ আমি গাণিতিক প্রত্যাশা নামে একটি নতুন বিষয় জুড়ে এসেছি। আমি যে বইটি অনুসরণ করছি তা বলছে, প্রত্যাশাটি কোনও সম্ভাবনা বন্টন থেকে আসা এলোমেলো পরিবর্তনশীলের পাটিগণিত গড়। তবে এটি প্রত্যাশাটিকে কিছু উপাত্তের পণ্যের যোগফল এবং এর সম্ভাব্যতা হিসাবে সংজ্ঞায়িত করে। এই দুটি (গড় এবং প্রত্যাশা) কীভাবে এক হতে পারে? ডেটা …

3
আমি একটি ডেটাসেটে শিখরগুলি কীভাবে খুঁজে পাব?
যদি আমার কাছে এমন ডেটা সেট থাকে যা নীচের মতো গ্রাফ তৈরি করে তবে আমি কীভাবে আলগোরিদিমভাবে দেখানো শিখরের এক্স-মানগুলি নির্ধারণ করব (এই ক্ষেত্রে তিনটি):

6
বায়েশিয়ান পরিসংখ্যান টিউটোরিয়াল
আমি বায়েশিয়ান পরিসংখ্যানগুলিতে গতি বাড়ানোর চেষ্টা করছি। আমার কিছু পরিসংখ্যানের পটভূমি রয়েছে (স্ট্যাট 101) তবে খুব বেশি নয় - আমি মনে করি আমি পূর্ববর্তী, উত্তরোত্তর এবং সম্ভাবনাগুলি বুঝতে পারি: ডি। আমি এখনও কোনও বায়েশিয়ান পাঠ্যপুস্তকটি পড়তে চাই না। আমি এমন উত্স (ওয়েবসাইট পছন্দসই) থেকে পড়তে পছন্দ করব যা আমাকে দ্রুত …

4
লজিস্টিক রিগ্রেশন সাবসেট নির্বাচন কীভাবে করবেন?
আমি আর-তে একটি দ্বিপদী পারিবারিক গ্ল্যাম ফিট করছি, এবং আমার কাছে সম্পূর্ণ ব্যাখ্যামূলক ভেরিয়েবল রয়েছে এবং আমার সেরাটি খুঁজে পাওয়া দরকার (একটি পরিমাপটি ভাল হিসাবে আর-স্কোয়ার)। ব্যাখ্যামূলক ভেরিয়েবলের এলোমেলো বিভিন্ন সংমিশ্রণের মধ্য দিয়ে লুপ করতে একটি স্ক্রিপ্ট লেখার সংক্ষিপ্তকরণ এবং তারপরে কোনটি সবচেয়ে ভাল সম্পাদন করে তা রেকর্ডিংয়ে, আমি সত্যিই …
47 r  logistic 

15
সর্বাধিক বিভ্রান্তিকর পরিসংখ্যান শর্তাবলী
আমরা পরিসংখ্যানবিদরা এমন অনেকগুলি শব্দ ব্যবহার করেন যা অন্য প্রত্যেকের ব্যবহারের পদ্ধতি থেকে কিছুটা আলাদা। আমরা যখন শিখি বা ব্যাখ্যা করি তখন এটি প্রচুর সমস্যার সৃষ্টি করে। আমি একটি তালিকা শুরু করব (এবং এখন আমি মন্তব্যগুলির জন্য কিছু সংজ্ঞা যুক্ত করব): শক্তি হ'ল একটি মিথ্যা নাল অনুমানটি সঠিকভাবে প্রত্যাখ্যান করার …

5
নিজস্ব প্যাকেজ লেখার প্রস্তুতিতে অধ্যয়নের জন্য প্রথম আর প্যাকেজগুলির উত্স কোড
আমি আর প্যাকেজ লেখা শুরু করার পরিকল্পনা করছি। আমি ভেবেছিলাম প্যাকেজ নির্মাণের কনভেনশন শিখতে বিদ্যমান প্যাকেজগুলির উত্স কোডটি অধ্যয়ন করা ভাল হবে। অধ্যয়নের জন্য ভাল প্যাকেজগুলির জন্য আমার মানদণ্ড: সাধারণ পরিসংখ্যান / প্রযুক্তিগত ধারণা : মূল বিষয় হ'ল প্যাকেজ নির্মাণের যান্ত্রিকতা সম্পর্কে। প্যাকেজটি বোঝার জন্য প্যাকেজের আসল বিষয় সম্পর্কে বিশদভাবে …
47 r 

3
বক্র আকারের উপর ভিত্তি করে টাইম-সিরিজ ক্লাস্টারিং করা কি সম্ভব?
আমার কাছে কয়েকটি সিরিজের আউটলেটগুলির বিক্রয় ডেটা রয়েছে এবং সময়ের সাথে সাথে তাদের কার্ভগুলির আকারের ভিত্তিতে সেগুলি শ্রেণিবদ্ধ করতে চাই। ডেটা মোটামুটি এ জাতীয় দেখাচ্ছে (তবে স্পষ্টতই এলোমেলো নয় এবং এর কিছু গুম তথ্য রয়েছে): n.quarters <- 100 n.stores <- 20 if (exists("test.data")){ rm(test.data) } for (i in 1:n.stores){ interval …

7
টি-টেস্ট পরিচালনা করার সময় কেন কেউ সর্বদা ডিএফ-এর একটি ওয়েলচ অনুমান ব্যবহার করার চেয়ে সমান রূপগুলি ধরে নিতে (বা পরীক্ষা করার জন্য) পছন্দ করবে?
ভেরিয়েন্সের একজাতীয়তার অনুমানটি যখন পূরণ করা হয় তখন মনে হয় যে ওয়েলচ অ্যাডজাস্টেড টি-টেস্ট এবং স্ট্যান্ডার্ড টি-টেস্টের ফলাফলগুলি প্রায় একই রকম। কেন সবসময় ওয়েলচ অ্যাডজাস্টেড টি ব্যবহার করবেন না?

14
আত্মবিশ্বাসের ব্যবস্থাগুলি ব্যাখ্যা করার বিষয়ে ব্যাখ্যা?
"আত্মবিশ্বাসের স্তর " সহ আত্মবিশ্বাসের ব্যবধানটি সম্পর্কে আমার বর্তমান হ'ল আমরা যদি আত্মবিশ্বাসের ব্যবধানটি বহুবার (প্রতিটি সময় নতুন করে নমুনা সহ) গণনা করার চেষ্টা করি তবে এতে সঠিক পরামিতি থাকবে সময়।1 - α1 - α1−α1 - \alpha1 - α1−α1 - \alpha যদিও আমি বুঝতে পেরেছি যে এটি "সত্যিকার প্যারামিটারটি এই …

2
জিএলএম আর তে অবশিষ্ট ও নাল ডিভ্যান্সের ব্যাখ্যা করা
আর-এ জিএলএম-এ নাল এবং অবশিষ্ট অব্যবস্থাটি কীভাবে ব্যাখ্যা করবেন? মত, আমরা বলি যে ছোট এআইসি আরও ভাল। বিচ্যুতিগুলির জন্যও কি একই রকম এবং দ্রুত ব্যাখ্যা আছে? নাল বিচ্যুতি: স্বাধীনতার 1077 ডিগ্রিতে 1146.1 অবশিষ্ট অব্যাহতি: স্বাধীনতার 1099 ডিগ্রিতে 4589.4 এআইসি: 11089

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.