পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
সফটম্যাক্স বনাম সিগময়েড ফাংশন লজিস্টিক শ্রেণিবদ্ধে?
কোন লজিস্টিক শ্রেণিবদ্ধে ফাংশনের (সফটম্যাক্স বনাম সিগময়েড) পছন্দ কী সিদ্ধান্ত নেয়? ধরুন এখানে 4 টি আউটপুট ক্লাস রয়েছে। উপরের প্রতিটি ফাংশন প্রতিটি শ্রেণীর সঠিক আউটপুট হওয়ার সম্ভাবনা দেয়। তাহলে কোনটি ক্লাসিফায়ারের জন্য নেওয়া উচিত?

4
ক্ষুদ্র
কিছু পরীক্ষার জন্য R, সেখানে একটি নিম্ন সীমা P-মান এর গণনার । আমি নিশ্চিত নই কেন এটি এই নম্বর, যদি এর কোনও ভাল কারণ থাকে বা এটি যদি স্বেচ্ছাচারিতা হয়। অন্যান্য প্রচুর পরিসংখ্যান প্যাকেজগুলি কেবলমাত্র যায় , তাই এটি নির্ভুলতার অনেক বেশি স্তর। কিন্তু আমি রিপোর্ট অনেকগুলি কাগজপত্র দেখিনি বা …


3
প্রথম স্ট্যান্ডার্ড সাধারণ টেবিলটি কে তৈরি করেছেন?
আমি আমার প্রারম্ভিক পরিসংখ্যান শ্রেণিতে স্ট্যান্ডার্ড সাধারণ টেবিলটি প্রবর্তন করতে চলেছি এবং এটি আমাকে অবাক করে দিয়েছিল: প্রথম স্ট্যান্ডার্ডের সাধারণ টেবিলটি কে তৈরি করেছে? কম্পিউটারগুলি আসার আগে তারা কীভাবে এটি করেছিল? আমি কাউকে হাত থেকে হাজার হাজার রিমেনের অঙ্কের সংক্ষিপ্ত-জোরের কথা ভেবে কাঁপছি।

5
জেফরিজ কেন আগে দরকারী?
আমি বুঝতে পেরেছি যে জেফরি পূর্বে প্যারামিটারাইজেশন অধীনে আক্রমণাত্মক। যাইহোক, আমি যা বুঝতে পারি না কেন এই সম্পত্তিটি পছন্দসই। ভেরিয়েবলের পরিবর্তনের অধীনে আপনি কেন পূর্বের পরিবর্তনটি চান না?
61 bayesian  prior 

10
"বিজ্ঞানীরা পরিসংখ্যানগত তাত্পর্যের বিরুদ্ধে উঠেছেন" এর অর্থ কী? (প্রকৃতিতে মন্তব্য)
প্রকৃতি বিজ্ঞানীদের মন্তব্যে শিরোনামটি পরিসংখ্যানগত তাত্পর্যগুলির বিরুদ্ধে উঠে আসে : ভ্যালেন্টিন আমরহেইন, স্যান্ডার গ্রিনল্যান্ড, ব্লেক ম্যাকশেন এবং ৮০০ এরও বেশি স্বাক্ষরকারীরা হাইপড দাবির অবসান এবং সম্ভবত গুরুত্বপূর্ণ প্রভাবগুলি বরখাস্ত করার আহ্বান জানিয়েছেন। এবং পরে বিবৃতি ধারণ করে: আবার, আমরা পি মান, আত্মবিশ্বাসের ব্যবধান বা অন্যান্য পরিসংখ্যানমূলক পদক্ষেপের উপর নিষেধাজ্ঞার পক্ষে …

2
সম্ভাবনা অনুপাত বনাম বয়েস ফ্যাক্টর
আমি বরং কোনও প্রদত্ত ঘটনার পক্ষে / বিপরীতে উদ্দেশ্যমূলক প্রমাণ উপস্থাপনের জন্য সম্ভাবনা অনুপাতের ব্যবহারের সাথে সম্পর্কিত সুসমাচার প্রচার করছি। যাইহোক, আমি সম্প্রতি শিখেছি যে বেয়েস ফ্যাক্টর বায়েসীয় পদ্ধতিগুলির প্রসঙ্গে একই ধরণের কাজ করে (অর্থাত্ত্বিক পূর্বে উদ্দেশ্য বায়েস ফ্যাক্টরের সাথে একত্রিত হয়ে একটি অবজেক্টিভ আপডেটেড সাবজেক্টিভ স্টেট অব বিশ্বাস অর্জন …

2
কেন কেবল তিনটি পার্টিশন? (প্রশিক্ষণ, বৈধতা, পরীক্ষা)
আপনি যখন একটি বড় ডেটাসেটে মডেলগুলি ফিট করার চেষ্টা করছেন, তখন সাধারণ পরামর্শটি হ'ল ডেটাটিকে তিন ভাগে বিভক্ত করা: প্রশিক্ষণ, বৈধতা এবং পরীক্ষা ডেটাসেট। এটি কারণ মডেলগুলির সাধারণত প্যারামিটারগুলির তিনটি "স্তর" থাকে: প্রথম "পরামিতি" হ'ল মডেল বর্গ (যেমন এসভিএম, নিউরাল নেটওয়ার্ক, এলোমেলো বন), পরামিতিগুলির দ্বিতীয় সেট হ'ল "নিয়মিতকরণ" পরামিতি বা …

6
"নেস্টেড" এবং "অবহেলিত" মডেলের মধ্যে পার্থক্য কী?
শ্রেণিবদ্ধ / বহুস্তর মডেলগুলির সাহিত্যে আমি প্রায়শই "নেস্টেড মডেল" এবং "অ-নেস্টেড মডেল" সম্পর্কে পড়েছি, তবে এর অর্থ কী? কেউ কি আমাকে কিছু উদাহরণ দিতে বা এই ফ্রেসিংয়ের গাণিতিক প্রভাব সম্পর্কে বলতে পারেন?

5
সঙ্কুচিত পদ্ধতিগুলি কী সমস্যার সমাধান করে?
ছুটির মরসুমটি আমাকে এলিমেটিকাল লার্নিংয়ের সাথে আগুনের পাশে কুঁকানোর সুযোগ দিয়েছে । একটি (ঘন ঘনবাদী) একনোমেট্রিক্সের দৃষ্টিকোণ থেকে আসা, রিজ রিগ্রেশন, লাসো এবং কমপক্ষে অ্যাঙ্গেল রিগ্রেশন (এলএআর) এর মতো সঙ্কুচিত পদ্ধতির ব্যবহার উপলব্ধিতে আমার সমস্যা হচ্ছে। সাধারণত, আমি নিজেরাই প্যারামিটারের অনুমানগুলিতে এবং নিরপেক্ষতা বা কমপক্ষে ধারাবাহিকতা অর্জনে আগ্রহী। সঙ্কুচিত পদ্ধতিগুলি …

7
একাধিক নির্ভরশীল ভেরিয়েবলগুলির সাথে রিগ্রেশন?
দুই বা ততোধিক নির্ভরশীল ভেরিয়েবলগুলির সাথে একটি (একাধিক) রিগ্রেশন সমীকরণ থাকা কি সম্ভব? অবশ্যই, আপনি দুটি ডিভির জন্য একটি পৃথক দুটি রিগ্রেশন সমীকরণ চালনা করতে পারেন, তবে এটি দুটি ডিভির মধ্যে কোনও সম্পর্ককে ক্যাপচার করবে বলে মনে হয় না?
61 regression 

15
কেন প্যারামেট্রিক পরিসংখ্যানগুলিকে ননপ্যারমেট্রিকের চেয়ে বেশি পছন্দ করা হবে?
কেউ আমাকে ব্যাখ্যা করতে পারেন কেন কেউ হাইপোথিসিস টেস্টিং বা রিগ্রেশন বিশ্লেষণের জন্য কেন একটি ননপ্যারমেট্রিক স্ট্যাটিস্টিকাল পদ্ধতিতে প্যারাম্যাট্রিক বেছে নেবেন? আমার মনে, এটি রাফটিংয়ের জন্য যাওয়া এবং জলবিহীন প্রতিরোধী ঘড়ি চয়ন করার মতো, কারণ আপনি এটি ভিজা নাও পারেন । কেন প্রতিটি উপলক্ষে কাজ করে সেই সরঞ্জামটি ব্যবহার করবেন …

6
আর ব্যবহার করে লাসো ভবিষ্যদ্বাণী করার মানক ত্রুটি
আমি পূর্বাভাসের জন্য একটি লাসো মডেল ব্যবহার করার চেষ্টা করছি এবং আমার স্ট্যান্ডার্ড ত্রুটিগুলি অনুমান করতে হবে। নিশ্চয়ই এটি করার জন্য কেউ ইতিমধ্যে একটি প্যাকেজ লিখেছেন। তবে যতদূর আমি দেখতে পাচ্ছি, ল্যাশো ব্যবহার করে ভবিষ্যদ্বাণী করে এমন CRAN- র কোনও প্যাকেজই সেই ভবিষ্যদ্বাণীগুলির জন্য মানক ত্রুটিগুলি ফিরিয়ে দেবে না। সুতরাং …

5
উল্লেখযোগ্য ফলাফল না পাওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা টাইপ আই ত্রুটির হার বাড়ায়?
আমি ঠিক ভাবছিলাম যে কোনও গুরুত্বপূর্ণ ফলাফল (যেমন, ) প্রাপ্ত না হওয়া পর্যন্ত কেন ডেটা সংগ্রহ করা (যেমন, পি-হ্যাকিং) টাইপ আই ত্রুটির হার বৃদ্ধি করে?পি < .05p<.05p \lt .05 আমি Rএই ঘটনার একটি প্রদর্শনের জন্য অত্যন্ত প্রশংসা করব ।

4
কেন স্থায়ী স্বতঃসংশোধনের জন্য কোনও জিএএম অ্যাকাউন্টে অক্ষাংশ এবং দ্রাঘিমাংশ অন্তর্ভুক্ত করে?
আমি বন উজানের জন্য সাধারণীকরণযোগ্য মডেল তৈরি করেছি। স্থানিক-স্বতঃসংশোধনের জন্য অ্যাকাউন্ট করতে আমি অক্ষাংশ এবং দ্রাঘিমাংশকে স্মুথড, ইন্টারঅ্যাকশন শব্দ (অর্থাত্ s (x, y)) হিসাবে অন্তর্ভুক্ত করেছি। আমি এটি অনেকগুলি কাগজপত্র পড়ার উপর ভিত্তি করে তৈরি করেছি যেখানে লেখকরা বলছেন 'স্থানিক স্বতঃসংশোধনের জন্য অ্যাকাউন্টিং করতে, পয়েন্টের স্থানাঙ্কগুলি স্মুথ পদ হিসাবে অন্তর্ভুক্ত …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.