পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
একটি "অপরিবর্তনীয় পূর্ব" কি? আমরা কি সত্যই কোনও তথ্য সহ এমন কোনও জিনিস পেতে পারি?
এই প্রশ্ন থেকে একটি মন্তব্য দ্বারা অনুপ্রাণিত : আমরা কোন পূর্ববর্তীগুলিতে "অপ্রয়োজনীয়" বিবেচনা করব - এবং অনুমিত অপ্রয়োজনীয় পূর্বে কোন তথ্য রয়েছে? আমি সাধারণত একটি বিশ্লেষণে পূর্ববর্তীটি দেখতে পাই যেখানে এটি হয় ঘন ঘনবাদী ধরণের বিশ্লেষণ বায়েশীয় বিশ্লেষণ থেকে কিছু সুন্দর অংশ ধার করার চেষ্টা করা হয় (এটি করার মতো …
73 bayesian  prior 

4
স্নায়ুবহুল নেটওয়ার্কগুলি আরও গভীরতর হয়ে উঠছে, তবে প্রশস্ত নয় কেন?
সাম্প্রতিক বছরগুলিতে, কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলি (বা সম্ভবত গভীরভাবে নিউরাল নেটওয়ার্কগুলি) গভীর ও গভীরতর হয়েছে, অত্যাধুনিক নেটওয়ার্কগুলি 4 স্তরের স্থানে 7 স্তর ( অ্যালেক্সনেট ) থেকে 1000 স্তর ( অবশেষ জাল) পর্যন্ত চলেছে বছর। গভীর নেটওয়ার্ক থেকে কর্মক্ষমতা বাড়ানোর পেছনের কারণটি হ'ল আরও জটিল, অ-লিনিয়ার ফাংশন শেখা যায়। পর্যাপ্ত প্রশিক্ষণের ডেটা …

8
মাল্টিক্লাস-মাল্টিলেবল শ্রেণিবদ্ধকরণের জন্য কীভাবে নির্ভুলতা / রিক্যাল গণনা করা যায়?
আমি ভাবছি যে কীভাবে নির্ভুলতা গণনা করতে হবে এবং মাল্টিক্লাস মাল্টিলেবল শ্রেণিবদ্ধকরণের জন্য প্রতিকারগুলি পুনরুদ্ধার করতে হবে, যেখানে শ্রেণিবিন্যাস যেখানে দুটির বেশি লেবেল রয়েছে এবং যেখানে প্রতিটি উদাহরণে একাধিক লেবেল থাকতে পারে?

7
একাধিক প্রতিরোধের জন্য সর্বনিম্ন নমুনার আকারের জন্য থাম্বের বিধি
সামাজিক বিজ্ঞানের একটি গবেষণা প্রস্তাবের প্রসঙ্গে, আমাকে নিম্নলিখিত প্রশ্ন জিজ্ঞাসা করা হয়েছিল: একাধিক রিগ্রেশনের জন্য সর্বনিম্ন নমুনার আকার নির্ধারণ করার সময় আমি সর্বদা 100 + মি (যেখানে মি প্রেডিক্টরের সংখ্যা) চলে এসেছি। এটা কি উপযুক্ত? আমি প্রায় একইভাবে বিভিন্ন থাম্বের নিয়ম সহ একই প্রশ্ন পাই rules আমি বিভিন্ন পাঠ্যপুস্তকেও থাম্বের …

14
কখন (যদি কখনও হয়) ঘন ঘনবাদী দৃষ্টিভঙ্গি কোনও বায়েশিয়ানের চেয়ে যথেষ্ট ভাল?
পটভূমি : আমার বায়েশিয়ান পরিসংখ্যান সম্পর্কে আনুষ্ঠানিক প্রশিক্ষণ নেই (যদিও আমি আরও শিখতে আগ্রহী), তবে আমি যথেষ্ট জানি - আমি মনে করি - কেন অনেকে মনে করেন যে তারা ফ্রিকোয়েন্সিস্ট পরিসংখ্যানের চেয়ে বেশি পছন্দ করে কেন তার সংক্ষিপ্তসার পেতে পারেন। এমনকি আমি প্রাথমিক শিক্ষার পরিসংখ্যান (সামাজিক বিজ্ঞান) শ্রেণীর স্নাতকদেরও বায়সিয়ান …

7
ইউক্লিডিয়ান দূরত্ব সাধারণত বিরল ডেটার জন্য ভাল হয় না?
আমি কোথাও দেখেছি যে ক্লাসিকাল দূরত্বগুলি (ইউক্লিডিয়ান দূরত্বের মতো) দুর্বলভাবে বৈষম্যমূলক হয়ে ওঠে যখন আমাদের কাছে বহুমাত্রিক এবং বিরল ডেটা থাকে। কেন? ইউক্লিডিয়ান দূরত্ব ভাল সঞ্চালন করে না এমন দুটি স্পার ডেটা ভেক্টরের উদাহরণ রয়েছে কি? এক্ষেত্রে আমাদের কোন মিল খুঁজে পাওয়া উচিত?

4
পোয়েসন এবং তাত্পর্যপূর্ণ বিতরণের মধ্যে সম্পর্ক
পইসন বিতরণের জন্য অপেক্ষার সময়গুলি প্যারামিটার ল্যাম্বডা সহ একটি সূচকীয় বিতরণ। তবে আমি এটা বুঝতে পারি না। পয়সন উদাহরণ হিসাবে উদাহরণস্বরূপ প্রতি ইউনিট সময়ে আগতদের সংখ্যা। এটি কীভাবে তাত্পর্যপূর্ণ বিতরণের সাথে সম্পর্কিত? আসুন বলি যে সময়ের এককের কে আসার সম্ভাবনা হ'ল পি (কে) (পোইসন মডেলিং) এবং কে + 1 এর …

10
লিনিয়ার রিগ্রেশন সম্পর্কিত সাধারণ অনুমানের একটি সম্পূর্ণ তালিকা কী?
রৈখিক প্রতিরোধের জন্য সাধারণ অনুমানগুলি কী কী? তারা কি অন্তর্ভুক্ত: স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি লিনিয়ার সম্পর্ক স্বাধীন ত্রুটি ত্রুটিগুলির সাধারণ বিতরণ homoscedasticity অন্য কেউ আছে?

13
শ্যাননের এন্ট্রপিতে লগারিদমের ভূমিকা কী?
শ্যাননের এন্ট্রপি প্রতিটি ফলাফলের সম্ভাবনার সংখ্যার নেতিবাচক প্রতিটি ফলাফলের জন্য সম্ভাবনার লগারিদম দ্বারা গুণিত হয়। লগারিদম এই সমীকরণে কী উদ্দেশ্যে কাজ করে? একটি স্বজ্ঞাত বা চাক্ষুষ উত্তর (একটি গভীর গাণিতিক উত্তরের বিপরীতে) বোনাস পয়েন্ট দেওয়া হবে!

2
রিজ রিগ্রেশনকে কেন "রিজ" বলা হয়, কেন এটির প্রয়োজন হয় এবং অনন্ত হয়ে গেলে কী ঘটে ?
রিজ রিগ্রেশন সহগের প্রাক্কলন মানগুলি যা হ্রাস করেβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. আমার প্রশ্নগুলি হ'ল: যদি , তবে আমরা দেখতে পাচ্ছি যে উপরের অভিব্যক্তিটি স্বাভাবিক আরএসএসে হ্রাস পায়। কি হবে যদি ? সহগের আচরণের পাঠ্যপুস্তকের ব্যাখ্যাটি আমি বুঝতে পারি না।λ=0λ=0\lambda = 0λ→∞λ→∞\lambda \to \infty একটি নির্দিষ্ট শব্দটির পিছনে ধারণাটি …

8
দক্ষতা মেশিন শিখতে পাওয়া?
দেখে মনে হচ্ছে ডেটা মাইনিং এবং মেশিন লার্নিং এত জনপ্রিয় হয়ে উঠেছে যে এখন প্রায় প্রতিটি সিএস শিক্ষার্থী শ্রেণিবদ্ধ, ক্লাস্টারিং, স্ট্যাটিস্টিকাল এনএলপি ... ইত্যাদি সম্পর্কে জানে তাই তাই মনে হয় যে ডেটা মাইনারদের সন্ধান করা আজকাল কোনও কঠিন কাজ নয়। আমার প্রশ্ন: একটি ডেটা মাইনার কী কী দক্ষতা শিখতে পারে …

2
বন্ধ-ফর্ম বনাম গ্রেডিয়েন্ট বংশোদ্ভূত মধ্যে রিগ্রেশন পরামিতিগুলির জন্য সমাধান
অ্যান্ড্রু এনগের মেশিন লার্নিং কোর্সে তিনি লিনিয়ার রিগ্রেশন এবং লজিস্টিক রিগ্রেশন প্রবর্তন করেছেন এবং গ্রেডিয়েন্ট বংশোদ্ভূত এবং নিউটনের পদ্ধতি ব্যবহার করে মডেল পরামিতিগুলি কীভাবে ফিট করবেন তা দেখায়। আমি জানি যে গ্রেডিয়েন্ট বংশোদ্ভূত মেশিন লার্নিংয়ের কয়েকটি অ্যাপ্লিকেশনগুলিতে (যেমন, ব্যাকপ্রোপেশন) দরকারী হতে পারে, তবে আরও সাধারণ ক্ষেত্রে আপনি বদ্ধ আকারে প্যারামিটারগুলির …

2
আর [বদ্ধ] মধ্যে সদৃশ সারি ডেটা ফ্রেম সরিয়ে ফেলা হচ্ছে
এই উদাহরণের ডেটা ফ্রেম থেকে আমি সদৃশ সারিগুলি কীভাবে সরিয়ে ফেলব? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 আমি উভয় কলামের উপর ভিত্তি করে সদৃশগুলি মুছে ফেলতে চাই: A 1 A 2 B 4 B 1 C 2 অর্ডার গুরুত্বপূর্ণ নয়।
71 r 


15
আর ব্যবহার করে পুনরুত্পাদনযোগ্য গবেষণা সম্পূর্ণরূপে উদাহরণ
প্রশ্ন: নিখরচায় অনলাইনে উপলব্ধ যে আর ব্যবহার করে পুনরুত্পাদনযোগ্য গবেষণার কোনও ভাল উদাহরণ আছে ? আদর্শ উদাহরণ: বিশেষত আদর্শ উদাহরণগুলি প্রদান করবে: কাঁচা ডেটা (এবং আদর্শভাবে ডেটা ব্যাখ্যা করে মেটা ডেটা), ডেটা আমদানি, প্রক্রিয়াকরণ, বিশ্লেষণ এবং আউটপুট উত্পাদন সহ সমস্ত আর কোড, চূড়ান্ত আউটপুটটিকে চূড়ান্ত নথির সাথে সংযুক্ত করার জন্য …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.