পরিসংখ্যান এবং বড় তথ্য

4

একটি "অপরিবর্তনীয় পূর্ব" কি? আমরা কি সত্যই কোনও তথ্য সহ এমন কোনও জিনিস পেতে পারি?

এই প্রশ্ন থেকে একটি মন্তব্য দ্বারা অনুপ্রাণিত : আমরা কোন পূর্ববর্তীগুলিতে "অপ্রয়োজনীয়" বিবেচনা করব - এবং অনুমিত অপ্রয়োজনীয় পূর্বে কোন তথ্য রয়েছে? আমি সাধারণত একটি বিশ্লেষণে পূর্ববর্তীটি দেখতে পাই যেখানে এটি হয় ঘন ঘনবাদী ধরণের বিশ্লেষণ বায়েশীয় বিশ্লেষণ থেকে কিছু সুন্দর অংশ ধার করার চেষ্টা করা হয় (এটি করার মতো …

73 bayesian prior

4

স্নায়ুবহুল নেটওয়ার্কগুলি আরও গভীরতর হয়ে উঠছে, তবে প্রশস্ত নয় কেন?

সাম্প্রতিক বছরগুলিতে, কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলি (বা সম্ভবত গভীরভাবে নিউরাল নেটওয়ার্কগুলি) গভীর ও গভীরতর হয়েছে, অত্যাধুনিক নেটওয়ার্কগুলি 4 স্তরের স্থানে 7 স্তর ( অ্যালেক্সনেট ) থেকে 1000 স্তর ( অবশেষ জাল) পর্যন্ত চলেছে বছর। গভীর নেটওয়ার্ক থেকে কর্মক্ষমতা বাড়ানোর পেছনের কারণটি হ'ল আরও জটিল, অ-লিনিয়ার ফাংশন শেখা যায়। পর্যাপ্ত প্রশিক্ষণের ডেটা …

72 machine-learning classification neural-networks deep-learning conv-neural-network

8

মাল্টিক্লাস-মাল্টিলেবল শ্রেণিবদ্ধকরণের জন্য কীভাবে নির্ভুলতা / রিক্যাল গণনা করা যায়?

আমি ভাবছি যে কীভাবে নির্ভুলতা গণনা করতে হবে এবং মাল্টিক্লাস মাল্টিলেবল শ্রেণিবদ্ধকরণের জন্য প্রতিকারগুলি পুনরুদ্ধার করতে হবে, যেখানে শ্রেণিবিন্যাস যেখানে দুটির বেশি লেবেল রয়েছে এবং যেখানে প্রতিটি উদাহরণে একাধিক লেবেল থাকতে পারে?

72 machine-learning classification precision-recall multi-class

7

একাধিক প্রতিরোধের জন্য সর্বনিম্ন নমুনার আকারের জন্য থাম্বের বিধি

সামাজিক বিজ্ঞানের একটি গবেষণা প্রস্তাবের প্রসঙ্গে, আমাকে নিম্নলিখিত প্রশ্ন জিজ্ঞাসা করা হয়েছিল: একাধিক রিগ্রেশনের জন্য সর্বনিম্ন নমুনার আকার নির্ধারণ করার সময় আমি সর্বদা 100 + মি (যেখানে মি প্রেডিক্টরের সংখ্যা) চলে এসেছি। এটা কি উপযুক্ত? আমি প্রায় একইভাবে বিভিন্ন থাম্বের নিয়ম সহ একই প্রশ্ন পাই rules আমি বিভিন্ন পাঠ্যপুস্তকেও থাম্বের …

72 regression sample-size power-analysis rule-of-thumb

14

কখন (যদি কখনও হয়) ঘন ঘনবাদী দৃষ্টিভঙ্গি কোনও বায়েশিয়ানের চেয়ে যথেষ্ট ভাল?

পটভূমি : আমার বায়েশিয়ান পরিসংখ্যান সম্পর্কে আনুষ্ঠানিক প্রশিক্ষণ নেই (যদিও আমি আরও শিখতে আগ্রহী), তবে আমি যথেষ্ট জানি - আমি মনে করি - কেন অনেকে মনে করেন যে তারা ফ্রিকোয়েন্সিস্ট পরিসংখ্যানের চেয়ে বেশি পছন্দ করে কেন তার সংক্ষিপ্তসার পেতে পারেন। এমনকি আমি প্রাথমিক শিক্ষার পরিসংখ্যান (সামাজিক বিজ্ঞান) শ্রেণীর স্নাতকদেরও বায়সিয়ান …

72 bayesian frequentist philosophical

7

ইউক্লিডিয়ান দূরত্ব সাধারণত বিরল ডেটার জন্য ভাল হয় না?

আমি কোথাও দেখেছি যে ক্লাসিকাল দূরত্বগুলি (ইউক্লিডিয়ান দূরত্বের মতো) দুর্বলভাবে বৈষম্যমূলক হয়ে ওঠে যখন আমাদের কাছে বহুমাত্রিক এবং বিরল ডেটা থাকে। কেন? ইউক্লিডিয়ান দূরত্ব ভাল সঞ্চালন করে না এমন দুটি স্পার ডেটা ভেক্টরের উদাহরণ রয়েছে কি? এক্ষেত্রে আমাদের কোন মিল খুঁজে পাওয়া উচিত?

72 machine-learning clustering data-mining sparse euclidean

4

পোয়েসন এবং তাত্পর্যপূর্ণ বিতরণের মধ্যে সম্পর্ক

পইসন বিতরণের জন্য অপেক্ষার সময়গুলি প্যারামিটার ল্যাম্বডা সহ একটি সূচকীয় বিতরণ। তবে আমি এটা বুঝতে পারি না। পয়সন উদাহরণ হিসাবে উদাহরণস্বরূপ প্রতি ইউনিট সময়ে আগতদের সংখ্যা। এটি কীভাবে তাত্পর্যপূর্ণ বিতরণের সাথে সম্পর্কিত? আসুন বলি যে সময়ের এককের কে আসার সম্ভাবনা হ'ল পি (কে) (পোইসন মডেলিং) এবং কে + 1 এর …

72 distributions poisson-distribution exponential

10

লিনিয়ার রিগ্রেশন সম্পর্কিত সাধারণ অনুমানের একটি সম্পূর্ণ তালিকা কী?

রৈখিক প্রতিরোধের জন্য সাধারণ অনুমানগুলি কী কী? তারা কি অন্তর্ভুক্ত: স্বাধীন এবং নির্ভরশীল ভেরিয়েবলের মধ্যে একটি লিনিয়ার সম্পর্ক স্বাধীন ত্রুটি ত্রুটিগুলির সাধারণ বিতরণ homoscedasticity অন্য কেউ আছে?

72 regression assumptions

13

শ্যাননের এন্ট্রপিতে লগারিদমের ভূমিকা কী?

শ্যাননের এন্ট্রপি প্রতিটি ফলাফলের সম্ভাবনার সংখ্যার নেতিবাচক প্রতিটি ফলাফলের জন্য সম্ভাবনার লগারিদম দ্বারা গুণিত হয়। লগারিদম এই সমীকরণে কী উদ্দেশ্যে কাজ করে? একটি স্বজ্ঞাত বা চাক্ষুষ উত্তর (একটি গভীর গাণিতিক উত্তরের বিপরীতে) বোনাস পয়েন্ট দেওয়া হবে!

72 entropy intuition sequence-analysis

2

রিজ রিগ্রেশনকে কেন "রিজ" বলা হয়, কেন এটির প্রয়োজন হয় এবং অনন্ত হয়ে গেলে কী ঘটে ?

রিজ রিগ্রেশন সহগের প্রাক্কলন মানগুলি যা হ্রাস করেβ^Rβ^R\hat{\beta}^R RSS+λ∑j=1pβ2j.RSS+λ∑j=1pβj2. \text{RSS} + \lambda \sum_{j=1}^p\beta_j^2. আমার প্রশ্নগুলি হ'ল: যদি , তবে আমরা দেখতে পাচ্ছি যে উপরের অভিব্যক্তিটি স্বাভাবিক আরএসএসে হ্রাস পায়। কি হবে যদি ? সহগের আচরণের পাঠ্যপুস্তকের ব্যাখ্যাটি আমি বুঝতে পারি না।λ=0λ=0\lambda = 0λ→∞λ→∞\lambda \to \infty একটি নির্দিষ্ট শব্দটির পিছনে ধারণাটি …

71 ridge-regression statistical-learning history

8

দক্ষতা মেশিন শিখতে পাওয়া?

দেখে মনে হচ্ছে ডেটা মাইনিং এবং মেশিন লার্নিং এত জনপ্রিয় হয়ে উঠেছে যে এখন প্রায় প্রতিটি সিএস শিক্ষার্থী শ্রেণিবদ্ধ, ক্লাস্টারিং, স্ট্যাটিস্টিকাল এনএলপি ... ইত্যাদি সম্পর্কে জানে তাই তাই মনে হয় যে ডেটা মাইনারদের সন্ধান করা আজকাল কোনও কঠিন কাজ নয়। আমার প্রশ্ন: একটি ডেটা মাইনার কী কী দক্ষতা শিখতে পারে …

71 machine-learning data-mining

2

বন্ধ-ফর্ম বনাম গ্রেডিয়েন্ট বংশোদ্ভূত মধ্যে রিগ্রেশন পরামিতিগুলির জন্য সমাধান

অ্যান্ড্রু এনগের মেশিন লার্নিং কোর্সে তিনি লিনিয়ার রিগ্রেশন এবং লজিস্টিক রিগ্রেশন প্রবর্তন করেছেন এবং গ্রেডিয়েন্ট বংশোদ্ভূত এবং নিউটনের পদ্ধতি ব্যবহার করে মডেল পরামিতিগুলি কীভাবে ফিট করবেন তা দেখায়। আমি জানি যে গ্রেডিয়েন্ট বংশোদ্ভূত মেশিন লার্নিংয়ের কয়েকটি অ্যাপ্লিকেশনগুলিতে (যেমন, ব্যাকপ্রোপেশন) দরকারী হতে পারে, তবে আরও সাধারণ ক্ষেত্রে আপনি বদ্ধ আকারে প্যারামিটারগুলির …

71 regression machine-learning logistic gradient-descent

2

আর [বদ্ধ] মধ্যে সদৃশ সারি ডেটা ফ্রেম সরিয়ে ফেলা হচ্ছে

এই উদাহরণের ডেটা ফ্রেম থেকে আমি সদৃশ সারিগুলি কীভাবে সরিয়ে ফেলব? A 1 A 1 A 2 B 4 B 1 B 1 C 2 C 2 আমি উভয় কলামের উপর ভিত্তি করে সদৃশগুলি মুছে ফেলতে চাই: A 1 A 2 B 4 B 1 C 2 অর্ডার গুরুত্বপূর্ণ নয়।

71 r

7

প্রধান উপাদান স্কোর কি?

প্রধান উপাদান স্কোর (পিসি স্কোর, পিসিএ স্কোর) কি কি?

71 pca definition

15

আর ব্যবহার করে পুনরুত্পাদনযোগ্য গবেষণা সম্পূর্ণরূপে উদাহরণ

প্রশ্ন: নিখরচায় অনলাইনে উপলব্ধ যে আর ব্যবহার করে পুনরুত্পাদনযোগ্য গবেষণার কোনও ভাল উদাহরণ আছে ? আদর্শ উদাহরণ: বিশেষত আদর্শ উদাহরণগুলি প্রদান করবে: কাঁচা ডেটা (এবং আদর্শভাবে ডেটা ব্যাখ্যা করে মেটা ডেটা), ডেটা আমদানি, প্রক্রিয়াকরণ, বিশ্লেষণ এবং আউটপুট উত্পাদন সহ সমস্ত আর কোড, চূড়ান্ত আউটপুটটিকে চূড়ান্ত নথির সাথে সংযুক্ত করার জন্য …

71 r references reproducible-research