পরিসংখ্যান এবং বড় তথ্য

4

ডি-ফ্যাক্টো স্ট্যান্ডার্ড সিগময়েড ফাংশন, , (অ-গভীর) নিউরাল-নেটওয়ার্ক এবং লজিস্টিক রিগ্রেশন এ এত জনপ্রিয় কেন?11+e−x11+ +ই-এক্স\frac{1}{1+e^{-x}} দ্রুত গণনার সময় বা ধীরে ধীরে ক্ষয় সহ আমরা কেন অন্যান্য অন্যান্য ব্যয়যোগ্য ফাংশন ব্যবহার করি না (সুতরাং বিন্যাসের গ্রেডিয়েন্ট কম হয়)। সিগময়েড ফাংশন সম্পর্কে উইকিপিডিয়ায় কয়েকটি উদাহরণ রয়েছে । ধীর ক্ষয় এবং দ্রুত হিসাব …

40 logistic neural-networks least-squares

6

সিমুলেশন কখন ব্যবহার করবেন?

সুতরাং এটি একটি খুব সাধারণ এবং মূ .় প্রশ্ন। যাইহোক, আমি যখন স্কুলে ছিলাম তখন ক্লাসে সিমুলেশনগুলির সম্পূর্ণ ধারণার দিকে আমি খুব কম মনোযোগ দিয়েছিলাম এবং এটি আমাকে সেই প্রক্রিয়া থেকে কিছুটা আতঙ্কিত করে রেখেছিল। আপনি কি সাধারণ লোকদের ক্ষেত্রে সিমুলেশন প্রক্রিয়াটি ব্যাখ্যা করতে পারেন? (ডেটা তৈরি করার জন্য হতে …

40 simulation

5

আর-এ সাবধানতা - চি-স্কোয়ারের আনুমানিকতা ভুল হতে পারে

আমার কাছে ফায়ার ফাইটার প্রবেশিকা পরীক্ষার ফলাফলগুলি দেখানো ডেটা রয়েছে। আমি এই অনুমানটি পরীক্ষা করছি যে পরীক্ষার ফলাফল এবং জাতিগততা পারস্পরিক স্বতন্ত্র নয়। এই পরীক্ষা করার জন্য, আমি আর একটি পিয়ারসন চি-স্কোয়ার পরীক্ষা ফলাফল দেখান আমি যা প্রত্যাশা দৌড়ে, কিন্তু এটা যে একটি সতর্কবার্তা দিয়েছে " In chisq.test(a) : Chi-squared …

40 r categorical-data chi-squared small-sample error-message

5

কীভাবে রিজ রিগ্রেশন সলিউশন পাবেন?

রিজ রিগ্রেশনটির জন্য সমাধানটির ব্যয় নিয়ে আমার কিছু সমস্যা রয়েছে। আমি নিয়মিতকরণ শব্দটি ছাড়াই রিগ্রেশন সমাধানটি জানি: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. তবে ব্যয় কার্যক্রমে L2 শব্দটি করার পরে সমাধান কীভাবে আসেλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.

40 regression least-squares regularization ridge-regression

4

শ্রেণিবিন্যাসে প্রত্যাহার এবং যথার্থতা

আমি প্রত্যাহার এবং নির্ভুলতার কয়েকটি সংজ্ঞা পড়েছি, যদিও তথ্য পুনরুদ্ধারের প্রসঙ্গে এটি প্রতিটি সময়। আমি ভাবছিলাম যদি কেউ শ্রেণিবিন্যাসের প্রসঙ্গে এটি আরও কিছুটা ব্যাখ্যা করতে পারে এবং সম্ভবত কিছু উদাহরণ বর্ণনা করতে পারে। উদাহরণস্বরূপ বলুন আমার কাছে একটি বাইনারি শ্রেণিবদ্ধ রয়েছে যা আমাকে 60০% এর যথার্থতা দেয় এবং ৯৯% এর …

40 machine-learning metric

3

গ্ল্যামনেট ব্যবহার করে লাসোর ফলাফল কীভাবে উপস্থাপন করবেন?

আমি 30 টি স্বতন্ত্র ভেরিয়েবলের সেট থেকে অবিচ্ছিন্ন নির্ভরশীল ভেরিয়েবলের জন্য ভবিষ্যদ্বাণী খুঁজে পেতে চাই। আমি আরএস এর গ্ল্যামনেট প্যাকেজে প্রয়োগ হিসাবে লাসো রিগ্রেশন ব্যবহার করছি some এখানে কিছু ডামি কোড রয়েছে: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # …

40 r multiple-regression lasso glmnet communication

2

কুকের দূরত্বের প্লটগুলি কীভাবে পড়বেন?

7, 16 এবং 29 পয়েন্টগুলি প্রভাবশালী পয়েন্ট কিনা তা কী কীভাবে কাজ করতে হয় তা কি কেউ জানেন? আমি কোথাও পড়েছি যে কুকের দূরত্ব 1 এর চেয়ে কম, তারা হয় না। আমি কি সঠিক?

40 r regression residuals diagnostic cooks-distance

3

, বা

আমি এই সম্পর্কে কিছুক্ষণ ধরে ভাবছিলাম; হঠাৎ করে কীভাবে ঘটে তা আমি কিছুটা অদ্ভুত বলে মনে করি। মূলত, ZnZnZ_n মতো মসৃণ করার জন্য আমাদের কেন কেবল তিনটি ইউনিফর্মের প্রয়োজন ? এবং কেন স্মুথিং আউট তুলনামূলকভাবে দ্রুত ঘটে? Z2Z2Z_2 : Z3Z3Z_3 : (জন ডি কুকের ব্লগ থেকে নির্লজ্জভাবে চুরি করা চিত্র: …

40 normal-distribution mathematical-statistics uniform central-limit-theorem

3

লুকানো মার্কভ মডেল এবং নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্য কী?

আমি পরিসংখ্যানগুলিতে কেবল আমার পা ভেজাচ্ছি তাই এই প্রশ্নের অর্থ যদি না বোঝায় তবে আমি দুঃখিত। আমি কোনও অনুসন্ধান ইঞ্জিনে ব্যবহারকারীদের ক্লিকগুলি অধ্যয়ন করতে লুকানো রাজ্যগুলি (অন্যায় ক্যাসিনো, ডাইস রোলস ইত্যাদি) এবং নিউরাল নেটওয়ার্কগুলির পূর্বাভাস দেওয়ার জন্য মার্কভ মডেলগুলি ব্যবহার করেছি। উভয়েরই গোপনীয় অবস্থা ছিল যে আমরা পর্যবেক্ষণগুলি ব্যবহার করে …

40 data-mining algorithms neural-networks markov-process

1

বুটস্ট্র্যাপিং বা মন্টি কার্লো পদ্ধতির ব্যবহার করে কীভাবে উল্লেখযোগ্য প্রধান উপাদানগুলি নির্ধারণ করা যায়?

একটি প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) বা এমিরিকাল অর্থোগোনাল ফাংশন (ইওএফ) বিশ্লেষণ থেকে বেরিয়ে আসা উল্লেখযোগ্য নিদর্শনগুলির সংখ্যা নির্ধারণে আমি আগ্রহী। আমি জলবায়ু ডেটাতে এই পদ্ধতিটি প্রয়োগ করতে বিশেষভাবে আগ্রহী। ডেটা ক্ষেত্রটি একটি এমএক্সএন ম্যাট্রিক্স যা এম টাইম ডাইমেনশন (যেমন দিন) এবং এন স্থানিক মাত্রা (যেমন দীর্ঘ / ল্যাট অবস্থান) lat …

40 r pca bootstrap monte-carlo

15

প্লট তৈরি করার সময় আমার কোন সেরা অনুশীলনগুলি অনুসরণ করা উচিত?

প্লট তৈরি করার সময় আমি সাধারণত আমার নিজস্ব আইডিসিঙ্ক্রেটিক পছন্দ করি। তবে আমি ভাবছি প্লট তৈরির জন্য যদি কোনও সেরা অনুশীলন থাকে are দ্রষ্টব্য: এই প্রশ্নের উত্তরে রবের মন্তব্যটি এখানে খুব প্রাসঙ্গিক।

40 data-visualization references

13

মন্টি হলের সমস্যা - আমাদের অন্তর্দৃষ্টি কোথায় ব্যর্থ হয়?

উইকিপিডিয়া থেকে: মনে করুন আপনি কোনও গেম শোতে এসেছেন এবং আপনাকে তিনটি দরজার পছন্দ দেওয়া হয়েছে: একটি দরজার পিছনে একটি গাড়ি; অন্যের পিছনে, ছাগল আপনি একটি দরজা বাছাই করুন, 1 নম্বরে বলুন, এবং হোস্ট যিনি দরজার পিছনে কী তা জানেন, অন্য একটি দরজা খুললেন, নং 3 বলুন, যার একটি ছাগল …

40 probability intuition puzzle

4

রেকটাইনার অ্যাক্টিভেশন ফাংশন কীভাবে নিউরাল নেটওয়ার্কগুলিতে বিলুপ্ত গ্রেডিয়েন্ট সমস্যা সমাধান করে?

নিউরাল নেটওয়ার্কগুলির জন্য বিলুপ্ত গ্রেডিয়েন্ট সমস্যার সমাধান হিসাবে আমি বেশ কয়েকটি স্থানে প্রশংসিত লিনিয়ার ইউনিট (আরএলইউ) পেয়েছি । এটি, সক্রিয়করণ ফাংশন হিসাবে এক সর্বোচ্চ (0, x) ব্যবহার করে। যখন অ্যাক্টিভেশনটি ইতিবাচক হয়, তবে স্পষ্টতই বলা যায় যে এটি সিগময়েড অ্যাক্টিভেশন ফাংশনটির চেয়ে ভাল, যেহেতু এর এক্সেরিভিশনটি সর্বদা বড় এক্স এর …

40 machine-learning neural-networks deep-learning gradient-descent

3

সাধারণ বিচ্যুতি আমাদের অস্বাভাবিক বিতরণে কী বলে?

একটি সাধারণ বিতরণে, 68-95-99.7 বিধি স্ট্যান্ডার্ড বিচ্যুতিকে প্রচুর অর্থ প্রদান করে, তবে সাধারণ বিচ্যুতির (মাল্টিমোডাল বা স্কিউড) স্ট্যান্ডার্ড বিচ্যুতির অর্থ কী? সমস্ত ডেটা মানগুলি এখনও 3 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পড়বে? অ-সাধারণ বিতরণের জন্য আমাদের কি 68-95-99.7 এর মতো বিধি রয়েছে?

40 normal-distribution standard-deviation skewness

3

নিপীড়নে দমন প্রভাব: সংজ্ঞা এবং চাক্ষুষ ব্যাখ্যা / চিত্রণ

একাধিক প্রতিরোধের মধ্যে একটি দমনকারী পরিবর্তনশীল কী এবং চাক্ষুষভাবে দমন প্রভাব প্রদর্শন করার উপায়গুলি কী হতে পারে (এর যান্ত্রিকতা বা ফলাফলগুলিতে তার প্রমাণ)? যাদের ভাবনা আছে তাদের ভাগ করে নেওয়ার জন্য আমি আমন্ত্রন জানাতে চাই।

40 multiple-regression data-visualization geometry suppressor