পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
অন্য কিছুর পরিবর্তে সিগময়েড ফাংশন কেন?
ডি-ফ্যাক্টো স্ট্যান্ডার্ড সিগময়েড ফাংশন, , (অ-গভীর) নিউরাল-নেটওয়ার্ক এবং লজিস্টিক রিগ্রেশন এ এত জনপ্রিয় কেন?11+e−x11+ +ই-এক্স\frac{1}{1+e^{-x}} দ্রুত গণনার সময় বা ধীরে ধীরে ক্ষয় সহ আমরা কেন অন্যান্য অন্যান্য ব্যয়যোগ্য ফাংশন ব্যবহার করি না (সুতরাং বিন্যাসের গ্রেডিয়েন্ট কম হয়)। সিগময়েড ফাংশন সম্পর্কে উইকিপিডিয়ায় কয়েকটি উদাহরণ রয়েছে । ধীর ক্ষয় এবং দ্রুত হিসাব …

6
সিমুলেশন কখন ব্যবহার করবেন?
সুতরাং এটি একটি খুব সাধারণ এবং মূ .় প্রশ্ন। যাইহোক, আমি যখন স্কুলে ছিলাম তখন ক্লাসে সিমুলেশনগুলির সম্পূর্ণ ধারণার দিকে আমি খুব কম মনোযোগ দিয়েছিলাম এবং এটি আমাকে সেই প্রক্রিয়া থেকে কিছুটা আতঙ্কিত করে রেখেছিল। আপনি কি সাধারণ লোকদের ক্ষেত্রে সিমুলেশন প্রক্রিয়াটি ব্যাখ্যা করতে পারেন? (ডেটা তৈরি করার জন্য হতে …
40 simulation 

5
আর-এ সাবধানতা - চি-স্কোয়ারের আনুমানিকতা ভুল হতে পারে
আমার কাছে ফায়ার ফাইটার প্রবেশিকা পরীক্ষার ফলাফলগুলি দেখানো ডেটা রয়েছে। আমি এই অনুমানটি পরীক্ষা করছি যে পরীক্ষার ফলাফল এবং জাতিগততা পারস্পরিক স্বতন্ত্র নয়। এই পরীক্ষা করার জন্য, আমি আর একটি পিয়ারসন চি-স্কোয়ার পরীক্ষা ফলাফল দেখান আমি যা প্রত্যাশা দৌড়ে, কিন্তু এটা যে একটি সতর্কবার্তা দিয়েছে " In chisq.test(a) : Chi-squared …

5
কীভাবে রিজ রিগ্রেশন সলিউশন পাবেন?
রিজ রিগ্রেশনটির জন্য সমাধানটির ব্যয় নিয়ে আমার কিছু সমস্যা রয়েছে। আমি নিয়মিতকরণ শব্দটি ছাড়াই রিগ্রেশন সমাধানটি জানি: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. তবে ব্যয় কার্যক্রমে L2 শব্দটি করার পরে সমাধান কীভাবে আসেλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.

4
শ্রেণিবিন্যাসে প্রত্যাহার এবং যথার্থতা
আমি প্রত্যাহার এবং নির্ভুলতার কয়েকটি সংজ্ঞা পড়েছি, যদিও তথ্য পুনরুদ্ধারের প্রসঙ্গে এটি প্রতিটি সময়। আমি ভাবছিলাম যদি কেউ শ্রেণিবিন্যাসের প্রসঙ্গে এটি আরও কিছুটা ব্যাখ্যা করতে পারে এবং সম্ভবত কিছু উদাহরণ বর্ণনা করতে পারে। উদাহরণস্বরূপ বলুন আমার কাছে একটি বাইনারি শ্রেণিবদ্ধ রয়েছে যা আমাকে 60০% এর যথার্থতা দেয় এবং ৯৯% এর …

3
গ্ল্যামনেট ব্যবহার করে লাসোর ফলাফল কীভাবে উপস্থাপন করবেন?
আমি 30 টি স্বতন্ত্র ভেরিয়েবলের সেট থেকে অবিচ্ছিন্ন নির্ভরশীল ভেরিয়েবলের জন্য ভবিষ্যদ্বাণী খুঁজে পেতে চাই। আমি আরএস এর গ্ল্যামনেট প্যাকেজে প্রয়োগ হিসাবে লাসো রিগ্রেশন ব্যবহার করছি some এখানে কিছু ডামি কোড রয়েছে: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) # …

2
কুকের দূরত্বের প্লটগুলি কীভাবে পড়বেন?
7, 16 এবং 29 পয়েন্টগুলি প্রভাবশালী পয়েন্ট কিনা তা কী কীভাবে কাজ করতে হয় তা কি কেউ জানেন? আমি কোথাও পড়েছি যে কুকের দূরত্ব 1 এর চেয়ে কম, তারা হয় না। আমি কি সঠিক?

3
, বা
আমি এই সম্পর্কে কিছুক্ষণ ধরে ভাবছিলাম; হঠাৎ করে কীভাবে ঘটে তা আমি কিছুটা অদ্ভুত বলে মনে করি। মূলত, ZnZnZ_n মতো মসৃণ করার জন্য আমাদের কেন কেবল তিনটি ইউনিফর্মের প্রয়োজন ? এবং কেন স্মুথিং আউট তুলনামূলকভাবে দ্রুত ঘটে? Z2Z2Z_2 : Z3Z3Z_3 : (জন ডি কুকের ব্লগ থেকে নির্লজ্জভাবে চুরি করা চিত্র: …

3
লুকানো মার্কভ মডেল এবং নিউরাল নেটওয়ার্কগুলির মধ্যে পার্থক্য কী?
আমি পরিসংখ্যানগুলিতে কেবল আমার পা ভেজাচ্ছি তাই এই প্রশ্নের অর্থ যদি না বোঝায় তবে আমি দুঃখিত। আমি কোনও অনুসন্ধান ইঞ্জিনে ব্যবহারকারীদের ক্লিকগুলি অধ্যয়ন করতে লুকানো রাজ্যগুলি (অন্যায় ক্যাসিনো, ডাইস রোলস ইত্যাদি) এবং নিউরাল নেটওয়ার্কগুলির পূর্বাভাস দেওয়ার জন্য মার্কভ মডেলগুলি ব্যবহার করেছি। উভয়েরই গোপনীয় অবস্থা ছিল যে আমরা পর্যবেক্ষণগুলি ব্যবহার করে …

1
বুটস্ট্র্যাপিং বা মন্টি কার্লো পদ্ধতির ব্যবহার করে কীভাবে উল্লেখযোগ্য প্রধান উপাদানগুলি নির্ধারণ করা যায়?
একটি প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) বা এমিরিকাল অর্থোগোনাল ফাংশন (ইওএফ) বিশ্লেষণ থেকে বেরিয়ে আসা উল্লেখযোগ্য নিদর্শনগুলির সংখ্যা নির্ধারণে আমি আগ্রহী। আমি জলবায়ু ডেটাতে এই পদ্ধতিটি প্রয়োগ করতে বিশেষভাবে আগ্রহী। ডেটা ক্ষেত্রটি একটি এমএক্সএন ম্যাট্রিক্স যা এম টাইম ডাইমেনশন (যেমন দিন) এবং এন স্থানিক মাত্রা (যেমন দীর্ঘ / ল্যাট অবস্থান) lat …
40 r  pca  bootstrap  monte-carlo 

15
প্লট তৈরি করার সময় আমার কোন সেরা অনুশীলনগুলি অনুসরণ করা উচিত?
প্লট তৈরি করার সময় আমি সাধারণত আমার নিজস্ব আইডিসিঙ্ক্রেটিক পছন্দ করি। তবে আমি ভাবছি প্লট তৈরির জন্য যদি কোনও সেরা অনুশীলন থাকে are দ্রষ্টব্য: এই প্রশ্নের উত্তরে রবের মন্তব্যটি এখানে খুব প্রাসঙ্গিক।

13
মন্টি হলের সমস্যা - আমাদের অন্তর্দৃষ্টি কোথায় ব্যর্থ হয়?
উইকিপিডিয়া থেকে: মনে করুন আপনি কোনও গেম শোতে এসেছেন এবং আপনাকে তিনটি দরজার পছন্দ দেওয়া হয়েছে: একটি দরজার পিছনে একটি গাড়ি; অন্যের পিছনে, ছাগল আপনি একটি দরজা বাছাই করুন, 1 নম্বরে বলুন, এবং হোস্ট যিনি দরজার পিছনে কী তা জানেন, অন্য একটি দরজা খুললেন, নং 3 বলুন, যার একটি ছাগল …

4
রেকটাইনার অ্যাক্টিভেশন ফাংশন কীভাবে নিউরাল নেটওয়ার্কগুলিতে বিলুপ্ত গ্রেডিয়েন্ট সমস্যা সমাধান করে?
নিউরাল নেটওয়ার্কগুলির জন্য বিলুপ্ত গ্রেডিয়েন্ট সমস্যার সমাধান হিসাবে আমি বেশ কয়েকটি স্থানে প্রশংসিত লিনিয়ার ইউনিট (আরএলইউ) পেয়েছি । এটি, সক্রিয়করণ ফাংশন হিসাবে এক সর্বোচ্চ (0, x) ব্যবহার করে। যখন অ্যাক্টিভেশনটি ইতিবাচক হয়, তবে স্পষ্টতই বলা যায় যে এটি সিগময়েড অ্যাক্টিভেশন ফাংশনটির চেয়ে ভাল, যেহেতু এর এক্সেরিভিশনটি সর্বদা বড় এক্স এর …

3
সাধারণ বিচ্যুতি আমাদের অস্বাভাবিক বিতরণে কী বলে?
একটি সাধারণ বিতরণে, 68-95-99.7 বিধি স্ট্যান্ডার্ড বিচ্যুতিকে প্রচুর অর্থ প্রদান করে, তবে সাধারণ বিচ্যুতির (মাল্টিমোডাল বা স্কিউড) স্ট্যান্ডার্ড বিচ্যুতির অর্থ কী? সমস্ত ডেটা মানগুলি এখনও 3 স্ট্যান্ডার্ড বিচ্যুতির মধ্যে পড়বে? অ-সাধারণ বিতরণের জন্য আমাদের কি 68-95-99.7 এর মতো বিধি রয়েছে?

3
নিপীড়নে দমন প্রভাব: সংজ্ঞা এবং চাক্ষুষ ব্যাখ্যা / চিত্রণ
একাধিক প্রতিরোধের মধ্যে একটি দমনকারী পরিবর্তনশীল কী এবং চাক্ষুষভাবে দমন প্রভাব প্রদর্শন করার উপায়গুলি কী হতে পারে (এর যান্ত্রিকতা বা ফলাফলগুলিতে তার প্রমাণ)? যাদের ভাবনা আছে তাদের ভাগ করে নেওয়ার জন্য আমি আমন্ত্রন জানাতে চাই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.