পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

10
বায়েশিয়ান বনাম ঘন ঘন বিতর্কটির জন্য কি কোনও * গাণিতিক * ভিত্তি রয়েছে?
এটি উইকিপিডিয়ায় বলেছেন যে: গণিত [সম্ভাব্যতার] সম্ভাবনার কোনও ব্যাখ্যার চেয়ে অনেকাংশেই স্বতন্ত্র। প্রশ্ন: তাহলে আমরা যদি গাণিতিকভাবে সঠিক হতে চাই, তবে আমাদের সম্ভাবনার কোনও ব্যাখ্যা বাতিল করা উচিত নয় ? অর্থাৎ বায়েশিয়ান এবং ঘনত্ব উভয়ই গণিতগতভাবে ভুল? আমি দর্শন পছন্দ করি না, তবে আমি গণিত পছন্দ করি, এবং আমি কোলমোগোরভের …

2
স্বাধীন উপাদান বিশ্লেষণ এবং ফ্যাক্টর বিশ্লেষণের মধ্যে সম্পর্ক কী?
আমি ইন্ডিপেন্ডেন্ট কম্পোনেন্ট অ্যানালাইসিস (আইসিএ) এ নতুন এবং পদ্ধতিটি সম্পর্কে কেবল প্রাথমিক ধারণা পেয়েছি। আমার কাছে মনে হয় যে আইসিএ একটি ব্যতিক্রম সহ ফ্যাক্টর অ্যানালাইসিস (এফএ) এর অনুরূপ: আইসিএ অনুমান করেছে যে পর্যবেক্ষণ করা এলোমেলো ভেরিয়েবলগুলি স্বাধীন উপাদান / উপাদানগুলির একটি রৈখিক সংমিশ্রণ যা অ গাউশিয়ান যেখানে ক্লাসিকাল এফএ মডেল …

3
সময় সিরিজ বিশ্লেষণের জন্য পুনরাবৃত্ত নিউরাল নেটওয়ার্ক ব্যবহারের সঠিক উপায়
পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলি তাদের "মেমোরি" স্তর রয়েছে এই বিষয়টি দ্বারা "নিয়মিত" আলাদা হয়। এই স্তরটির কারণে, বারবার এনএন'র সময় সিরিজ মডেলিংয়ে দরকারী বলে মনে করা হচ্ছে। তবে, আমি নিশ্চিত না যে এগুলি কীভাবে ব্যবহার করব আমি সঠিকভাবে বুঝতে পেরেছি। ধরা যাক আমার নিম্নলিখিত টাইম সিরিজ রয়েছে (বাম থেকে ডানে): [0, …

6
সম্ভাব্যতার মধ্যে বনাম প্রায় নিশ্চিত রূপান্তর
আমি এই দুটি পদক্ষেপের কনভার্সেশনের মধ্যে পার্থক্যটি সত্যই খুঁজে পাইনি। (বা আসলে, বিভিন্ন ধরণের রূপান্তরগুলির যে কোনও একটি, তবে আমি এই দুটি বিশেষত বিশেষত বৃহত সংখ্যার দুর্বল এবং শক্তিশালী আইনগুলির কারণে উল্লেখ করি)) অবশ্যই, আমি প্রত্যেকটির সংজ্ঞাটি উদ্ধৃত করতে পারি এবং তারা যেখানে পৃথক হয় তার একটি উদাহরণ দিতে পারি, …

8
অর্ডিনাল ডেটা ব্যবহারের জন্য ভাল বেসিক পরিসংখ্যানগুলি কী কী?
জরিপের প্রশ্ন থেকে আমার কাছে কিছু অর্ডিনাল ডেটা রয়েছে । আমার ক্ষেত্রে তারা লিকার্ট স্টাইলের প্রতিক্রিয়া ( দৃ St়ভাবে অসম্মতি-অসম্মতি-নিরপেক্ষ-সম্মতি-দৃr়ভাবে সম্মতি)। আমার ডেটাগুলিতে এগুলি 1-5 হিসাবে কোড করা হয়েছে। আমি মনে করি না যে এখানে অর্থগুলি অনেক বেশি বোঝায়, সুতরাং কোন মৌলিক সংক্ষিপ্ত পরিসংখ্যানকে দরকারী হিসাবে বিবেচনা করা হয়?

1
কোন সম্পর্কটি ম্যাট্রিক্সকে একবচনে পরিণত করে এবং এককত্ব বা কাছের-এককতার প্রভাব কী?
আমি বিভিন্ন ম্যাট্রিকগুলিতে (মূলত লজিস্টিক রিগ্রেশনে) কিছু গণনা করছি এবং আমি সাধারণত "ম্যাট্রিক্সটি একবচন" ত্রুটি পাই, যেখানে আমাকে ফিরে যেতে হবে এবং সংযুক্ত ভেরিয়েবলগুলি সরিয়ে ফেলতে হবে। আমার প্রশ্ন এখানে আপনি একটি "অত্যন্ত" সম্পর্কিত ম্যাট্রিক্স বিবেচনা করবেন? এই শব্দটি উপস্থাপনের জন্য কি পারস্পরিক সম্পর্কের একটি প্রান্তিক মান আছে? ভেরিয়েবলের মতো …

5
পরিসংখ্যানবিদরা ঠিক কীভাবে (এন -১) সিমুলেশন ছাড়াই জনসংখ্যার বৈচিত্র্যের জন্য নিরপেক্ষ অনুমানক হিসাবে ব্যবহার করতে সম্মত হন?
গণ্যকরণের বৈকল্পিকের সূত্রটি ডিনোমিনেটরে রয়েছে:(n−1)(n−1)(n-1) s2=∑Ni=1(xi−x¯)2n−1s2=∑i=1N(xi−x¯)2n−1s^2 = \frac{\sum_{i=1}^N (x_i - \bar{x})^2}{n-1} কেন আমি সবসময় ভাবছিলাম। যাইহোক, "কেন" এটি সম্পর্কে কয়েকটি ভাল ভিডিও পড়া এবং দেখা, দেখে মনে হয় জনসংখ্যার বৈচিত্রের একটি নিরপেক্ষ অনুমানক। যেখানে কম মূল্যায়ন করা হয় এবং জনসংখ্যার বৈচিত্র্যকে কমিয়ে দেয় ।(n−1)(n−1)(n-1)nnn(n−2)(n−2)(n-2) আমি জানতে আগ্রহী, কোন কম্পিউটারের যুগে …


5
পিসিএ-এ লোডিং বনাম ইগেনভেেক্টর: কখন এক বা অন্য ব্যবহার করবেন?
প্রধান উপাদান বিশ্লেষণে (পিসিএ), আমরা ইগেনভেেক্টর (ইউনিট ভেক্টর) এবং ইগেনভ্যালুগুলি পাই। এখন, আসুন আমরা লোডিংগুলিকে as হিসাবে সংজ্ঞায়িতLoadings=Eigenvectors⋅Eigenvalues−−−−−−−−−−√.Loadings=Eigenvectors⋅Eigenvalues.\text{Loadings} = \text{Eigenvectors} \cdot \sqrt{\text{Eigenvalues}}. আমি জানি যে ইগেনভেেক্টরগুলি কেবল দিকনির্দেশ এবং লোডিং (উপরে বর্ণিত হিসাবে) এছাড়াও এই দিকগুলির সাথে বৈচিত্র অন্তর্ভুক্ত করে। তবে আমার আরও ভাল বোঝার জন্য, আমি জানতে চাই যে …
67 pca 

4
পিসিএ এবং সাধারণভাবে গাউসিয়ান কর্নেলটিকে এত যাদু করে তোলে কী?
আমি গাউসিয়ান এবং বহুবর্ষীয় কার্নেলগুলির সাথে কার্নেল পিসিএ ( 1 , 2 , 3 ) সম্পর্কে পড়ছিলাম । গাউসিয়ান কার্নেল আপাতদৃষ্টিতে যে কোনও প্রকারের ননলাইনার তথ্য ব্যতিক্রমীভাবে ভালভাবে আলাদা করতে পারে? দয়া করে একটি স্বজ্ঞাত বিশ্লেষণ করুন, পাশাপাশি যদি সম্ভব হয় তবে একটি গাণিতিকভাবে জড়িত। অন্যান্য কার্নেলের কাছে গাউসিয়ান কার্নেলের …

9
এই চার্টটি কি কোনও সন্ত্রাসবাদী হামলার সম্ভাবনা দেখাচ্ছে যা পরিসংখ্যানগতভাবে কার্যকর?
আমি এই চিত্রটি অনেক কাছাকাছি গিয়ে দেখছি। আমার অন্ত্র-অনুভূতি রয়েছে যে এইভাবে সরবরাহ করা তথ্যগুলি কোনওভাবেই অসম্পূর্ণ বা এমনকি ভ্রান্ত, তবে আমি সাড়া দেওয়ার মতো পরিসংখ্যানের পক্ষে যথেষ্ট পারদর্শী নই। এটি আমাকে এই এক্সকেসিডি কমিকের কথা ভাবতে বাধ্য করে , এমনকি দৃ historical ় historical তিহাসিক তথ্য থাকা সত্ত্বেও কিছু …

7
কত দিতে হবে? একটি ব্যবহারিক সমস্যা
এটি কোনও বাড়ির কাজের প্রশ্ন নয় তবে আমাদের সংস্থার মুখোমুখি আসল সমস্যা। খুব সম্প্রতি (২ দিন আগে) আমরা একজন ডিলারের কাছে 10000 প্রোডাক্ট লেবেল তৈরির আদেশ দিয়েছি। ডিলার স্বতন্ত্র ব্যক্তি। তিনি বাইরে থেকে প্রস্তুতকৃত লেবেলগুলি সরবরাহ করেন এবং সংস্থাটি ডিলারের কাছে অর্থ প্রদান করে। প্রতিটি লেবেল ঠিক কোম্পানির জন্য 1 …

4
দেখুন এবং আপনি পাবেন (একটি সম্পর্ক)
আমার কয়েকশো পরিমাপ আছে। এখন, আমি প্রতিটি পরিমাপের সাথে প্রতিটি পরিমাপের সাথে সম্পর্কিত করতে এক ধরণের সফ্টওয়্যার ব্যবহার করার বিষয়টি বিবেচনা করছি। এর অর্থ হ'ল হাজারো পারস্পরিক সম্পর্ক রয়েছে। এর মধ্যে (পরিসংখ্যানগতভাবে) একটি উচ্চ সম্পর্ক থাকতে হবে, এমনকি ডেটা সম্পূর্ণরূপে এলোমেলো হলেও (প্রতিটি পরিমাপে প্রায় 100 টি ডাটাপয়েন্ট থাকে)। যখন …

7
সম্ভাবনার পরিবর্তে সর্বাধিক লগ সম্ভাব্যতা কেন অনুকূল করা যায়
সবচেয়ে মেশিন লার্নিং কর্ম যেখানে আপনি কিছু সম্ভাবনা প্রণয়ন করতে পারেন যা বড় করা উচিত, আমরা আসলে লগ সম্ভাব্যতা নিখুত হবে কিছু প্যারামিটার সম্ভাব্যতার পরিবর্তে । যেমন সর্বোচ্চ সম্ভাবনা প্রশিক্ষণ, এটি সাধারণত লগ-সম্ভাবনা like কিছু গ্রেডিয়েন্ট পদ্ধতিতে এটি করার সময়, এটিতে একটি ফ্যাক্টর জড়িত:ppplogplog⁡p\log pθθ\theta ∂logp∂θ=1p⋅∂p∂θ∂log⁡p∂θ=1p⋅∂p∂θ \frac{\partial \log p}{\partial \theta} …

4
মাল্টিক্লাস শ্রেণিবিন্যাসে আরওসি বক্ররেখা কীভাবে প্লট করবেন?
অন্য কথায়, দুটি শ্রেণির সমস্যা না হওয়ার পরিবর্তে আমি 4 টি শ্রেণি নিয়ে কাজ করছি এবং এখনও এওসি ব্যবহার করে পারফরম্যান্সটি মূল্যায়ন করতে চাই।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.