পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
কামিং (২০০৮) দাবি করেছে যে প্রতিলিপিগুলিতে প্রাপ্ত পি-মানগুলির বিতরণ কেবলমাত্র মূল পি-মানের উপর নির্ভর করে। এটা কিভাবে সত্য হতে পারে?
আমি জেফ কামিংয়ের ২০০৮-এর পেপারের প্রতিলিপি এবং অন্তরগুলিপিppপিpp পি পি পড়ছি : মানগুলি কেবলমাত্র অস্পষ্টভাবে ভবিষ্যতের পূর্বাভাস দেয় তবে আত্মবিশ্বাসের ব্যবধানগুলি আরও ভাল করে তোলে [গুগল স্কলারে ২০০ ডলার উদ্ধৃতি] - এবং এর কেন্দ্রীয় দাবির মধ্যে একটি বিভ্রান্ত হয়ে পড়েছি। এটি কাগজপত্রের সেই সিরিজের একটি যেখানে কমিং মূল্যগুলির বিরুদ্ধে এবং …

6
এলোমেলো বন মডেলের ভবিষ্যদ্বাণীগুলির কি পূর্বাভাস অন্তর রয়েছে?
আমি যদি কোনও randomForestমডেল চালনা করি তবে আমি মডেলের উপর ভিত্তি করে ভবিষ্যদ্বাণী করতে পারি। ভবিষ্যদ্বাণীগুলির প্রত্যেকটির অনুমানের ব্যবধান পাওয়ার কোনও উপায় আছে কীভাবে আমি জানি যে মডেলটির উত্তরের বিষয়ে "নিশ্চিত" কি আছে? যদি এটি সম্ভব হয় তবে এটি কেবল পুরো মডেলের জন্য নির্ভরশীল পরিবর্তনশীলের পরিবর্তনের উপর ভিত্তি করে বা …

5
নিউরাল নেটওয়ার্ক বনাম সমর্থন ভেক্টর মেশিন: দ্বিতীয়টি কি অবশ্যই উচ্চতর?
আমি প্রমাণিত এসভিএমগুলিতে যে সমস্ত কাগজপত্র পড়েছি তা হ'ল তাদের প্রতিরোধ / শ্রেণিবিন্যাসের সমস্যার মুখোমুখি হওয়ার জন্য এটি উচ্চতর কৌশল, সচেতন যে তারা এনএনএসের মাধ্যমে অনুরূপ ফলাফল পেতে পারে না। প্রায়শই তুলনা বলছে যে এনভিগুলির পরিবর্তে এসভিএম, একটি শক্তিশালী প্রতিষ্ঠাতা তত্ত্ব আছে চতুর্ভুজ প্রোগ্রামিংয়ের কারণে গ্লোবাল সর্বোত্তম পৌঁছান সঠিক সংখ্যক …

8
টুকি কর্তৃক এক্সপ্লোরার ডেটা বিশ্লেষণের আধুনিক উত্তরসূরি?
আমি টুকির বই "এক্সপ্লোরার ডেটা অ্যানালাইসিস" পড়ছি। 1977 সালে লিখিত হওয়ার কারণে বইটি কাগজ / পেন্সিল পদ্ধতিগুলিতে জোর দেয়। এমন আরও কোনও 'আধুনিক' উত্তরসূরি রয়েছে যা অ্যাকাউন্টে নেয় যা আমরা এখন তাত্ক্ষণিকভাবে বড় ডেটা সেটগুলি প্লট করতে পারি?

3
আনোভা অনুমানের স্বাভাবিকতা / অবশিষ্টাংশের স্বাভাবিক বিতরণ
ANOVA উইকিপিডিয়ার পৃষ্ঠা তিন অনুমানের তালিকা , যথা: মামলার স্বাতন্ত্র্য - এটি পরিসংখ্যান বিশ্লেষণকে সহজতর করে এমন মডেলের একটি অনুমান। স্বাভাবিকতা - অবশিষ্টাংশের বিতরণ স্বাভাবিক। সমতা (বা "একজাতীয়তা") বৈকল্পিক, যাকে হোমোসেসেস্টাস্টিটি বলা হয় ... আগ্রহের বিষয় এখানে দ্বিতীয় ধারণা। বেশ কয়েকটি উত্স অনুমানকে আলাদাভাবে তালিকাবদ্ধ করে। কেউবা কাঁচা তথ্যের স্বাভাবিকতা …


2
চি স্কোয়ার্ড টেস্ট এবং সমান অনুপাতের পরীক্ষার মধ্যে কী সম্পর্ক?
মনে করুন চারটি পারস্পরিক একচেটিয়া বৈশিষ্ট্যযুক্ত আমার তিনটি জনসংখ্যা রয়েছে। আমি প্রতিটি জনসংখ্যার থেকে এলোমেলো নমুনা নিই এবং আমি যে বৈশিষ্ট্যগুলি পরিমাপ করছি তার জন্য ক্রসস্ট্যাব বা ফ্রিকোয়েন্সি টেবিল তৈরি করি। আমি কি এই কথাটি সঠিক: আমি যদি জনসংখ্যা এবং বৈশিষ্ট্যগুলির মধ্যে কোনও সম্পর্ক আছে কিনা তা পরীক্ষা করতে চাইতাম …

8
পরিসংখ্যান ওয়ার্কবেঞ্চ হিসাবে এক্সেল
দেখে মনে হচ্ছে প্রচুর লোক (আমাকে সহ) এক্সেলে অনুসন্ধানের ডেটা বিশ্লেষণ করতে পছন্দ করে। কিছু সীমাবদ্ধতা, যেমন স্প্রেডশীটে অনুমোদিত সারিগুলির সংখ্যা, একটি ব্যথা তবে বেশিরভাগ ক্ষেত্রেই ডেটা দিয়ে ঘুরে বেড়ানো অ্যাক্সেলকে ব্যবহার করা অসম্ভব করে না। ম্যাককুলাও এবং হাইজারের একটি কাগজ , তবে, ব্যবহারিকভাবে চিৎকার করে বলেছে যে আপনি আপনার …

14
গাউসীয় (সাধারণ) বন্টনের সবচেয়ে অবাক করা বৈশিষ্ট্য কী?
on এর উপর একটি প্রমিত গাউসীয় বিতরণকে স্পষ্ট করে এর ঘনত্ব দিয়ে সংজ্ঞা দেওয়া যেতে পারে: 1RR\mathbb{R}12π−−√e−x2/212πe−x2/2 \frac{1}{\sqrt{2\pi}}e^{-x^2/2} বা এর বৈশিষ্ট্যযুক্ত ফাংশন। এই প্রশ্নের স্মরণ হিসাবে এটি কেবলমাত্র বন্টন যার জন্য নমুনাটির অর্থ এবং তারতম্যটি স্বাধীন। গওসিয়ান পদক্ষেপগুলির কী কী অন্যান্য অবাক করা বিকল্প বৈশিষ্ট্য আপনি জানেন? আমি সবচেয়ে অবাক …

10
একটি দূরত্বের ম্যাট্রিক্সের সাথে ক্লাস্টারিং
আমার একটি (প্রতিসামগ্রী) ম্যাট্রিক্স রয়েছে Mযা প্রতিটি জোড় নোডের মধ্যে দূরত্ব উপস্থাপন করে। উদাহরণ স্বরূপ, ABCDEFGHIJKL এ 0 20 20 20 40 60 60 60 100 120 120 120 বি 20 0 20 20 60 80 80 120 120 140 140 140 সি 20 20 0 20 60 80 80 …
52 clustering 

6
দৃ strongly়ভাবে ভারসাম্যহীন ক্লাস সহ বাইনারি শ্রেণিবদ্ধকরণ
আমার কাছে একটি বৈশিষ্ট্য রয়েছে (বৈশিষ্ট্যগুলি, বাইনারি আউটপুট 0 বা 1) আকারে, তবে 1টি খুব কমই ঘটে, তাই 0 এর পূর্বে ভবিষ্যদ্বাণী করে আমি 70% থেকে 90% এর মধ্যে নির্ভুলতা পাই (আমি যে নির্দিষ্ট ডেটা দেখি তার উপর নির্ভর করে) )। এমএল পদ্ধতিগুলি আমাকে একই নির্ভুলতা সম্পর্কে দেয় এবং আমি …

2
কৃত্রিম নিউরাল নেটওয়ার্ক এএনএন কীভাবে অব্যবহৃত ক্লাস্টারিংয়ের জন্য ব্যবহার করা যেতে পারে?
আমি বুঝতে পারি যে কীভাবে একটি artificial neural network (ANN), ভবিষ্যদ্বাণীগুলির ত্রুটি হ্রাস করে ফিটিংটি উন্নত করতে ব্যাকপ্রোগেশন ব্যবহার করে তদারকি পদ্ধতিতে প্রশিক্ষণ দেওয়া যায়। আমি শুনেছি যে একটি এএনএন নিরীক্ষণযোগ্য শিক্ষার জন্য ব্যবহার করা যেতে পারে তবে অপ্টিমাইজেশন পর্যায়ে গাইড করার জন্য কোনও ধরণের ব্যয় বিনা ব্যতীত এটি কীভাবে …

5
রিগ্রেশন বিশ্লেষণের জন্য স্কেলিং বৈশিষ্ট্যগুলি ছাড়াও কি লক্ষ্য মানটি স্কেল করা দরকার?
আমি রিগ্রেশন মডেল তৈরি করছি। প্রাকপ্রসেসিং পদক্ষেপ হিসাবে, আমি আমার বৈশিষ্ট্যটির মানগুলি 0 এবং মান বিচ্যুতি 1 হিসাবে স্কেল করেছি 1. লক্ষ্য মানগুলিও স্বাভাবিক করার প্রয়োজন কি?

4
কোন পরিস্থিতিতে লিকার্ট স্কেলগুলি অর্ডিনাল বা ইন্টারভাল ডেটা হিসাবে ব্যবহার করা উচিত?
সামাজিক বিজ্ঞানের অনেকগুলি গবেষণায় লিকার্ট স্কেল ব্যবহার করা হয়। কখন লিকার্ট ডেটা অর্ডিনাল হিসাবে ব্যবহার করা উপযুক্ত এবং কখন অন্তর ডেটা হিসাবে এটি ব্যবহার করা উপযুক্ত?

5
ভারসাম্যহীন ডেটা আসলে মেশিন লার্নিংয়ে কখন সমস্যা হয়?
লজিস্টিক রিগ্রেশন , এসভিএম , সিদ্ধান্ত গাছ , ব্যাগিং এবং এই জাতীয় বেশ কয়েকটি অনুরূপ প্রশ্ন ব্যবহার করার সময় ভারসাম্যহীন ডেটা সম্পর্কে আমাদের ইতিমধ্যে একাধিক প্রশ্ন ছিল , এটি কী খুব জনপ্রিয় একটি বিষয় হিসাবে তৈরি করে! দুর্ভাগ্যক্রমে, প্রতিটি প্রশ্নের উত্তর অ্যালগরিদম-নির্দিষ্ট বলে মনে হয়েছে এবং ভারসাম্যহীন ডেটা নিয়ে কাজ …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.