পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর


7
কেন নিয়মিতকরণ শব্দটি ব্যয় কার্যক্রমে (বহুগুণ ইত্যাদির পরিবর্তে) যুক্ত করা হয়?
যখনই নিয়মিতকরণ ব্যবহৃত হয়, এটি প্রায়শই ব্যয় ফাংশনে যেমন নিম্নলিখিত ব্যয় ফাংশনে যুক্ত করা হয়। এটি আমার কাছে স্বজ্ঞাততা বোধ করে যেহেতু ন্যূনতম ব্যয় কার্যকারিতা অর্থ ত্রুটি (বাম শব্দ) হ্রাস করা এবং একই সময়ে (সহ সঠিক দুটি শব্দকে সামঞ্জস্য করা) সহগের (ডান শব্দ) এর দৈর্ঘ্যকে হ্রাস করা।J(θ)=12(y−θXT)(y−θXT)T+α∥θ∥22J(θ)=12(y−θXT)(y−θXT)T+α‖θ‖22 J(\theta)=\frac 1 2(y-\theta …

4
কেন রিগ্রেশনের মাধ্যমে শ্রেণিবিন্যাসের কাছে যেতে হবে না?
আমি মেশিন লার্নিংয়ে দেখেছি এমন কিছু উপাদান বলেছে যে রিগ্রেশনের মাধ্যমে কোনও শ্রেণিবিন্যাসের সমস্যার কাছে আসা একটি খারাপ ধারণা। তবে আমি মনে করি ডেটা ফিট করার জন্য একটি অবিচ্ছিন্ন রিগ্রেশন করা সর্বদা সম্ভব এবং বিচ্ছিন্ন শ্রেণিবদ্ধকরণের জন্য ধারাবাহিক ভবিষ্যদ্বাণী কেটে ফেলা সম্ভব। তাহলে কেন এটি খারাপ ধারণা?

6
আর-তে আরওসি বক্ররেখা ব্যবহার করে কীভাবে সেরা কাট অফ পয়েন্ট এবং তার আত্মবিশ্বাসের ব্যবধানটি নির্ধারণ করবেন?
আমার কাছে একটি পরীক্ষার ডেটা রয়েছে যা সাধারণ এবং টিউমার কোষকে আলাদা করতে ব্যবহার করা যেতে পারে। আরওসি বক্ররেখা অনুসারে এটি এই উদ্দেশ্যে ভাল দেখায় (বক্ররেখার ক্ষেত্রফল 0.9): আমার প্রশ্নগুলি হ'ল: এই পরীক্ষার জন্য কাট অফ পয়েন্ট এবং এর আত্মবিশ্বাসের অন্তর কোথায় নির্ধারণ করবেন যেখানে পাঠাগুলি দ্বিপাক্ষিক হিসাবে গণ্য করা …

8
টেবিল ডিজাইনের একটি ভাল সংস্থান কী?
গ্রাফিক্সের ব্যাকরণ হিসাবে গ্রাফিক্সের বিভিন্ন তাত্ত্বিক চিকিত্সা আমি দেখেছি । তবে আমি টেবিলের সাথে সমান কিছু দেখিনি। এই সময়ের মধ্যে আমি টেবিল ডিজাইনে ভাল অনুশীলনের একটি অনানুষ্ঠানিক মডেল তৈরি করেছি। তবে, আমি শিক্ষার্থীদের একটি ভাল রেফারেন্স সরবরাহ করতে সক্ষম হতে চাই। APA স্টাইল ম্যানুয়াল টেবিল নকশা উপর কিছু টিপস আছে, …
51 tables 

2
একটি কণা ফিল্টার (ক্রমান্বয়ে মন্টি কার্লো) এবং একটি কলম্যান ফিল্টার মধ্যে পার্থক্য কি?
একটি কণা ফিল্টার এবং কলম্যান ফিল্টার উভয়ই পুনরাবৃত্ত বায়েশিয়ান অনুমানকারী । আমি প্রায়শই আমার ফিল্ডে কলম্যান ফিল্টারগুলির মুখোমুখি হই, তবে খুব কমই একটি কণা ফিল্টার ব্যবহার করি। কখন অন্যটির উপরে ব্যবহার করা হবে?

3
পরিসংখ্যান এবং কার্যকারণ অনুমান?
পল হল্যান্ড তার ১৯৮৪ সালের গবেষণাপত্রে "পরিসংখ্যান এবং কার্যকারণ সূচনা" তে পরিসংখ্যানগুলির মধ্যে একটি অন্যতম মৌলিক প্রশ্ন উত্থাপন করেছিলেন: কোনও পরিসংখ্যান মডেল কার্যকারণ সম্পর্কে কী বলতে পারে? এটি তার নীতিবাক্য বাড়ে: ম্যানিপুলেশন ব্যতীত কোন কারণ নেই যা কার্যকারিতা বিবেচনা করে এমন পরীক্ষাগুলির চারদিকে বিধিনিষেধের গুরুত্বকে জোর দিয়েছিল। অ্যান্ড্রু গেলম্যানও একই …
51 causality 

4
পারস্পরিক তথ্য বনাম পারস্পরিক সম্পর্ক
"পিয়ারসন", "স্পিয়ারম্যান" বা "কেন্ডালের টাউ" এর মতো পরিসংখ্যানগত পারস্পরিক পরিমাপের উপর কেন আমাদের কখন পারস্পরিক তথ্য ব্যবহার করা উচিত?

3
আমাদের কি “করুণা বাড়ানোর” সমস্যা আছে?
আমি জানি, এটি শব্দহীন বলে মনে হতে পারে তবে শুনুন। স্ট্যাক ওভারফ্লোতে এবং এখানে আমরা পোস্টগুলিতে ভোট পাই, এটি সমস্ত একটি সারণী আকারে সঞ্চিত। উদাহরণ: পোস্ট আইডি ভোটার আইডি ভোট টাইপ তারিখের সময় ------- -------- --------- -------- 10 1 2 2000-1-1 10:00:01 11 3 3 2000-1-1 10:00:01 10 5 2 …

5
এলোমেলো বন কি বস্টিং অ্যালগরিদম?
বৃদ্ধির সংক্ষিপ্ত সংজ্ঞা : দুর্বল শিক্ষার্থীদের একটি সেট কি একক শক্তিশালী শিক্ষানবিস তৈরি করতে পারে? একটি দুর্বল শিক্ষানবিসকে শ্রেণীবদ্ধকারী হিসাবে সংজ্ঞায়িত করা হয় যা কেবলমাত্র প্রকৃত শ্রেণিবিন্যাসের সাথে সম্পর্কিত (এটি এলোমেলো অনুমানের চেয়ে উদাহরণগুলি আরও ভাল লেবেল করতে পারে)। র্যান্ডম ফরেস্টের সংক্ষিপ্ত সংজ্ঞা : এলোমেলো বন অনেক শ্রেণিবিন্যাস গাছ বৃদ্ধি …


3
একাধিক লিনিয়ার রিগ্রেশন বৈশিষ্ট্য নির্বাচনের জন্য এলোমেলো বন ব্যবহার করা যেতে পারে?
যেহেতু আরএফ অ-রৈখিকতা পরিচালনা করতে পারে তবে সহগ সরবরাহ করতে পারে না, তাই গুরুত্বপূর্ণ গুণাবলী সংগ্রহ করার জন্য এলোমেলো বন ব্যবহার করা এবং তার সহগগুলি পাওয়ার জন্য এই বৈশিষ্ট্যগুলি একাধিক লিনিয়ার রিগ্রেশন মডেলটিতে প্লাগ করা কি বুদ্ধিমানের কাজ হবে?

8
কোনও ব্যর্থতা না থাকলে ব্যর্থতার সম্ভাবনা কীভাবে বলব?
আমি ভাবছিলাম যে যদি 1 বছরের জন্য আমাদের 100,000 পণ্য ক্ষেত্রের জন্য রয়েছে এবং কোনও ব্যর্থতা নেই তবে কোনও কিছুতে ব্যর্থ হওয়ার (সম্ভাব্য পণ্য) সম্ভাবনা বলার উপায় আছে কি? পরবর্তী 10,000 টি পণ্যের একটি বিক্রি হওয়ার সম্ভাবনা কী?

4
বিদেশীদের কাছে দ্রুত লিনিয়ার রিগ্রেশন শক্তিশালী
আমি আউটলিয়ারদের সাথে লিনিয়ার ডেটা নিয়ে কাজ করছি, যার মধ্যে কয়েকটি আনুমানিক রিগ্রেশন লাইন থেকে আরও 5 স্ট্যান্ডার্ড বিচ্যুতিতে রয়েছে। আমি একটি লিনিয়ার রিগ্রেশন কৌশল খুঁজছি যা এই পয়েন্টগুলির প্রভাবকে হ্রাস করে। এতক্ষণ আমি যা করেছি তা হ'ল সমস্ত ডেটা সহ রিগ্রেশন লাইনটি অনুমান করা, তারপরে খুব বড় স্কোয়ার অবশিষ্টাংশ …

9
ডাটাবেস থেকে ডেটা ভিজ্যুয়ালাইজ করার জন্য কেউ কি কোনও ভাল ওপেন সোর্স সফ্টওয়্যার জানেন?
সম্প্রতি আমি টেবিলের বাইরে এসে ডেটাবেস এবং সিএসভি ফাইল থেকে ডেটা ভিজ্যুয়ালাইজ করার চেষ্টা করেছি। ব্যবহারকারী ইটারফেস ব্যবহারকারীকে সময় এবং স্থানিক ডেটা ভিজ্যুয়ালাইজ করতে এবং তাত্ক্ষণিকভাবে প্লট তৈরি করতে সক্ষম করে। কোড না লিখে গ্রাফিকভাবে ডেটা পর্যবেক্ষণ করতে সক্ষম হওয়ায় এ জাতীয় সরঞ্জামটি সত্যই কার্যকর। যেহেতু অনেকগুলি ডেটা উত্স রয়েছে …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.