পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

3
টাইম সিরিজের সাথে কীভাবে পিয়ারসন সম্পর্ককে সঠিকভাবে ব্যবহার করবেন
আমার কাছে 2 টি টাইম-সিরিজ রয়েছে (উভয়ই মসৃণ) তারা কতটা সহযোগী তা দেখতে আমি ক্রস-কোলেলেট করতে চাই। আমি পিয়ারসন পারস্পরিক সম্পর্ক সহগ ব্যবহার করতে চাই। এটা কি উপযুক্ত? আমার দ্বিতীয় প্রশ্নটি হল আমি 2 টাইম-সিরিজের পাশাপাশি আমার পছন্দ মতো নমুনা বেছে নিতে পারি। অর্থাত্ আমি যে পরিমাণ ডেটা পয়েন্ট করব …

3
নায়েভ বয়েস বোঝা
থেকে StatSoft, ইনকর্পোরেটেড (2013), ইলেকট্রনিক পরিসংখ্যান পাঠ্যপুস্তক , "সাদাসিধা বায়েসের ক্লাসিফায়ার" : নেভ বেয়েস শ্রেণিবিন্যাসের ধারণাটি প্রদর্শনের জন্য, উপরের চিত্রায় প্রদর্শিত উদাহরণ বিবেচনা করুন। ইঙ্গিত হিসাবে, বস্তুগুলি গ্রীন বা লাল হিসাবে শ্রেণিবদ্ধ করা যেতে পারে। আমার কাজটি হ'ল নতুন কেসগুলি আসার সাথে সাথে শ্রেণিবদ্ধ করা, অর্থাত্ বর্তমানের অবজেক্টের উপর ভিত্তি …

5
যদি দুটি গ্রুপের টি-টেস্ট এবং আনোভা সমতুল্য হয় তবে তাদের অনুমানগুলি কেন সমান নয়?
আমি নিশ্চিত যে এটি আমার মাথায় পুরোপুরি জড়িয়ে গেছে, তবে আমি এটি বুঝতে পারি না। টি-টেস্ট জেড বিতরণ ব্যবহার করে দুটি সাধারণ বিতরণের তুলনা করে। এজন্য ডেটাতে স্বাভাবিকতার অনুমান রয়েছে। আনোভা ডামি ভেরিয়েবলগুলির সাথে লিনিয়ার রিগ্রেশন সমতুল্য এবং ওএলএসের মতো স্কোয়ারের পরিমাণ ব্যবহার করে। সে কারণেই রেসিডুয়ালসের স্বাভাবিকতার অনুমান আছে। …

5
জনসংখ্যার নমুনা যখন "হয়" তখন পরিসংখ্যানগত অনুমিতি
কল্পনা করুন যে আপনাকে বার্ষিক প্রদত্ত পরীক্ষা দেয় এমন প্রার্থীর সংখ্যা সম্পর্কে রিপোর্টিং করতে হবে। লক্ষ্য হিসাবে জনসংখ্যার সুনির্দিষ্টতার কারণে বিস্তৃত জনসংখ্যার পক্ষে সাফল্যের পরিলক্ষিত%% অনুমান করা বরং কঠিন মনে হয়। সুতরাং আপনি বিবেচনা করতে পারেন যে এই ডেটাগুলি পুরো জনসংখ্যার প্রতিনিধিত্ব করে। পরীক্ষাগুলির ফলাফলগুলি কি ইঙ্গিত দেয় যে পুরুষ …

10
একটি বিশাল রিড-ডেটা সেট সেটটির মধ্যমটি অনুমান করার জন্য একটি ভাল অ্যালগরিদম কী?
সংরক্ষণের জন্য খুব বড় কোনও ডেটা সেটের মধ্যমাটি অনুমান করার জন্য আমি একটি ভাল অ্যালগরিদম (যার অর্থ ন্যূনতম গণনা, ন্যূনতম সঞ্চয়ের প্রয়োজনীয়তা) খুঁজছি, যেমন প্রতিটি মান কেবল একবারই পড়তে পারে (আপনি যদি সেই মানটি স্পষ্টভাবে সংরক্ষণ না করেন)। অনুমান করা যায় এমন ডেটার কোনও সীমা নেই। যথাযথতা যতক্ষণ জানা যায় …

4
যদি সম্ভাবনা সর্বাধিকের সমান হয় তবে আমরা কেন নেতিবাচক সম্ভাবনা হ্রাস করব?
এই প্রশ্নটি আমাকে দীর্ঘকাল ধরে বিস্মিত করেছে। আমি সম্ভাবনা সর্বাধিকীকরণে 'লগ' এর ব্যবহার বুঝতে পারি তাই আমি 'লগ' সম্পর্কে জিজ্ঞাসা করি না। আমার প্রশ্ন, যেহেতু লগ সম্ভাবনা সর্বাধিক করা "নেতিবাচক লগ সম্ভাবনা" (এনএলএল) হ্রাস করার সমতুল্য, কেন আমরা এই এনএলএল আবিষ্কার করেছি? কেন আমরা সবসময় "ইতিবাচক সম্ভাবনা" ব্যবহার করি না? …

2
কেন কনভোলিউশনাল নিউরাল নেটওয়ার্কগুলি শ্রেণিবদ্ধ করতে কোনও সাপোর্ট ভেক্টর মেশিন ব্যবহার করে না?
সাম্প্রতিক বছরগুলিতে, কনভলিউশনাল নিউরাল নেটওয়ার্কগুলি (সিএনএন) কম্পিউটার ভিশনে অবজেক্টের স্বীকৃতির জন্য অত্যাধুনিক শিল্পে পরিণত হয়েছে। সাধারণত, একটি সিএনএন বেশ কয়েকটি কনভ্যুশনাল স্তর নিয়ে গঠিত এবং তারপরে দুটি সম্পূর্ণ সংযুক্ত স্তর রয়েছে। এর পিছনে একটি স্বজ্ঞাত হ'ল কনভ্যুশনাল স্তরগুলি ইনপুট ডেটার আরও ভাল উপস্থাপনা শেখে এবং সম্পূর্ণ সংযুক্ত স্তরগুলি তারপরে লেবেলের …

6
অবশিষ্টাংশগুলি কি "পূর্বাভাস বিয়োগের প্রকৃত" বা "প্রকৃত বিয়োগের পূর্বাভাস" আছে
আমি "অবশিষ্টাংশগুলি" হ'ল "পূর্বাভাস বিয়োগ আসল মান" বা "প্রকৃত বিয়োগের পূর্বাভাসিত মান" বলে বিভিন্নভাবে সংজ্ঞায়িত দেখেছি। উদাহরণের উদ্দেশ্যে, উভয় সূত্রই বহুল ব্যবহৃত হয়েছে তা দেখাতে, নিম্নলিখিত ওয়েব অনুসন্ধানগুলির সাথে তুলনা করুন: অবশিষ্ট "পূর্বাভাস বিয়োগ প্রকৃত" অবশিষ্ট "প্রকৃত বিয়োগ পূর্বাভাস" বাস্তবে, এটি প্রায় কোনও ক্ষেত্রেই তাত্পর্যপূর্ণ হয় না, যেহেতু অবিশ্বাস্যর অবশিষ্টাংশগুলির …

2
কেন পর্যাপ্ত বড় নমুনাগুলি দ্বারা নাল অনুমানকে প্রত্যাখ্যান করার জন্য ঘনতান্ত্রিক হাইপোথিসিস টেস্টিং পক্ষপাতদুষ্ট হয়ে যায়?
আমি এই নিবন্ধটি যখন হোঁচট খেয়েছি তখন সম্পূর্ণ সম্পর্কহীন সমস্যার জন্য আমি কেবল বেইস ফ্যাক্টরের উপর এই নিবন্ধটি পড়ছিলাম বেইস ফ্যাক্টরগুলির সাথে হাইপোথিসিস টেস্টিং ঘনত্ববাদী হাইপোথিসিস টেস্টিংয়ের চেয়ে বেশি শক্তিশালী, যেহেতু বায়েশিয়ান ফর্ম মডেল নির্বাচন পক্ষপাতকে এড়িয়ে যায়, নাল হাইপোথিসিসের পক্ষে প্রমাণের মূল্যায়ন করে, মডেল অনিশ্চয়তা অন্তর্ভুক্ত করে, এবং অ-নেস্টেড …

2
একজন বায়েশিয়ানকে কেন অবশিষ্টাংশের দিকে তাকাতে দেওয়া হচ্ছে না?
"আলোচনা: পরিবেশবিদদের বায়েশিয়ান হওয়া উচিত?" নিবন্ধে ব্রায়ান ডেনিস যখন বায়েসীয়দের পরিসংখ্যান সম্পর্কে আশ্চর্যজনকভাবে সুষম এবং ইতিবাচক দৃষ্টিভঙ্গি দেন, তখন তাঁর উদ্দেশ্য মনে হয় এটি সম্পর্কে মানুষকে সতর্ক করা। তবে একটি অনুচ্ছেদে কোনও উদ্ধৃতি বা ন্যায়সঙ্গততা ছাড়াই তিনি বলেছেন: বায়েশিয়ানরা, আপনি দেখুন, তাদের অবশিষ্টাংশগুলি দেখার অনুমতি নেই। এটি কোনও মডেলের অধীনে …

2
কোভারিয়ান্স ম্যাট্রিক্সের বিপরীতটি ডেটা সম্পর্কে কী বলে? (স্বজ্ঞা)
আমি এর প্রকৃতি সম্পর্কে আগ্রহী Σ−1Σ−1\Sigma^{-1}। " ডেটা সম্পর্কে কী বলে" সম্পর্কে কেউ স্বজ্ঞাত কিছু বলতে পারেন Σ−1Σ−1\Sigma^{-1}? সম্পাদনা: উত্তরের জন্য ধন্যবাদ কিছু দুর্দান্ত কোর্স করার পরে, আমি কিছু পয়েন্ট যুক্ত করতে চাই: এটি তথ্য, অর্থাত্ পরিমাপ, বরাবর দিক তথ্য পরিমাণ এক্স ।xTΣ−1xxTΣ−1xx^T\Sigma^{-1}xxxx দ্বৈত: যেহেতু ইতিবাচক নির্দিষ্ট, তাই হয় Σ …

7
"পরিসংখ্যানগতভাবে তাৎপর্যপূর্ণ" কেন পর্যাপ্ত নয়?
আমি আমার ডেটা বিশ্লেষণ সম্পন্ন করেছি এবং "পরিসংখ্যানগতভাবে গুরুত্বপূর্ণ ফলাফল" পেয়েছি যা আমার অনুমানের সাথে সামঞ্জস্যপূর্ণ। তবে পরিসংখ্যানের এক শিক্ষার্থী আমাকে বলেছিলেন এটি একটি অকালিক উপসংহার। কেন? আমার রিপোর্টে অন্তর্ভুক্ত করার মতো আর কি কি আছে?

3
এলোমেলো বনের গাছের অনুকূল সংখ্যা কি ভবিষ্যদ্বাণীকারীদের সংখ্যার উপর নির্ভর করে?
ভবিষ্যদ্বাণীকারীদের সংখ্যা বেশি হলে কেউ এলোমেলো বনে কেন আমাদের প্রচুর পরিমাণে গাছের প্রয়োজন তা ব্যাখ্যা করতে পারে? আমরা কীভাবে গাছের অনুকূল সংখ্যা নির্ধারণ করতে পারি?

3
লগ-ট্রান্সফর্মড প্রতিক্রিয়া সহ লিনিয়ার মডেল বনাম লগ লিঙ্ক সহ লিনিয়ার মডেলটি সাধারণ
ইন এই কাগজ খেতাবধারী "মধ্যে সাধারণ রৈখিক মডেল প্রয়োগ মেডিক্যাল ডেটা NEWLINENEWLINE" লেখক লিখুন: একটি সাধারণ রৈখিক মডেলটিতে, প্রতিক্রিয়াটি নিজেই পরিবর্তিত না করে লিংক ফাংশন দ্বারা গড়টি রূপান্তরিত হয়। রূপান্তরের দুটি পদ্ধতি বেশ ভিন্ন ফলাফলের দিকে নিয়ে যেতে পারে; উদাহরণস্বরূপ, লগ-ট্রান্সফর্মড প্রতিক্রিয়াগুলির গড়টি গড় প্রতিক্রিয়ার লগারিদমের মতো নয় । সাধারণভাবে, …

3
শর্তসাপেক্ষে গাউসীয় বিতরণের পিছনে অন্তর্দৃষ্টি কী?
ধরুন যে এক্স ∼ এন2( μ , Σ )X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma}) । তারপর শর্তাধীন বিতরণ এক্স1X1X_1 প্রদত্ত যে এক্স2= এক্স2X2=x2X_2 = x_2 বহুচলকীয় স্বাভাবিকভাবে গড় সঙ্গে বিতরণ করা হয়: ই[ পি( এক্স1| এক্স2= এক্স2) ] = μ1+ + σ12σ22( এক্স2- μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) এবং …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.