পরিসংখ্যান এবং বড় তথ্য

পরিসংখ্যান, মেশিন লার্নিং, ডেটা বিশ্লেষণ, ডেটা মাইনিং এবং ডেটা ভিজ্যুয়ালাইজেশনে আগ্রহী ব্যক্তিদের জন্য প্রশ্নোত্তর

4
সাধারণীকরণ বনাম স্কেলিং
ডেটা 'নরমালাইজেশন' এবং ডেটা 'স্কেলিং' এর মধ্যে পার্থক্য কী? এখনও অবধি আমি ভেবেছিলাম উভয় পদই একই প্রক্রিয়াটিকে বোঝায় তবে এখন বুঝতে পারলাম এর বাইরে আরও কিছু আছে যা আমি জানি / বুঝতে পারি না। এছাড়াও যদি নরমালাইজেশন এবং স্কেলিংয়ের মধ্যে পার্থক্য থাকে তবে কখন আমরা নরমালাইজেশন ব্যবহার করব তবে স্কেলিং …

1
I টাইপ II কীভাবে ব্যাখ্যা করবেন এবং III আনোভা এবং মনোভা টাইপ করবেন?
আমার প্রাথমিক প্রশ্নটি হ'ল টাইপ আই (অনুক্রমিক) আনোভা পরিচালনা করার সময় আউটপুট (সহগুণ, এফ, পি) কীভাবে ব্যাখ্যা করবেন? আমার নির্দিষ্ট গবেষণার সমস্যাটি আরও জটিল, তাই আমি আমার উদাহরণটি ভাগে ভাগ করে দেব। প্রথমত, যদি আমি উদ্ভিদ বৃদ্ধি (ওয়াই 1) বলার উপর স্পাইডার ডেনসিটি (এক্স 1) এর প্রভাবের বিষয়ে আগ্রহী এবং …

6
বিতরণের মধ্যে কলমোগোরভ দূরত্বের জন্য প্রেরণা
দুটি সম্ভাবনার বিতরণ কতটা সমান তা পরিমাপ করার অনেকগুলি উপায় রয়েছে। জনপ্রিয় পদ্ধতিগুলির মধ্যে (বিভিন্ন মহলে) রয়েছে: কোলমোগোরভ দূরত্ব: বন্টন কার্যের মধ্যবর্তী দূরত্ব; ক্যান্টোরোভিচ-রুবিনস্টাইন দূরত্ব: প্রত্যাশার মধ্যে সর্বাধিক পার্থক্যটি লিপস্চিটজ ধ্রুবক সাথে দুটি ক্রিয়াকলাপ বন্টনকে আরও বাড়িয়ে তোলে, যা বিতরণ ফাংশনগুলির মধ্যে দূরত্ব হিসাবেও পরিণত হয় ;111L1L1L^1 বেষ্টিত-Lipschitz দূরত্ব: কে …

8
সব মডেল কি অকেজো? কোনও সঠিক মডেল কি সম্ভব - বা দরকারী?
এই প্রশ্নটি একমাস ধরে আমার মনে উদ্দীপনা জাগছে। আমস্ট্যাট নিউজের ফেব্রুয়ারী ২০১ issue সংখ্যায় বার্কলে অধ্যাপক মার্ক ভ্যান ডার লানের একটি নিবন্ধ রয়েছে যা অনর্থক মডেল ব্যবহারের জন্য লোকদের তিরস্কার করে। তিনি বলেছিলেন যে মডেলগুলি ব্যবহার করে পরিসংখ্যানগুলি তখন বিজ্ঞানের চেয়ে বরং একটি শিল্প। তাঁর মতে, একজন সর্বদা "সঠিক মডেল" …

10
বিগ ডেটা ঠিক কী?
আমাকে বেশ কয়েকটি অনুষ্ঠানে প্রশ্ন করা হয়েছিল: বিগ-ডেটা কী? শিক্ষার্থী এবং আমার আত্মীয় উভয়ই যা পরিসংখ্যান এবং এমএল-এর কাছাকাছি বাজছে। আমি এই সিভি-পোস্ট পেয়েছি । এবং আমি অনুভব করি যে আমি সেখানে একমাত্র উত্তরের সাথে একমত। উইকিপিডিয়া পৃষ্ঠা এছাড়াও এটিতে কিছু মন্তব্য আছে, কিন্তু আমি নিশ্চিত যদি আমি সত্যিই সেখানে …
44 large-data 


4
পরিসংখ্যানবিদরা কেন অ-তাত্পর্যপূর্ণ ফলাফলের অর্থ নাল অনুমানকে গ্রহণ করার বিরোধিতা করে "আপনি নালকে প্রত্যাখ্যান করতে পারবেন না"?
দুটি নমুনা টি-টেস্টের মতো Traতিহ্যগত পরিসংখ্যানগত পরীক্ষাগুলিও এই হাইপোথিসিসকে নির্মূল করার চেষ্টা করার দিকে মনোনিবেশ করে যে দুটি স্বতন্ত্র নমুনার ফাংশনের মধ্যে কোনও পার্থক্য নেই। তারপরে, আমরা একটি আত্মবিশ্বাসের স্তরটি বেছে নিই এবং বলি যে যদি উপায়গুলির পার্থক্যটি 95% স্তরের বাইরে হয় তবে আমরা নাল অনুমানটি বাতিল করতে পারি। যদি …

4
অন্যান্য বৈশিষ্ট্য মানচিত্র উত্পাদন করতে বৈশিষ্ট্য মানচিত্রে কার্নেলগুলি কীভাবে প্রয়োগ করা হয়?
আমি কনভ্যুশনাল নিউরাল নেটওয়ার্কগুলির কনভোলশন অংশটি বোঝার চেষ্টা করছি। নিম্নলিখিত চিত্রটি দেখছেন: আমাদের প্রথম কনভ্যুশন স্তরটি বুঝতে কোনও সমস্যা নেই যেখানে আমাদের 4 টি আলাদা কার্নেল রয়েছে (আকারের ), যা 4 টি বৈশিষ্ট্যযুক্ত মানচিত্র প্রাপ্ত করার জন্য আমরা ইনপুট চিত্রের সাথে মিলিত করি।k×kk×kk \times k আমি যা বুঝতে পারি না …

6
আপনার প্রিয় পরিসংখ্যান গ্রাফ কি?
এটি আমার একটি প্রিয় এই উদাহরণটি একটি হাস্যকর শিরাতে রয়েছে (কৃতিত্বটি আমার প্রাক্তন প্রফেসর স্টিভেন গোর্টমেকারের কাছে) উত্তর প্রতি এক এন্ট্রি। অবশ্যই, এই প্রশ্নটি একই লাইনের পাশাপাশি আপনার প্রিয় "ডেটা বিশ্লেষণ" কার্টুনটি কী? দয়া করে আপনার সরবরাহিত কোনও চিত্রের সাথে যথাযথ ক্রেডিট / উদ্ধৃতি প্রদান করুন।

5
একাডেমিক পত্রগুলিতে প্রকাশিত পরিসংখ্যান
পাঠ্যপুস্তকের বাইরে 'বাস্তব বিশ্বে' কীভাবে পরিসংখ্যান ব্যবহার করা হচ্ছে তার সুনির্দিষ্ট লক্ষ্য নিয়ে আমি প্রচুর বিবর্তনীয় / পরিবেশগত একাডেমিক কাগজপত্র পড়েছি read আমি সাধারণত পত্রগুলিতে পরিসংখ্যানগুলিকে সুসমাচার হিসাবে গ্রহণ করি এবং আমার পরিসংখ্যানগত শিক্ষায় সহায়তা করার জন্য কাগজপত্রগুলি ব্যবহার করি। সর্বোপরি, যদি কোনও কাগজ লিখতে কয়েক বছর সময় নেয় এবং …

3
পি-মানগুলির সংমিশ্রণের সময়, কেন কেবল গড় হয় না?
আমি সম্প্রতি পি-মানগুলি সংযুক্ত করার জন্য ফিশারের পদ্ধতি সম্পর্কে শিখেছি। এটি নলের নীচে পি-মানটি একটি অভিন্ন বিতরণ অনুসরণ করে এবং এর ভিত্তিতে তৈরি হয় - যে যা আমি প্রতিভা হিসাবে মনে করি। তবে আমার প্রশ্ন হ'ল কেন এই বিভ্রান্তিকর পথে? এবং কেন পি-মানগুলির অর্থ ব্যবহার করে এবং কেন্দ্রীয় সীমাবদ্ধ তত্ত্বটি …

1
একাধিক র্যান্ডম ভেরিয়েবলের পণ্যটির বৈচিত্র
আমরা দুটি স্বতন্ত্র ভেরিয়েবলের জন্য উত্তর জানি: Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm Var}(XY) = E(X^2Y^2) − (E(XY))^2={\rm Var}(X){\rm Var}(Y)+{\rm Var}(X)(E(Y))^2+{\rm Var}(Y)(E(X))^2 তবে, যদি আমরা বেশি ভেরিয়েবল, এর পণ্য গ্রহণ করি তবে প্রতিটি ভেরিয়েবলের বৈকল্পিক এবং প্রত্যাশিত মানগুলির ক্ষেত্রে উত্তরটি কী হবে?Var(X1X2⋯Xn)Var(X1X2⋯Xn){\rm Var}(X_1X_2 \cdots X_n)

7
শাস্ত্রীয় পদ্ধতির পরিবর্তে কেউ কেন 'ননফর্মেশনাল' অনুচিতের সাথে বায়সিয়ান পদ্ধতির ব্যবহার করবেন?
যদি আগ্রহটি কেবলমাত্র কোনও মডেলের প্যারামিটারগুলি নির্ধারণ করে (পয়েন্টওয়াইস এবং / বা ব্যবধানের প্রাক্কলন) এবং পূর্ববর্তী তথ্য নির্ভরযোগ্য, দুর্বল না হয় (আমি জানি এটি কিছুটা অস্পষ্ট তবে আমি একটি দৃশ্যাবলী প্রতিষ্ঠার চেষ্টা করছি যেখানে একটি পছন্দ পছন্দ করে পূর্ববর্তী কঠিন) ... কেউ কেন শাস্ত্রীয় পদ্ধতির পরিবর্তে 'ননফর্মেশনাল' অনুচিত প্রিয়ারদের সাথে …

1
কোহেনের কাপ্পা বৈচিত্র্য (এবং মান ত্রুটিগুলি) গণনা করা হচ্ছে
কপ্প ( ) পরিসংখ্যানটি সালে কোহেন [১] দ্বারা দুটি বিদ্রোহীর মধ্যে চুক্তি পরিমাপ করার জন্য প্রবর্তন করেছিলেন। এর বৈকল্পিকতা বেশ কিছুদিন ধরেই দ্বন্দ্বের কারণ হয়ে দাঁড়িয়েছিল।κκ\kappa আমার প্রশ্নটি হ'ল বড় নমুনাগুলি সহ সবচেয়ে ভাল বৈকল্পিক গণনা। আমি বিশ্বাস করতে আগ্রহী যে ফ্লেইস [2] দ্বারা যাচাই করা হয়েছে এবং যাচাই করা …

5
র্যান্ডম ফরেস্ট অ্যালগরিদমের অনুকূলিতকরণগুলি
আমি লক্ষ্য করেছি যে এলোজিআইবি, ওয়াফলস এবং কিছু আর প্যাকেজগুলির মতো এলোমেলো বনের কয়েকটি বাস্তবায়ন রয়েছে randomForest। কেউ কি আমাকে বলতে পারেন যে এই লাইব্রেরিগুলি অত্যন্ত অনুকূলিত হয়েছে? এগুলি মূলত পরিসংখ্যান শিক্ষার উপাদানগুলির বিবরণ হিসাবে এলোমেলো বনগুলির সমতুল্য বা অতিরিক্ত অতিরিক্ত কৌশল যুক্ত হয়েছে? আমি আশা করি এই প্রশ্নটি যথেষ্ট …

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.