পোইসন বিতরণকে সাধারণ বিতরণে রূপান্তর করুন


10

আমার প্রাথমিকভাবে একটি কম্পিউটার বিজ্ঞানের পটভূমি রয়েছে তবে এখন আমি নিজেকে বেসিক পরিসংখ্যান শেখানোর চেষ্টা করছি। আমার কাছে কিছু ডেটা রয়েছে যা আমি মনে করি একটি পয়সন বিতরণ রয়েছে

এখানে চিত্র বর্ণনা লিখুন

আমার দুটি প্রশ্ন আছে:

  1. এটি কি পইসন বিতরণ?
  2. দ্বিতীয়ত, এটি কি সাধারণ বিতরণে রূপান্তর করা সম্ভব?

কোন সাহায্য প্রশংসা করা হবে। অনেক ধন্যবাদ


3
১. না, কোনও পইসন বিতরণ সাধারণত তার প্যারামিটারের আশেপাশে একটি মোড থাকে এবং তাই এটি পয়েসন বিতরণের সাথে মিলে গেলে প্যারামিটারের জন্য খুব ছোট মান বোঝায়। 2. হ্যাঁ এবং না। আপনি একটি সাধারণ বিতরণ দিয়ে কি করতে চান?
দিলীপ সরোতে

আমি এই তথ্যটি একটি লজিস্টিক রিগ্রেশনে ফিড দেওয়ার চেষ্টা করছি। আমাকে বিশ্বাস করতে পরিচালিত হয়েছিল যে সাধারণত বিতরণ করা ডেটা আরও ভাল ফলাফল দেয়
অভি

উত্তর:


11

1) যা চিত্রিত হয়েছে তা বার্ট চার্ট হিসাবে টানা অবিচ্ছিন্ন ডেটা (গ্রুপযুক্ত) বলে মনে হচ্ছে।

আপনি বেশ নিরাপদে উপসংহারে আসতে পারি যে এটা না একটি পইসন বিতরণের।

একটি পইসন র্যান্ডম ভেরিয়েবল 0, 1, 2, ... মান গ্রহণ করে এবং যখন গড় 1 এর চেয়ে কম হয় কেবল তখন সর্বোচ্চ 0 হয় It's এটি গণনা ডেটার জন্য ব্যবহৃত হয়; আপনি যদি পোইসন ডেটার অনুরূপ চার্ট আঁকেন তবে এটি নীচের প্লটগুলির মতো দেখাবে:

এখানে চিত্র বর্ণনা লিখুন

প্রথমটি হ'ল একটি পয়সন যা আপনার মতো একই রকমের স্কিউনেস দেখায়। আপনি দেখতে পাচ্ছেন যে এর গড়টি বেশ ছোট (প্রায় 0.6)।

দ্বিতীয়টি হ'ল একটি পয়সন যা আপনার সাথে একই রকম (খুব মোটামুটি অনুমানের) অর্থ mean যেমন আপনি দেখতে, এটি দেখতে বেশ সুদৃশ্য প্রতিসাম্যপূর্ণ।

আপনার স্কিউনেস বা বৃহত্তর গড় হতে পারে তবে একই সাথে উভয়ই নয়।

2) (i) আপনি আলাদা ডেটা সাধারণ করতে পারবেন না -

গোষ্ঠীযুক্ত ডেটা সহ, কোনও একরঙা-বর্ধমান রূপান্তর ব্যবহার করে আপনি একটি গোষ্ঠীর সমস্ত মান একই স্থানে সরিয়ে নিয়ে যাবেন, সুতরাং সর্বনিম্ন গোষ্ঠীতে এখনও সর্বোচ্চ শিখর থাকবে - নীচের প্লটটি দেখুন। প্রথম চক্রান্তে, আমরা একটি সাধারণ সিডিএফ সাথে ঘনিষ্ঠভাবে মেলে এক্স-মানগুলির অবস্থানগুলি স্থানান্তর করি:

এখানে চিত্র বর্ণনা লিখুন

দ্বিতীয় চক্রান্তে, আমরা রূপান্তর পরে সম্ভাব্যতা ফাংশন দেখতে। আমরা সত্যিকার অর্থে স্বাভাবিকতার মতো কিছু অর্জন করতে পারি না কারণ এটি পৃথক এবং স্কিউ উভয়ই; প্রথম গ্রুপের বড় লাফ একটি বড় লাফ থেকে যাবে, আপনি এটি বামে বা ডানদিকে ঠেলে না কেন।

(ii) অবিচ্ছিন্ন স্কিউ ডেটা যুক্তিসঙ্গতভাবে সাধারণ দেখায় রূপান্তরিত হতে পারে। আপনার যদি কাঁচা (গোষ্ঠীভুক্ত) মান থাকে এবং সেগুলি খুব বেশি বিযুক্ত হয় না, আপনি সম্ভবত কিছু করতে পারেন, তবে তারপরেও লোকেরা যখন তাদের ডেটা পরিবর্তন করতে চায় তখন হয় হয় অপ্রয়োজনীয় বা তাদের অন্তর্নিহিত সমস্যাটি ভিন্ন (সাধারণত আরও ভাল) উপায় সমাধান করা যেতে পারে । কখনও কখনও রূপান্তর একটি ভাল পছন্দ হয়, তবে এটি সাধারণত খুব ভাল-খুব ভাল কারণে হয় না।

সুতরাং ... আপনি কেন এটি রূপান্তর করতে চান?


খুব বিস্তারিত উত্তরের জন্য আপনাকে ধন্যবাদ গ্লেন। এটি অনেকগুলি ধারণা ব্যাখ্যা করে। আমি এই তথ্যটি একটি লজিস্টিক রিগ্রেশন মডেলটিতে ফিড দেওয়ার চেষ্টা করছি। আমি ভেবেছিলাম (আমি এখন এতটা নিশ্চিত নই) যে সাধারণত বিতরণ করা ডেটা আরও ভাল ফলাফল দেয়। আপনি কি সুপারিশ করেন?
অভি

1
এটি স্বাধীন ভেরিয়েবল (একটি x-variable)? এই প্রসঙ্গে "আরও ভাল ফলাফল" বলতে কী বোঝ?
গ্লেন_বি -রিনস্টেট মনিকা

@ গ্লেেন_ বি বিস্ময়কর উত্তরের জন্য অনেক ধন্যবাদ। আমি কম্পিউটার বিজ্ঞানের ব্যাকগ্রাউন্ড থেকেও এসেছি এবং এই প্রশ্নে আটকে গেছি : stats.stackexchange.com/questions/408232/… দয়া করে আমাকে এ সম্পর্কে আপনার চিন্তাভাবনা জানান। আমি আপনার কাছ থেকে শ্রবণ করার জন্য উন্মুখ. আপনাকে আবারও অনেক ধন্যবাদ :)
EmJ 14'19

আপনার প্রশ্নের উত্তর দেওয়ার জন্য লোক নিয়োগের চেষ্টা করার জন্য দয়া করে মন্তব্যগুলি ব্যবহার করবেন না। আমি আপনার প্রশ্ন ইতিমধ্যে দেখেছি।
গ্লেন_বি -রিনস্টেট মনিকা

0

উত্তরোত্তর জন্য আরও মজাদার তথ্য পোস্ট করা।

একটি পুরানো পোস্ট রয়েছে যা লজিস্টিক রিগ্রেশনগুলির জন্য স্বতন্ত্র ভেরিয়েবল হিসাবে গণনা ডেটা ব্যবহার সম্পর্কিত একটি একই সমস্যা নিয়ে আলোচনা করে।

এটা এখানে:

গণনা তথ্যকে স্বাধীন ভেরিয়েবল হিসাবে ব্যবহার করা কি কোনও জিএলএম অনুমান লঙ্ঘন করে?

গ্লেন যেমন উল্লেখ করেছেন যে আপনি যদি কেবল দ্বিধাহীন ফলাফলের পূর্বাভাস দেওয়ার চেষ্টা করছেন তবে এটি সম্ভব যে আপনি আপনার লজিস্টিক রিগ্রেশন মডেলটির প্রত্যক্ষ উপাদান হিসাবে অপরিবর্তিত গণনা তথ্য ব্যবহার করতে সক্ষম হতে পারেন। তবে, সাবধানতার একটি নোট: যখন একটি স্বাধীন ভেরিয়েবল (চতুর্থ) উভয়ই বিতরণ করা হয় এবং কাঁচা মানগুলি ব্যবহার করে বিশাল আকারের অনেকগুলি অর্ডারে রেঞ্জের ফলস্বরূপ আপনার প্রভাবশালী পয়েন্ট হতে পারে, যার ফলস্বরূপ আপনার মডেলটিকে পক্ষপাতিত্ব করতে পারে। যদি এটি হয় তবে আরও শক্তিশালী মডেলটি পেতে আপনার চতুর্থ এর রূপান্তর করা কার্যকর হতে পারে।

বর্গমূল, বা লগের মতো রূপান্তরগুলি IV এবং বৈষম্যের অনুপাতের মধ্যে সম্পর্ক বাড়িয়ে তুলতে পারে। উদাহরণস্বরূপ, যদি এক্স এর তিনটি পূর্ণ ক্রমের পরিবর্তনের (মিডিয়ান এক্স মান থেকে দূরে) ওয়াই সংঘটিত হওয়ার সম্ভাবনা মাত্র 0.5 পরিবর্তনের সাথে মিলিত হয় (0.5 থেকে দূরে), তবে এটি মানা বেশ নিরাপদ যে কোনও মডেলের তাত্পর্য হবে বহিরাগত এক্স মানগুলি থেকে চূড়ান্ত লিভারেজের কারণে উল্লেখযোগ্য পক্ষপাতের দিকে পরিচালিত করুন।

আরও চিত্রিত করার জন্য, কল্পনা করুন যে কোনও ব্যক্তি মরিচটিকে "অস্বস্তিকরভাবে মশলাদার" (পরিসীমা [ওয়াই] = হিসাবে শ্রেণীবদ্ধ করেছেন এমন সম্ভাবনা সম্পর্কে ভবিষ্যদ্বাণী করার জন্য আমরা বিভিন্ন মরিচ কাঁচামরিচ (ডোমেন [এক্স] = {0, 3.2 মিলিয়ন}) এর স্কোভিল রেটিং ব্যবহার করতে চেয়েছিলাম Rating 1 = হ্যাঁ, 0 = না}) মেশিনের সাথে সম্পর্কিত রেটিং এক্স eating

https://en.wikipedia.org/wiki/Scoville_scale

আপনি যদি স্কোভিল রেটিংগুলির চার্টটি দেখেন তবে দেখতে পাবেন কাঁচা স্কোভিল রেটিংয়ের একটি লগ রূপান্তর আপনাকে প্রতিটি মরিচের সাবজেক্টিভ (1-10) রেটিংয়ের কাছাকাছি সান্নিধ্য প্রদান করতে পারে।

সুতরাং এই ক্ষেত্রে যদি আমরা আরও শক্তিশালী মডেল তৈরি করতে চাই যা কাঁচা স্কোভিল রেটিং এবং বিষয়গত তাপীকরণের রেটিংয়ের মধ্যে সত্যিকারের সম্পর্ককে ধারণ করে, আমরা এক্স মানগুলিতে লোগারিথমিক রূপান্তর সম্পাদন করতে পারি। এটি করার মাধ্যমে আমরা অত্যধিক বৃহত এক্স ডোমেনের প্রভাব হ্রাস করে কার্যকরতার আদেশ অনুসারে পৃথক মানের সাথে দূরত্বকে "সংকুচিত" করে এবং ফলস্বরূপ কোনও এক্স আউটলিয়ারকে ওজন হ্রাস করে (যেমন cap ক্যাপসাইকিন অসহিষ্ণু এবং / অথবা ক্রেজি মশালার দৌরাত্ম্য)! !!) আমাদের পূর্বাভাস আছে।

আশা করি এটি কিছু মজাদার প্রসঙ্গ যুক্ত করে!

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.