জন স্নো কলেরা সমস্যা সমাধানের জন্য কোন পরিসংখ্যানের মডেল বা অ্যালগরিদম ব্যবহার করা যেতে পারে?


23

আমি জন স্নো কলেরা মহামারী থেকে প্রাপ্ত তথ্যের উপর ভিত্তি করে কোনও ধরণের ভূমিকম্পের ভৌগলিক সন্নিকট বিকাশ করতে শিখতে আগ্রহী। কূপগুলি অবস্থিত তা পূর্বের জ্ঞান ছাড়াই এই জাতীয় সমস্যা সমাধানের জন্য স্ট্যাটিস্টিকাল মডেলিং কী ব্যবহার করা যেতে পারে।

একটি সাধারণ সমস্যা হিসাবে আপনার কাছে সময়, পরিচিত পয়েন্টের অবস্থান এবং পর্যবেক্ষকের চলার পথ উপলব্ধ থাকবে। আমি যে পদ্ধতিটির সন্ধান করছি তা "প্রাদুর্ভাব" এর কেন্দ্রস্থল অনুমান করার জন্য এই তিনটি জিনিস ব্যবহার করবে।


2
ক্রিগিং মডেলগুলি ভৌগলিক পূর্বাভাসের জন্য ব্যবহৃত হয়। এটি শুরু করার জায়গা হতে পারে। সময়ের তথ্য অন্তর্ভুক্ত করার জন্য আপনাকে আরও একধাপ এগিয়ে যেতে হবে এবং একটি স্প্যাটিও-টেম্পোরাল মডেল ব্যবহার করতে হবে (যদিও আমি এগুলি ব্যবহার করি নি)।
গ্রেট 38

4
@ গ্রেট ক্রিগিং এখানে প্রয়োগ করা শক্ত হবে: এটি চূড়ান্ত অনুমানের জন্য নয়, এটি প্রাসঙ্গিক রাস্তাগুলি ধরে হাঁটার সময়ের জ্যামিতির পক্ষেও উপযুক্ত নয় বা জনসংখ্যার ঘনত্বের মতো গুরুত্বপূর্ণ কোভরিয়েটগুলির নিয়ন্ত্রণেও এটি যথাযথভাবে খাপ খায় না বা ভবনগুলিতে শ্রমিক সংখ্যা।
শুক্রবার

এই আর প্যাকেজটি github.com/lindbrook/cholera এর আগ্রহের হতে পারে ।
ডেভিড সি নরিস

উত্তর:


25

একটি সম্পূর্ণ বা প্রামাণিক উত্তর দেওয়ার জন্য নয়, কেবল ধারণাগুলিকে উদ্দীপিত করার জন্য, আমি দশ বছর আগে আমি শিখিয়েছি এমন একটি স্থানিক পরিসংখ্যান কোর্সে একটি পরীক্ষাগারের জন্য অনুশীলনের জন্য করা একটি দ্রুত বিশ্লেষণের বিষয়ে রিপোর্ট করব। উদ্দেশ্য ছিল ইউক্লিডিয়ান দূরত্ব ব্যবহারের তুলনায় সম্ভবত ভ্রমণ পথের (পায়ে) সঠিক হিসাবরক্ষণের তুলনামূলক সহজ সরল অনুসন্ধান পদ্ধতিতে কী প্রভাব ফেলবে তা দেখার ছিল: একটি কার্নেল ঘনত্বের অনুমান। যার ঘনত্বের শিখর (বা চূড়াগুলি) তার হ্যান্ড স্নোটি মুছে ফেলা পাম্পের সাথে সম্পর্কিত হবে?

স্নো মানচিত্রের মোটামুটি উচ্চ-রেজোলিউশনের রাস্টার উপস্থাপনা (২৯46 r টি সারি) (সঠিকভাবে জিওরফারেন্সড), আমি মানচিত্রে দেখানো শত শত ছোট্ট কফিনের প্রত্যেককে ডিজিটালাইজ করেছি (তাদের মধ্যে ৫৮৮ টি ঠিকানা খুঁজে পেয়েছি), প্রত্যেককে নির্দিষ্ট করে তার ঠিকানার সাথে সম্পর্কিত রাস্তার প্রান্ত এবং প্রতিটি অবস্থানের একটি গণনায় ঠিকানার সংক্ষিপ্তসার।

ইনপুট ডেটার বিন্দু মানচিত্র

রাস্তাগুলি এবং এলিওয়েগুলি শনাক্ত করার জন্য কিছু চিত্র প্রক্রিয়াকরণের পরে, আমি সেই অঞ্চলগুলিতে সীমাবদ্ধ একটি গাউসিয়ান বিস্তৃতি পরিচালনা করেছি (জিআইএসে বারবার ফোকাল উপায় ব্যবহার করে)। এটি কে।

ফলাফলটি নিজের পক্ষে কথা বলে - এটি ব্যাখ্যা করার জন্য এটি খুব কমই কিংবদন্তির প্রয়োজন। (মানচিত্রটিতে অন্য অনেকগুলি পাম্প দেখানো হয়েছে, তবে এগুলি সমস্ত এই দৃশ্যের বাইরে রয়েছে, যা সর্বোচ্চ ঘনত্বের ক্ষেত্রগুলিকে কেন্দ্র করে))

রঙের সাথে ঘনত্ব দেখায় তুষারের মানচিত্র


কি দারুন. সুতরাং সংক্ষেপে; 1. ভ্রমণের পথটি লিনিয়ারাইজ করুন, ২. এক মাত্রায় স্মুথিং সম্পাদন করুন, ৩.আম্মুশলিকে দুটি মাত্রায় প্রসারিত করুন, ৪. পথের যাত্রাপথে কেডি গড় করুন?
সিলোনডুড

1
স্মুথিং 2D তে সঞ্চালিত হয়েছিল, তবে এটি রঙে দেখানো অঞ্চলে সীমাবদ্ধ। এটি করার অন্যান্য উপায়ও রয়েছে আপনার বর্ণনার অনুরূপ। তবে, "পাথ ট্রিপস" (এগুলি যাই হোক না কেন) গড়ে ওঠার দরকার নেই। এই মানচিত্রটি অংশে আকর্ষণীয় কারণ এটি এক- এবং দ্বি-মাত্রিক জ্যামিতির উভয়ের বৈশিষ্ট্য ভাগ করে।
whuber

রাস্তায় প্রতিটি পয়েন্ট এ এর ​​জন্য, অবস্থানের জায়গাগুলির মধ্যে একে অপরের পয়েন্ট বিয়ের পদক্ষেপের সংখ্যা গণনা করুন। এটিকে কয়েকটি গাউসীয় ঘনত্বের মধ্যে প্লাগ করুন এবং বিটিতে মৃত্যুর সংখ্যার সাথে সেই মানটি বাড়ান point বিন্দু এ কার্নেলের ঘনত্ব পেতে সেই সমস্ত পণ্যগুলি (অর্থাত্ সমস্ত ঠিকানা পয়েন্ট বি এর উপরে) যুক্ত করুন A সমস্ত পয়েন্টের জন্য এটি করুন রাস্তায়. আমরা মানচিত্রে প্রতিটি পয়েন্টে ঘনত্বটি দেখছি। হ্যাঁ?
হাটসেপসুট

2
@ হাটসেপসুট এটি একটি যুক্তিসঙ্গত প্রস্তাব। আমি যা করলাম তা ছিল সামান্য কিছুটা আলাদা। ঠিকানার (উত্স) অবস্থানগুলির প্রতিটি পয়েন্টের জন্য , আপনি বর্ণনা করার সাথে সাথে আমি সেই বিন্দু থেকে হাঁটার দূরত্বের একটি গাউসিয়ান ফাংশন তৈরি করেছি এবং তারপরে আমি এটিকে স্বাভাবিক করেছি যাতে রাস্তার গ্রিডে এর অবিচ্ছেদ্য উত্সের অবস্থানের গণনার সমান হয়। এই ফ্যাশনে প্রতিটি মৃত্যু তার আশেপাশে "ছড়িয়ে পড়ে"। এই মানগুলি দেখানো চিত্র উত্পাদন করতে সমস্ত উত্সের অবস্থানের উপরে সংক্ষিপ্ত করা হয়েছিল। B
whuber

2
@ হাট রাউজ এবং ওয়াকওয়েগুলিতে সীমাবদ্ধ থাকাকালীন গাউসিয়ানদের একটি ইউনিট অবিচ্ছেদ্য বিষয় নয়! এটি এর মাধ্যমে কেটে গেছে এবং এটি পুনর্নির্মাণ করতে হবে।
whuber

19

[১, §৩.২] এ, ডেভিড ফ্রিডম্যান আপনার প্রশ্নের মূলত নেতিবাচক উত্তর দেওয়ার পরামর্শ দিয়েছেন । এটি হ'ল কোনও (নিছক) পরিসংখ্যানের মডেল বা অ্যালগরিদম জন স্নোয়ের সমস্যা সমাধান করতে পারেনি। তুষারের সমস্যা ছিল তার তত্ত্বকে সমর্থন করে একটি সমালোচনামূলক যুক্তি গড়ে তোলা যে কলেরা তার সময়ের প্রচলিত মিয়াসমা তত্ত্বের বিপরীতে কলেরা একটি জলবাহিত সংক্রামক রোগ । ("পরিসংখ্যান মডেলস এবং জুতার চামড়া" শিরোনামে [১] এর ৩ য় অধ্যায়টিও পূর্বে প্রকাশিত আকারে [২] এখানে পাওয়া যায় ))

এই কয়েকটি সংক্ষিপ্ত পৃষ্ঠায় [১, পিপি ––-৫৩], যার বেশিরভাগ অংশই জন স্নো নিজেই একটি বর্ধিত উদ্ধৃতি, ফ্রিডম্যান যুক্তি দিয়েছিলেন যে "1853-554 সালে স্নো আসলে যা করেছে তা কল্পিত [ব্রডের চেয়েও বেশি আকর্ষণীয়" রাস্তার পাম্প] " পরিসংখ্যানগত প্রমাণ হিসাবে মার্শালিংয়ের হিসাবে (অন্যান্য প্রাথমিক বিষয়গুলি যেমন সূচীর কেস সনাক্তকরণ ইত্যাদির পাশাপাশি আলোচনা করা হয়), তুষার প্রাকৃতিক বৈচিত্রকে সত্যই উল্লেখযোগ্য অর্ধ-পরীক্ষার জন্য ব্যবহার করেছিল।

দেখা যাচ্ছে যে পূর্ববর্তী সময়ে লন্ডনে জল সরবরাহকারী সংস্থাগুলির মধ্যে একটি জোরালো প্রতিযোগিতা ছিল এবং এর ফলে জল সরবরাহের স্থানিক মিশ্রণ ঘটে (স্নো-এর ভাষায়) "অত্যন্ত অন্তরঙ্গ ধরণের"।

প্রতিটি সংস্থার পাইপগুলি সমস্ত রাস্তায় এবং প্রায় সমস্ত আদালত এবং গলিগুলিতে যায়। সেই সময় জল সংস্থাগুলি সক্রিয় প্রতিযোগিতায় ছিল তখন মালিক বা দখলকারীর সিদ্ধান্ত অনুযায়ী কয়েকটি বাড়ি একটি সংস্থা সরবরাহ করে এবং কয়েকটি অন্য কর্তৃক সরবরাহ করে।

...

দুটি জল সংস্থার সরবরাহ বা গৃহস্থলীর সরবরাহ বা গৃহস্থলীর মধ্যে যে কোনও পার্থক্য নেই বা যে কোনও শারীরিক অবস্থার সাথে তারা ঘিরে রয়েছে, তাই স্পষ্টতই এমন কোনও পরীক্ষা-নিরীক্ষা করা যেতে পারত না যা আরও পুঙ্খানুপুঙ্খভাবে পরীক্ষা করত এর চেয়ে কলেরার অগ্রগতিতে জল সরবরাহের প্রভাব, যা পরিস্থিতি পর্যবেক্ষকের সামনে তৈরি করে রেখেছিল।

- জন স্নো

জন কোষের এই আধাপূর্ণ পরীক্ষায় 'প্রাকৃতিক ভিন্নতা' ব্যবহারের আরেকটি গুরুত্বপূর্ণ বিষয় হ'ল এক জল সংস্থাটি নর্দমার স্রাবের টেমস নদীর তলদেশে তার পানির সঞ্চার করেছিল , অন্যটি কয়েক বছর আগে তার অভ্যন্তরীণ প্রবাহটি সরিয়ে নিয়েছিল কয়েক বছর আগে । আমি আপনাকে অনুমান করতে দেব যে জন স্নো এর ডেটা টেবিল থেকে ছিল!

                     | | এর সংখ্যা | কলেরা | প্রতি মৃত্যু
সংস্থা | ঘর | মৃত্যু | 10,000 ঘর
-------------------------------------------------- --------
সাউথওয়ার্ক এবং ভক্সহল | 40,046 | 1263 | 315
ল্যাম্বেথ | 26,107 | 98 | 37
লন্ডনের বাকি | 256,423 | 1422 | 59

যেমন ফ্রিডম্যান মূর্খভাবে নোট করে,

পরিসংখ্যান প্রযুক্তির অংশ হিসাবে, [উপরের সারণী] কোনওভাবেই উল্লেখযোগ্য নয়। তবে এটি যে গল্পটি বলেছে তা অত্যন্ত অনুপ্রেরণামূলক। পূর্বের যুক্তিটির স্পষ্টতা থেকে যুক্তিটির জোরের ফলাফল, প্রমাণের বিভিন্ন লাইনকে একত্রিত করা এবং জুতার চামড়ার পরিমাণ তুষার পরিমাণ তথ্য পেতে ব্যবহার করতে ইচ্ছুক ছিল। [1, p.51]

তুষারের দ্বারা ব্যবহৃত অপর একটি প্রাকৃতিক প্রবণতা সময় মাত্রায় ঘটেছিল : উপরের বর্ণিত জলের গ্রহণের স্থানান্তর দুটি মহামারীর মধ্যে ঘটেছিল যা তুষারকে একই সংস্থার জলের সাথে যুক্ত নিকাশীর সাথে এবং ছাড়া তুলনা করতে সক্ষম করে। ( টুইটারের মাধ্যমে এই তথ্যের জন্য [1] এর একজন লেখক ফিলিপ বি স্টার্ককে ধন্যবাদ । তার এই অনলাইন বক্তৃতাটি দেখুন ))


এই উত্তরটি ডিসটেক্টিভিজম এবং ইনডাক্টিভিজমের মধ্যে বিপরীতে একটি শিক্ষণীয় অধ্যয়ন সরবরাহ করে , যেমন এই উত্তরে আলোচনা করা হয়েছে ।

  1. ফ্রিডম্যান ডি, কলিয়ার ডি, সেখন জেএস, স্টার্ক পিবি। পরিসংখ্যান সংক্রান্ত মডেল এবং কার্যকারণ অনুমান: সামাজিক বিজ্ঞানের সাথে একটি সংলাপ। কেমব্রিজ; নিউ ইয়র্ক: কেমব্রিজ বিশ্ববিদ্যালয় প্রেস; 2010।

  2. ফ্রিডম্যান ডি.এ. পরিসংখ্যানের মডেল এবং জুতার চামড়া। সমাজতাত্ত্বিক পদ্ধতি । 1991; 21: 291-313। ডোই: 10.2307 / 270939। সম্পূর্ণ টেক্সট


1
+1 দেখিয়ে দেওয়ার জন্য যে কেবলমাত্র একটি কেন্দ্রস্থল চিহ্নিত করে বলা হয়েছে "জন স্নো'স সমস্যা" সমাধান করতে অপর্যাপ্ত হত। ডেভিড যেভাবে উল্লেখ করেছেন সেই সময় মিয়াসমা তত্ত্ব ছিল এমন একটি প্রচলিত তত্ত্ব। মিয়াসমা তত্ত্বকে মিথ্যা বলার জন্য, আপনাকে দেখতে হবে যে ভৌগলিক হার নদীর সান্নিধ্যের সাথে বাড়ছে না। এই সমস্যার জন্য একটি আধুনিক পদ্ধতির ক্রিগিং ব্যবহার করা যেতে পারে।
অ্যাডমো

ধন্যবাদ, @ অ্যাডামো; কিন্তু আমি ভাবছি Kriging এই ক্ষেত্রে "ঘনিষ্ঠ" স্থানিক মেশানো, প্রায় একটি অপমান বলে মনে হয় যা অন্তর্ভুক্ত হবে ধারাবাহিকতা একটি আবেদন করার জন্য প্রয়োজনীয় ক্ষেপক কৌশল (যেমন আমি Kriging বুঝতে হবে)।
ডেভিড সি নরিস

সম্ভবত আমি তুষারের কথাকে ভুল বুঝেছিলাম: আমার ধারণাটি হ'ল "অন্তরঙ্গ মিশ্রণ [জল পাম্পগুলির সরবরাহের উত্স]" প্রায় এক নিখুঁত ব্লক নকশাকে বোঝায় যেখানে নদী থেকে দূরত্বে স্তরে বিস্তৃত প্রতিটি নগর ব্লকের অন্তত কিছুটা অন্তত কিছুটা জায়গা ছিল সরবরাহকারীদের পাম্প এ, বি, সি ... এই তত্ত্বটিকে সমর্থন করে যা দূষিত জল কলেরা সৃষ্টি করে। ক্রিগিং মায়াসমা হাইপোথিসিসকে প্রত্যাখ্যান করে দেখিয়ে দিয়েছিলেন যে নদীর সাথে নৈকট্য কলেরার প্রকোপের সাথে সম্পর্কিত নয়। এটি পাম্পগুলিতে জল সরবরাহকারীদের দ্বারা সমর্থিত: মিয়াসমা পাইপ দিয়ে ভ্রমণ করে না।
অ্যাডমো

2
@ অ্যাডামো প্রকৃতপক্ষে, উইলিয়াম ফার কলেরার জন্য মৃত্যুর হার অধ্যয়ন করেছিলেন (১৮৯৯ সাল থেকে) এবং তাদেরকে টেমস নদীর ওপরে উন্নয়নের সাথে তুলনা করেছিলেন। এই ভেরিয়েবলগুলির মধ্যে যোগাযোগটি আকর্ষণীয় এবং প্রায় পুরোপুরি মায়াসমা তত্ত্বের ভবিষ্যদ্বাণীগুলির সাথে সঙ্গতিপূর্ণ। ল্যাংমুয়ার এডি দেখুন। ব্যাকটিরিওলজিকাল রিভিউ 25, 174, 1961 ( বিএমজেড / কনটেন্ট / ৩৩৩ / 732727/ / ১৪69৯.ফুল# বি 4 )। এই নিবন্ধটিতে উল্লেখ করা হয়েছে যে ১৮৫৮ সালে ডাঃ তুষারের মৃত্যুর পরেও তাঁর তত্ত্বটি "সরকারী বৃত্তে গৃহীত হয়নি।"
whuber

1
এইসব রেফারেন্সের জন্য অনেক ধন্যবাদ, শুক্রবার। নিরাময়ের পথে, আমি লক্ষ করি ল্যাংমুয়ের নিবন্ধটি খোলা অ্যাক্সেস
ডেভিড সি নরিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.