নির্ভরযোগ্য জনসংখ্যার ভিত্তিক রোগীর মিলের জন্য ন্যূনতম মিলের মানদণ্ডগুলি কী কী?


30

জনসংখ্যার উপাত্তের ভিত্তিতে রোগীদের সাথে মেলে যখন রোগীদের "একই রোগী" হওয়ার জন্য কোন ক্ষেত্রের সাথে মিল রাখতে হবে সে সম্পর্কে কোনও সুপারিশ রয়েছে?

আমি জানি অ্যালগরিদম বিভিন্ন বাস্তবায়নের জন্য আলাদা হবে, এই প্রক্রিয়াটির চারপাশে কোনও সেরা অনুশীলন বা প্রস্তাবনা থাকলে আমি কেবল কৌতূহলী।

First Name
Last Name
Date of Birth
SSN
Address
City
State
Zip

ইত্যাদি?


4
সম্ভবত এই প্রশ্নের উত্তর নির্দিষ্ট দেশে বা এমনকি জাতিগত এবং সাংস্কৃতিক বিবেচনার ভিত্তিতেও পরিবর্তিত হতে পারে। উদাহরণস্বরূপ, কোনও ব্যক্তির নাম অস্ট্রেলিয়ার আদিবাসীদের জন্য ভাল রোগী সনাক্তকারী নাও হতে পারে (বা এটি তাদের ক্ষেত্রে "ওজন" কম দেওয়া উচিত) যেহেতু সময়ের সাথে সাথে তারা নাম পরিবর্তন করতে পারে। অস্ট্রেলিয়ান আদিবাসীরা যারা মৃত হিসাবে একই নাম বহন করে তবে তারা মৃত ব্যক্তির একই নাম বহন করা খুব খারাপ বলে মনে করে। অন্যান্য সংস্কৃতিতেও এরকম কিছু ঘটেছিল মৃতের নাম বারণ। লিঙ্ক

4
বা এখনও-অপ্রকাশিত একটি অধ্যয়ন থেকে অন্য উদাহরণ: মার্কিন যুক্তরাষ্ট্রে ফিলিপিনো অভিবাসীদের মধ্যে, দশটি সাধারণ নামই সমস্ত মানুষের প্রায়%%। ভিয়েতনামী অভিবাসীদের মধ্যে, তারা 60% ডলার করে। নামগুলি ফিলিপিনোগুলিতে ভিয়েতনামীগুলির চেয়ে উল্লেখযোগ্যভাবে আরও ভাল শনাক্তকারী। এটি অধ্যয়নের পরে আমি অবশ্যই স্পষ্টভাবে পোস্ট করব।

কেবল স্পষ্ট করে বলতে: রেকর্ডের দুটি সেট মিলানোর প্রাথমিক লক্ষ্যটি কি?

রেকর্ডগুলি মিলানোর চেষ্টা করার সময় কোনও ম্যাচের শক্তির মধ্যে পার্থক্য নিশ্চিত করতে ভুলবেন না ("বব" "বব" এর সাথে খুব মিল) সম্ভাব্য ম্যাচের সংখ্যা (অনেকগুলি বব রয়েছে) এর বিপরীতে। যদি দুটি রেকর্ডের একই নাম থাকে এবং সেই নামের সাথে অন্য কোনও রেকর্ড না থাকে, তবে ঠিকানাগুলি পৃথক হলেও সম্ভবত এটি একই ব্যক্তি। ধরে নিচ্ছি আপনার অবশ্যই একটি বিশাল কর্পাস রয়েছে।
সমস্ত ব্যবসায়ের জন

উত্তর:


20

আছে এই মহান প্রবন্ধ (স্প্যানিশ, দুঃখিত) পাবলো Pazos উরুগুয়ে থেকে একটি সি এস ইঞ্জিনিয়ার যিনি 2006 থেকে স্বাস্থ্যসেবা এটিতে কাজ করা হয়েছে এবং ক্ষেত্র, যেখানে তিনি এই কাজ করার জন্য একটি আলগোরিদিম বর্ণনা করার কিছু মহান অবদান রেখেছেন দ্বারা লিখিত।

আপনি কোনও অনুবাদকের মাধ্যমে নিবন্ধটি পরিচালনা করতে পারেন, তবে এর সংক্ষিপ্তসারটি হ'ল কোনও ব্যক্তির পরিচয় নির্ধারণের প্রাথমিক তথ্য হ'ল তাদের দেওয়া এবং পরিবারের নাম (বাবা এবং মা উভয়), লিঙ্গ এবং জন্ম তারিখ। আকর্ষণীয়ভাবে যথেষ্ট, তিনি বিশেষত এসএসএন এর মতো আইডি নম্বরগুলি তার পরিচয় মিলে যাওয়া অ্যালগরিদমগুলি থেকে বাদ দেন, যেহেতু "কোনও ধরণের সনাক্তকারী তার পরিচয়ের অংশ নয়" (আমার ধারণা এই বিষয়টি বিতর্কযোগ্য হতে পারে)। এছাড়াও, তিনি রাস্তার ঠিকানা, ফোন নম্বর ইত্যাদির মতো বৈশিষ্ট্যগুলি বাদ দেন কারণ যেহেতু তারা কারও পরিচয়ের সাথে সত্যিকারের সাথে সম্পর্কিত নয়, তারা "কে আসলে আসলে তিনি" এর সাথে সম্পর্কিত নয়।

এছাড়াও, তিনি পূর্বের প্রতিটি বৈশিষ্ট্যের জন্য আলাদা আলাদা "ওজন" বরাদ্দ করেছেন:

  • প্রথম নাম: 17.5%
  • মধ্য নাম: 17.5%
  • পরিবারের নাম (পিতা): ১.5.৫%
  • পরিবারের নাম (মা): ১.5.৫%
  • লিঙ্গ: 10%
  • ডিওবি: 20%

এই বৈশিষ্ট্যগুলির প্রত্যেকটির সাথে মিল পাওয়া যায়, তিনি একটি সংমিশ্রিত "সম্মিলিত ম্যাচ সূচক" প্রাপ্ত করার পদ্ধতিটি বর্ণনা করেছেন যার সাথে রেকর্ডের মধ্যে তুলনা করা সম্ভব। এছাড়াও, নাম বৈশিষ্ট্যাবলী এ "আংশিক" ম্যাচ মত আলগোরিদিম ব্যবহার করে সম্ভব Levenshtein এর দূরত্ব

ভাল পড়া, আইএমও। দুঃখিত এটি স্প্যানিশ ভাষায়, তবে আমি আশা করি আমি এর মূল ধারণাগুলি জানাতে সক্ষম হয়েছি।


2
এই দুর্দান্ত, ধন্যবাদ। +১ দূরত্ব উল্লেখ করার জন্যও টাইপগুলি বিশেষত সাংস্কৃতিক পটভূমির উচ্চ বৈচিত্র্যপূর্ণ সম্প্রদায়ের মধ্যে প্রচলিত কারণ উত্তর আমেরিকাতে প্রায়শই দেখা যায়। এটি বলেছিল, আমি যেখানে সম্ভাব্য মানের ডোমেনের সাথে মেলে এমন বেশিরভাগ দৃষ্টান্তগুলি বেশ সীমাবদ্ধ। সুতরাং এই ক্ষেত্রে কোনও নির্ভরযোগ্য মানদণ্ড (যেমন স্বাস্থ্য বীমা নম্বর) যা ডাটাবেসে একক হিট দেয় তা যথেষ্ট হবে, যদি একাধিক এন্ট্রি ফিরে আসে তবে আমি হয় ব্যবহারকারীকে জিজ্ঞাসা করি (যদি উপলব্ধ থাকে) বা অতিরিক্ত মানদণ্ড দিয়ে ফিল্টার করি।

(... নিয়ন্ত্রিত) নোট করুন যদিও এই কেসগুলি কোনও ক্লিনিক বা হাসপাতালে একটি ইএমআর স্থাপনের ক্ষেত্রে, বা একটি রেডিওআইওলজি বিভাগে একটি আরআইএসের ক্ষেত্রে ভাল প্রয়োগ হয়। এই ক্ষেত্রে গ্রাহক হয় ক্লিনিক বা হাসপাতালে নিবন্ধিত হয় বা হয় না। এমপিআই এর ক্ষেত্রে এটি সম্পূর্ণ নতুন বলের খেলা।

13

রোগীর সাথে মিলে যাওয়ার জন্য কোনও একক যাদু অ্যালগরিদম নেই এবং আমি সন্দেহ করি যে সেখানে কখনও হবে।

প্রারম্ভিকদের জন্য, আঞ্চলিক বৈচিত্র রয়েছে। এমমাতোলি যেমন উল্লেখ করেছেন, মার্কিন যুক্তরাষ্ট্রের একটি নগরীর হাসপাতালে যা ভাল কাজ করে তা সম্ভবত আদিবাসীদের চিকিত্সা করা কোনও গ্রামীণ অস্ট্রেলিয়ান ক্লিনিকের সাথে উপযুক্ত হবে না।

এছাড়াও, পৃথক সাইটগুলির দোষ সহনশীলতার বিষয়ে পৃথক পৃথক মতামত রয়েছে। আপনি যখন সম্পূর্ণরূপে নিশ্চিত তখনই যদি আপনি মেলে , তবে আপনি প্রচুর মিসড ম্যাচগুলি পেয়ে যাবেন। এটি নকল রোগীর রেকর্ডগুলির কারণ ঘটায়, যা সম্পূর্ণ অন্যান্য সেট সমস্যার সৃষ্টি করে। বেশিরভাগ সাইটগুলি বেশ নিখুঁত নিশ্চিতরূপে নিষ্পত্তি করতে ইচ্ছুক হবে তবে কতটা নিশ্চিত নিশ্চিত? 10 জনকে জিজ্ঞাসা করুন এবং 12 টি উত্তর পাবেন।

সুতরাং "সেরা" অ্যালগরিদমটি কনফিগারযোগ্য হবে, যাতে আপনার গ্রাহকরা তাদের প্রয়োজনীয়তার সাথে মানিয়ে নিতে এটি টিউন করতে পারেন।

কোনও ম্যাচ বিবেচনা করার সময়, বিভিন্ন ক্ষেত্রগুলি বিভিন্ন ধরণের আত্মবিশ্বাসের প্রস্তাব দেয়।

স্বাস্থ্যসেবা-নির্দিষ্ট সনাক্তকারীরা সবচেয়ে বেশি আত্মবিশ্বাসের প্রস্তাব দেয়, কারণ তাদের পুরো উদ্দেশ্যটি স্বাস্থ্য ব্যবস্থার মধ্যে থাকা ব্যক্তিকে অনন্যভাবে চিহ্নিত করা। এগুলি সদৃশ না হয় তা নিশ্চিত করার জন্য হাসপাতালগুলি সাধারণত ব্যথা নেয়।

উদাহরণ:

  • জাতীয় স্বাস্থ্য আইডি (যেমন ইউ কে এনএইচএস নম্বর)
  • হাসপাতাল-নির্ধারিত মেডিকেল রেকর্ড নম্বর।

অন্যান্য রোগী শনাক্তকারীরা সিস্টেমের উপর নির্ভর করে উচ্চ আত্মবিশ্বাসের প্রস্তাবও দিতে পারেন । উদাহরণস্বরূপ, সামরিক আইডি সম্ভবত সামরিক হাসপাতালে খুব প্রাসঙ্গিক।

উদাহরণ:

  • সামরিক আইডি
  • বীমা আইডি
  • সামাজিক সুরক্ষা নম্বর (মার্কিন যুক্তরাষ্ট্রে, সামাজিক নিরাপত্তা নম্বরটি সাধারণত জালিয়াতি বীমা জালিয়াতির কারণে একটি উচ্চ-আত্মবিশ্বাসের ম্যাচ হিসাবে বিবেচিত হয় না ))

অনন্য শনাক্তকারীদের অভাবে, একজনকে অবশ্যই জনসংখ্যার তথ্য অবলম্বন করতে হবে। যে কোনও একটি মাঠে ম্যাচ করার পরামর্শ দেওয়া হয় না , তবে জনসংখ্যার ক্ষেত্রের ম্যাচ যত বেশি হয় ম্যাচটি তত বেশি আত্মবিশ্বাসী হয়।

এমন ব্যক্তির বিষয়ে যেগুলি প্রায়শই পরিবর্তন হয় না সেগুলি ম্যাচের জন্য ভাল:

  • নাম
  • লিঙ্গ
  • জন্ম তারিখ

আত্মবিশ্বাস বাড়াতে ম্যাচের মধ্যে আরও ত্রুটিযুক্ত তথ্য বিবেচনা করা যেতে পারে:

  • ঠিকানা
  • ফোন নম্বর
  • ইমেল ঠিকানা

3
এসএসএন এর কিছুটা কঠোর বিধিনিষেধও রয়েছে, উদাহরণস্বরূপ কানাডায় আপনি যদি নিয়োগকর্তা বা ব্যাঙ্ক না হন (তবে আরও কিছু লোকও আমি আইনজীবী নন) তবে এটি চাওয়া অবৈধ। চীনের মতো অন্যান্য জায়গাগুলি তারা প্রায় কোনও কিছুর জন্য এমনকি উচ্চ ট্র্যাফিকের ছুটিতে ট্রেনের টিকিট কেনার জন্য এটি ব্যবহার করে।

আপনি যদি মহিলা হন তবে নাম পরিবর্তনগুলি সাধারণ। এবং দু'জন লোকের প্রায়শই একই নাম থাকে এবং এমনকি একই জায়গায় থাকে (উদাহরণস্বরূপ তাঁর ছেলের নাম রাখা একটি পিতা)।
এইচএলজিইএম

@ এইচএলজিইএম: পুরোপুরি সঠিক, যে কারণে কোনও একক ডেমোগ্রাফিক ক্ষেত্রটি ম্যাচের জন্য ব্যবহার করা উচিত নয়। কিন্তু যখন লোকেদের এটি অবলম্বন করতে হয়, বিকল্পের চেয়ে আরও স্থিতিশীল ক্ষেত্র (যা তবুও কখনও কখনও পরিবর্তিত হয়) আরও নির্ভরযোগ্য। যদিও এটি তাদের ভাল করে না।
লিন

7

পূর্ববর্তী লাস্টনামগুলি প্রায়শই পরিবর্তিত হওয়ায় এটি পরীক্ষা করাও উপযুক্ত।


+1 "প্রায়শই" একটি সংক্ষিপ্তসার। :) এটি অবশ্যই সনাক্তকারী বা নামবিহীন, নবজাতক, ভুল পরিচয়হীন ইত্যাদি রোগীদের ক্ষেত্রে এটি হতে পারে। প্রচুর লেনদেনের পরিবেশে নামগুলি আরও কঠিন, আরও তাত্পর্যপূর্ণ।

4

আপনার প্রশ্নে প্রদত্ত নিম্নলিখিত তিনটির সুস্পষ্ট সংমিশ্রণগুলি বাদে

First Name
Last Name
Date of Birth
City
State
ZIP/Pin Code

আমি যোগ করার চিন্তা করব phone number (Home and/or Cell) তালিকায় করার । আজকাল এটি বেশ সাধারণ এবং প্রত্যেকটির একটি স্বতন্ত্র নম্বর থাকবে এবং এমনকি যদি কিছু সময় লোকেরা তাদের ফোন নম্বরগুলি পরিবর্তন করে, পুরানো ফোন নম্বরগুলি বেশিরভাগ লোক মনে রাখে, তাই সহজেই আসতে পারে।

আমরা দেখতে পেয়েছি যে ঠিকানাটি প্রায়শই একাধিক বানান এবং রেন্ডারিংয়ের একাধিক উপায়ে বিশেষত ভারতের মতো দেশগুলিতে ভুগছে যেখানে লোকেরা স্থানীয় ভাষা এবং রোগী পরিচালনার সফটওয়্যারগুলি 'এখনও' ব্যবহার করে ইংরেজী ব্যবহার করে।


3

রেকর্ডগুলিতে লিঙ্গটি প্রায়শই প্রথম নাম থেকে প্রাপ্ত বলে মনে হয়। আমি বিদেশিদের ক্ষেত্রে লিঙ্গভেদে বৃদ্ধি পেয়েছি, যখন আমরা নামটি থেকে লিঙ্গ বের করতে পারি না।

জার্মানিতে 'la' এর মতো 'উমলাউট' সম্বলিত নামের সাথে আমাদের আরও কিছু বৈকল্পিক রয়েছে যা কখনও কখনও 'আয়ে ওয়ে' দ্বারা প্রতিস্থাপিত হয়।


1

আমার চিন্তা 1 নীচের মত ক্রম হয়)। এসএসএন, পদবি এবং প্রথম নামের প্রথম 5 টি অক্ষর)। এসএসএন, জন্ম তারিখ এবং প্রথম নামের প্রথম 5 অক্ষর 3)। এসএসএন, জন্ম তারিখ এবং শেষ নাম 4)। এসএসএন, লিঙ্গ, জন্ম তারিখ 5)। শেষ নাম, প্রথম নামটির প্রথম 5 টি অক্ষর, শহর এবং জিপ


1

এটি মার্কিন যুক্তরাষ্ট্রে একটি সত্যই কঠিন সমস্যা। নামগুলি অনন্য নয় এবং প্রায়শই কোনও ব্যক্তির জীবদ্দশায় পরিবর্তিত হয় বা পৃথকভাবে উপস্থাপিত হয় (উদাহরণস্বরূপ রব বনাম রবার্ট), তাই এগুলি আরও কিছু সত্যিকারের তথ্যের সাথে মিল রেখে রোগীকে সনাক্ত করতে কখনই ব্যবহার করা যাবে না। স্বাস্থ্য বীমা নম্বর এবং সরবরাহকারী আরও ঘন ঘন পরিবর্তিত হয় এবং পরিবারের একাধিক সদস্যের জন্য এটি একই হতে পারে। এসএসএন ধারণা করা যায় এটি অনন্য, তবে এর চারপাশে জালিয়াতি রয়েছে। ড্রাইভারের লিসেন্স নম্বরটি একই, যা অবশ্যই সবার কাছে থাকবে না।

ব্যক্তিগতভাবে, আমি বীমা পলিসির নম্বর এবং জন্ম তারিখ এবং নাম সংমিশ্রণ, তারপরে এসএসএন এবং জন্ম তারিখ এবং নাম সংমিশ্রণ দিয়ে শুরু করব। যখন তারা মেলে তখন আমাকে অ্যাডিশনাল নিশ্চয়তা দেওয়ার জন্য ঠিকানা এবং ফোনটি পরীক্ষা করে দেখি তবে তারা ওজন না দেয়। সংযোজন হিসাবে আমি রক্তের ধরণটি একটি নিয়ম আউট ফ্যাক্টর হিসাবে ব্যবহার করব যদি এটি জানা থাকে (এবং আমরা সবাই জানি যে হাসপাতালের ভ্যাম্পায়ারগুলি রক্তের নমুনা গ্রহণ করবে) যেহেতু এটি পরিবর্তন হয় না doesn't নামটির বৈচিত্র্যের সমস্যার কারণে নামের সাথে মিল থাকা আবছা ম্যাচ হবে। নামগুলির আত্মবিশ্বাস সত্যিই বেশি হলে (এসএসএন-এ প্রবেশ করানো টাইপও হতে পারে) অন্য জিনিসগুলিতে সাধারণত প্রথম তাসনা ফাজি ম্যাচের সন্ধান করা উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.