দাবিগুলির ডেটাতে পূর্ববর্তী অবস্থা থেকে পরবর্তী চিকিত্সা শর্তের পূর্বাভাস


12

আমি বর্তমানে স্বাস্থ্য বীমা দাবির একটি বড় সংখ্যার ডেটা নিয়ে কাজ করছি যাতে কিছু পরীক্ষাগার এবং ফার্মাসির দাবী অন্তর্ভুক্ত রয়েছে। ডেটা সেটে সর্বাধিক ধারাবাহিক তথ্যগুলি নির্ণয় (আইসিডি -9 সিএম) এবং পদ্ধতি কোডগুলি (সিপিটি, এইচসিএসপিএস, আইসিডি -9 সিএম) দিয়ে তৈরি।

আমার লক্ষ্যগুলি হ'ল:

  1. দীর্ঘস্থায়ী কিডনি রোগের মতো চিকিত্সার অবস্থার জন্য সর্বাধিক প্রভাবশালী পূর্বসূরি শর্তগুলি (কমোর্বিডিটিস) সনাক্ত করুন;
  2. সম্ভাবনা (বা সম্ভাবনা) সনাক্ত করুন যে একজন রোগী অতীতে যে পরিস্থিতিতে ছিলেন তার উপর ভিত্তি করে কোনও চিকিত্সা অবস্থার বিকাশ ঘটবে;
  3. 1 এবং 2 এর মতো করুন, তবে পদ্ধতি এবং / অথবা ডায়াগনোসিস সহ।
  4. সাধারণত, ফলাফলগুলি কোনও ডাক্তার দ্বারা ব্যাখ্যাযোগ্য হবে

আমি হেরিটেজ স্বাস্থ্য পুরষ্কার মাইলস্টোন কাগজগুলির মতো জিনিসগুলি দেখেছি এবং সেগুলি থেকে অনেক কিছু শিখেছি, তবে তারা হাসপাতালে ভর্তির পূর্বাভাস দেওয়ার দিকে মনোনিবেশ করেছে।

সুতরাং এখানে আমার প্রশ্নগুলি: আপনি কী মনে করেন যে এই জাতীয় সমস্যাগুলির জন্য কী কী পদ্ধতিগুলি ভাল কাজ করে? এবং, ডেটা বিজ্ঞান অ্যাপ্লিকেশন এবং স্বাস্থ্যসেবা এবং ক্লিনিকাল medicineষধের সাথে সম্পর্কিত পদ্ধতিগুলি সম্পর্কে শেখার জন্য কোন সংস্থানগুলি সবচেয়ে বেশি কার্যকর হবে?

প্লেটেক্সট টেবিল যোগ করতে # 2 সম্পাদনা করুন:

"ক্রনিক কিডনি ডিজিজ", ".কিন্ড" চিহ্নিত শর্তটি হ'ল তারা বোঝায় যে তারা যে কোনও সময় এই শর্তটি অর্জন করেছিল, ".isbefore.ckd" এর অর্থ তারা সিকেডির প্রথম নির্ণয়ের আগে তাদের এই অবস্থাটি ছিল। অন্যান্য সংক্ষিপ্ত বিবরণ আইসিডি -9 সিএম কোড গ্রুপিং দ্বারা চিহ্নিত অন্যান্য শর্তের সাথে মিল রাখে। আমদানি প্রক্রিয়া চলাকালীন এসকিউএলে এই গোষ্ঠীকরণ ঘটে। প্রতিটি পরিবর্তনশীল, রোগী_এজ ব্যতীত, বাইনারি হয়।


1
আপনি কিছু উদাহরণ ডেটা সরবরাহ করতে পারেন (সরল ইংরাজীতে, কোনও কোড নেই)?
বন্ধু

আমি আমার মূল পোস্টে কিছু উদাহরণ ডেটা যুক্ত করেছি। এই সংস্করণে, প্রতিটি শর্ত তিনটি চিঠি কোড দ্বারা চিহ্নিত করা হয়।
জেমি

1
আর দুর্দান্ত, তবে খুব মনুষ্য-পঠনযোগ্য নয়। আপনি কি দয়া করে আপনার ডেটা নমুনাকে একটি টেবিল হিসাবে পুনরায় ফর্ম্যাট করতে পারেন (যেমন, সিএসভি বা টিএসভি ফর্ম্যাট ব্যবহার করে; 5-6 কলামগুলি ঠিক আছে)? এছাড়াও, ভেরিয়েবলগুলির কিছু ব্যাখ্যা (কী "উদ্বেগের সাথে কোনটি", "ফ্লু.আইসবেফার.সিডি" ইত্যাদি ইত্যাদি আসলে বোঝায় এবং কী ভবিষ্যদ্বাণী করা উচিত) অনেক সহায়তা করবে।
30:44

1
আপনি কি ডেটা সেটে ব্যবহৃত প্যারামিটারগুলিতে আরও তথ্য সরবরাহ করতে পারেন যাতে কোনও পারস্পরিক সম্পর্ক রয়েছে কিনা তা আমরা বুঝতে পারি। আপনার দ্বারা বর্ণিত কয়েকটি সংক্ষিপ্ত বিবরণ আমার কাছে পরিষ্কার নয়। অফলাইনে সহযোগিতা করার জন্য আপনি যদি আমাদের ইমেল-আইডি ভাগ করে নিতে পারেন তবে দুর্দান্ত হবে। ধন্যবাদ!
জনগ্যাল্ট

1
এটি কেবলমাত্র সামান্য সম্পর্কিত, তবে আমাদের অতি সাম্প্রতিক ডেটা বিজ্ঞান চ্যালেঞ্জ অন্যান্য দাবি থেকে দাবি পূর্বাভাস সম্পর্কিত concerned cloudera.com/content/cloudera/en/training/certification/ccp-ds/… সমাধানটি প্রকাশিত হলে এতে কয়েকটি আকর্ষণীয় ধারণা থাকতে পারে।
শন ওয়েন

উত্তর:


7

আমি কখনও মেডিক্যাল ডেটা নিয়ে কাজ করি নি, তবে সাধারণ যুক্তি থেকে আমি বলব যে স্বাস্থ্যসেবাতে ভেরিয়েবলের মধ্যে সম্পর্ক বেশ জটিল। বিভিন্ন মডেল, যেমন এলোমেলো বন, রিগ্রেশন ইত্যাদির মাধ্যমে সম্পর্কের কেবলমাত্র অংশই ধরা পড়ে এবং অন্যকে উপেক্ষা করতে পারে। এই পরিস্থিতিতে সাধারণ পরিসংখ্যান অনুসন্ধান এবং মডেলিং ব্যবহার করা বোধগম্য হয় ।

উদাহরণস্বরূপ, আমি প্রথম যেটি করবো তা হ'ল সম্ভাব্য পূর্ববর্তী পরিস্থিতি এবং নির্ণয়ের মধ্যে পারস্পরিক সম্পর্ক খুঁজে বের করা । যেমন দীর্ঘ শতাংশে ফ্লুতে আক্রান্ত হওয়ার আগে কিডনি রোগের কত শতাংশ ক্ষেত্রে? যদি এটি উচ্চ হয়, তবে এটি সর্বদা কার্যকারিতা বোঝায় না , তবে চিন্তার জন্য বেশ ভাল খাবার দেয় এবং বিভিন্ন অবস্থার মধ্যে সম্পর্কগুলি আরও ভালভাবে বুঝতে সহায়তা করে।

আর একটি গুরুত্বপূর্ণ পদক্ষেপ হ'ল ডেটা ভিজ্যুয়ালাইজেশন। মহিলাদের চেয়ে সিকেডি কি পুরুষদের মধ্যে বেশি প্রায়ই ঘটে? তাদের বাসস্থান সম্পর্কে কি? বয়স অনুসারে সিকেডি কেসের বিতরণ কী? সংখ্যার একটি সেট হিসাবে বড় ডেটাसेटকে ধরে রাখা শক্ত, তাদের প্লট করা এটিকে আরও সহজ করে তোলে।

কী চলছে তা সম্পর্কে আপনার ধারণা থাকলে, আপনার অনুমানটি যাচাই করার জন্য অনুমানের পরীক্ষা করুন। আপনি যদি বিকল্পটির পক্ষে নাল অনুমান (মৌলিক ধারণা) প্রত্যাখ্যান করেন, অভিনন্দন, আপনি "সত্যিকারের কিছু" করেছেন।

শেষ অবধি, আপনার যখন আপনার ডেটা সম্পর্কে ভাল ধারণা থাকবে তখন সম্পূর্ণ মডেল তৈরি করার চেষ্টা করুন । এটি পিজিএমের মতো সাধারণ কিছু হতে পারে (যেমন ম্যানুয়ালি-কারুকৃত বায়েশিয়ান নেটওয়ার্ক), বা লিনিয়ার রিগ্রেশন বা এসভিএম এর মতো আরও নির্দিষ্ট কিছু। তবে যে কোনও উপায়ে আপনি ইতিমধ্যে জানবেন যে এই মডেলটি কীভাবে আপনার ডেটার সাথে সামঞ্জস্য করে এবং আপনি কীভাবে এর দক্ষতা পরিমাপ করতে পারবেন।


পরিসংখ্যানগত পদ্ধতির শেখার জন্য একটি ভাল সূচনা সংস্থান হিসাবে আমি সেবাস্তিয়ান থ্রুন দ্বারা পরিসংখ্যান কোর্সের ইন্ট্রোর প্রস্তাব দেব । যদিও এটি বেশ বেসিক এবং উন্নত বিষয়গুলির অন্তর্ভুক্ত নয়, এটি সর্বাধিক গুরুত্বপূর্ণ ধারণাগুলির বর্ণনা দেয় এবং সম্ভাব্যতা তত্ত্ব এবং পরিসংখ্যানগুলির পদ্ধতিগত বোঝাপড়া দেয়।


এর জন্য ধন্যবাদ! এটি ইতিমধ্যে আমি নেওয়া কয়েকটি পদক্ষেপের (অনুসন্ধানী বিশ্লেষণ, হাইপোথিসিস টেস্টিং ইত্যাদি) নিশ্চিত করে।
জেমি

7

যদিও আমি কোনও ডেটা বিজ্ঞানী নই, আমি ক্লিনিকাল সেটিংয়ে কর্মরত একটি এপিডেমিওলজিস্ট। আপনার গবেষণা প্রশ্ন একটি সময়কাল নির্দিষ্ট করে নি (অর্থাত্ 1 বছর, 10 বছর, আজীবন সিকেডি বিকাশের প্রতিক্রিয়া?)

সাধারণত, আমি মডেলিংয়ের বিষয়ে চিন্তাভাবনা করার আগেও অনেকগুলি পদক্ষেপ নিয়ে যাব (ইউনিভারিটি বিশ্লেষণ, দ্বিখণ্ডিত বিশ্লেষণ, কোলিনারিটি চেক ইত্যাদি)। তবে, বাইনারি ইভেন্টের পূর্বাভাস দেওয়ার চেষ্টা করার জন্য সর্বাধিক ব্যবহৃত পদ্ধতি (ক্রমাগত বা বাইনারি ভেরিয়েবলগুলি ব্যবহার করে) লজিস্টিক রিগ্রেশন। আপনি যদি সিকেডিকে একটি ল্যাব মান হিসাবে (ইউরিন অ্যালবামিন, ইজিএফআর) দেখতে চান তবে আপনি লিনিয়ার রিগ্রেশন (অবিচ্ছিন্ন ফলাফল) ব্যবহার করবেন।

যদিও ব্যবহৃত পদ্ধতিগুলি আপনার ডেটা এবং প্রশ্নগুলি দ্বারা অবহিত করা উচিত, চিকিত্সকরা প্রতিকূল অনুপাত এবং ঝুঁকি অনুপাতগুলি দেখতে অভ্যস্ত, কারণ এগুলি মেডিকেল জার্নালগুলিতে যেমন এনইজেএম এবং জ্যামার সংঘের সর্বাধিক প্রকাশিত ব্যবস্থা।

যদি আপনি এই সমস্যা নিয়ে মানব স্বাস্থ্যের দৃষ্টিকোণ থেকে (ব্যবসায় গোয়েন্দার বিপরীতে) কাজ করে থাকেন তবে এই স্টিয়ারবার্গের ক্লিনিকাল প্রেডিকশন মডেলগুলি একটি দুর্দান্ত উত্স।


1
সহায়ক পরামর্শের জন্য ধন্যবাদ। আমি অবশ্যই বইটি পরীক্ষা করে দেখব! যদিও ল্যাব মানগুলিতে আমার অ্যাক্সেস রয়েছে তবে ডেটা অবিশ্বাস্য এবং বিক্ষিপ্ত হয়, তাই আমি দাবি থেকে যে তথ্য পেতে পারি সেগুলিতে লেগে থাকার চেষ্টা করছি। পরিবর্তনশীল সংক্ষিপ্তরগুলি হ'ল এএইচআরকিউ ক্লিনিক্যাল ক্লাসিফিকেশন সফ্টওয়্যার ডায়াগনসিস কোডগুলির গ্রুপিং।
জেমি

3

"দীর্ঘস্থায়ী কিডনি রোগের মতো চিকিত্সার অবস্থার জন্য সর্বাধিক প্রভাবশালী পূর্বসূরি শর্তগুলি (কমোরিবিডিটিস) সনাক্ত করুন"

আমি নিশ্চিত যে এটা আইডি সম্ভব নই সবচেয়ে প্রভাবশালী শর্তাবলী; আমি মনে করি এটি আপনি কোন মডেলটি ব্যবহার করছেন তার উপর নির্ভর করবে। গতকালই আমি একই তথ্যতে একটি এলোমেলো বন এবং একটি উত্সাহিত রিগ্রেশন ট্রি ফিট করি এবং প্রতিটি মডেল ভেরিয়েবলগুলির জন্য যে ক্রম এবং আপেক্ষিক গুরুত্ব দিয়েছিল তা বেশ আলাদা ছিল।


ধন্যবাদ, অ্যান্ডি আপনি কি একটু বিস্তারিত বলতে পারেন? এটি কি কারণ ভেরিয়েবলগুলি যথেষ্ট বিশদ ক্যাপচার করে না?
জেমি

আমার কোন ধারণা নাই. আমার ধারণা এটি বিভিন্ন মডেল কীভাবে কাজ করে তার উপর নির্ভর করে।
জেনএসসিডিসি

আপনি চেষ্টা করেছেন বা বিবেচনা করেছেন এমন কয়েকটি সমাধানের পরামর্শ দিতে পারেন?
জেমি

এখন পর্যন্ত আমি হয় না, তাই সেখানে কোন সাহায্য। দুঃখিত।
জেনএসসিডিসি

আমি এখন পরের কয়েক সপ্তাহের জন্য ছুটিতে আছি, কিন্তু আমি ফিরে এলে আমি এটি সন্ধান করব কারণ এটি আমার আগ্রহকে সত্যই প্রভাবিত করেছে।
জেনএসসিডিসি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.