আমার কীভাবে এই বাইনারি ভবিষ্যদ্বাণী সমস্যার কাছে যাওয়া উচিত?


9

আমি নিম্নলিখিত ফর্ম্যাট সহ একটি ডেটাसेट পেয়েছি।

ক্যান্সারের পূর্বাভাস নেই ক্যান্সার

একটি বাইনারি ফলাফল ক্যান্সার / ক্যান্সার নেই। ডাটাসেটের প্রতিটি ডাক্তার প্রতিটি রোগীকে দেখেছেন এবং রোগীর ক্যান্সার রয়েছে কিনা সে বিষয়ে একটি স্বাধীন রায় দিয়েছেন। চিকিত্সকরা তাদের 5 টির মধ্যে তাদের আত্মবিশ্বাসের স্তরটি দেন যে তাদের নির্ণয়টি সঠিক, এবং আত্মবিশ্বাসের স্তরটি বন্ধনীগুলিতে প্রদর্শিত হয়।

আমি এই ডেটাসেট থেকে ভাল পূর্বাভাস পেতে বিভিন্ন উপায়ে চেষ্টা করেছি।

এটি আমার পক্ষে চিকিত্সকদের জুড়ে গড়ের পক্ষে বেশ ভালভাবে কাজ করে, তাদের আত্মবিশ্বাসের মাত্রা উপেক্ষা করে। উপরের সারণীতে এতে রোগী 1 এবং রোগীর 2 এর সঠিক নির্ণয় করা সম্ভব হবে, যদিও এটি ভুলভাবে বলে উঠত যে রোগীর 3 টিতে ক্যান্সার রয়েছে, যেহেতু 2-1 সংখ্যাগরিষ্ঠ দ্বারা চিকিত্সকরা মনে করেন রোগীর 3 টি ক্যান্সার রয়েছে।

আমি এমন একটি পদ্ধতিও চেষ্টা করেছিলাম যাতে আমরা এলোমেলোভাবে দুটি ডাক্তারকে নমুনা দিয়েছি এবং যদি তারা একে অপরের সাথে একমত না হয় তবে সিদ্ধান্ত নেওয়া ভোটটি যেকোন চিকিত্সকের কাছে বেশি আত্মবিশ্বাসী to এই পদ্ধতিটি অর্থনৈতিক যেটিতে আমাদের অনেক চিকিত্সকের পরামর্শের প্রয়োজন নেই, তবে এটি ত্রুটির হারকেও খানিকটা বাড়িয়ে তোলে।

আমি একটি সম্পর্কিত পদ্ধতি চেষ্টা করেছি যাতে আমরা এলোমেলোভাবে দুটি ডাক্তার নির্বাচন করি এবং তারা একে অপরের সাথে একমত না হলে আমরা এলোমেলোভাবে আরও দু'জনকে নির্বাচন করি। যদি কোনও রোগ নির্ণয় কমপক্ষে দুটি 'ভোট' দিয়ে এগিয়ে থাকে তবে আমরা সেই রোগ নির্ণয়ের পক্ষে সমাধান করি। যদি তা না হয়, আমরা আরও ডাক্তারদের নমুনা বজায় রাখি। এই পদ্ধতিটি বেশ অর্থনৈতিক এবং খুব বেশি ভুল করে না।

আমি অনুভূতিতে সাহায্য করতে পারি না যে আমি কিছু করার জন্য আরও কিছু অত্যাধুনিক উপায় মিস করছি। উদাহরণস্বরূপ, আমি অবাক হয়েছি যে আমি যদি ডেটাसेटকে প্রশিক্ষণ এবং পরীক্ষার সেটগুলিতে বিভক্ত করতে পারি এবং ডায়াগনসিসকে একত্রিত করার জন্য সর্বোত্তম উপায় নিয়ে কাজ করতে পারি, এবং তারপরে পরীক্ষাগুলিতে সেগুলি ওজন কীভাবে সম্পাদন করে তা দেখুন। একটি সম্ভাবনা হ'ল এক ধরণের পদ্ধতি যা আমাকে নিম্ন ওজনের ডাক্তারদের ট্রায়াল সেটে ভুল করতে থাকে এবং উচ্চ আত্মবিশ্বাসের সাথে সম্ভবত উচ্চতর ওজন নির্ণয় করতে দেয় (আত্মবিশ্বাসটি এই ডেটাসেটে নির্ভুলতার সাথে সম্পর্কিত)।

আমি এই সাধারণ বিবরণটির সাথে মিলে বিভিন্ন ডেটাসেট পেয়েছি, সুতরাং নমুনার আকারগুলি পৃথক হয় এবং সমস্ত ডেটাসেটগুলি চিকিত্সক / রোগীদের সাথে সম্পর্কিত নয়। যাইহোক, এই নির্দিষ্ট ডেটাসেটে 40 জন চিকিৎসক আছেন, যারা প্রত্যেকে 108 জন রোগী দেখেছেন।

সম্পাদনা: আমার @ জেরেমি-মাইলস উত্তরটি পড়ে আমার কিছু ফলাফলের লিঙ্ক এখানে

  1. অপ্রকাশিত ফলাফল প্রথম কলামে। আসলে এই ডেটাসেটে সর্বাধিক আত্মবিশ্বাসের মান 4 ছিল, 5 নয় যা আমি ভুল করে আগে বলেছিলাম। এইভাবে @ জেরেমি-মাইলস অনুসরণের পরে যে কোনও রোগী সর্বোচ্চ অসমর্থিত স্কোর be হতে পারে That এর অর্থ হ'ল আক্ষরিক অর্থেই প্রতিটি ডাক্তার 4 এর আত্মবিশ্বাসের মাত্রায় জোর দিয়েছিলেন যে রোগীর ক্যান্সার হয়েছিল। যে কোনও রোগী সবচেয়ে কম অপ্রত্যাশিত স্কোর পেতে পারে এটি 0, যার অর্থ প্রতিটি রোগীর ক্যান্সারে আক্রান্ত না হওয়ার আত্মবিশ্বাসের মাত্রা 4 দিয়েছিল।

  2. ক্রোনবাচের আলফা দ্বারা ওজন। আমি এসপিএসে দেখতে পেলাম যে একটি সামগ্রিক ক্রোনবাচের আলফা ছিল 0.9807। আমি আরও ম্যানুয়াল পদ্ধতিতে ক্রোনবাচের আলফা গণনা করে যাচাই করেছিলাম যে এই মানটি সঠিক ছিল। আমি 40 টি চিকিত্সকের একটি কোভেরিয়েন্স ম্যাট্রিক্স তৈরি করেছি, যা আমি এখানে পেস্ট করেছি । তারপরে ক্রোনব্যাকের সূত্রটি আমার বোঝার ভিত্তিতে যেখানে আইটেমের সংখ্যা (এখানে চিকিত্সকরা 'আইটেম') আমি ম্যাট্রিক্সের সমস্ত তির্যক উপাদানগুলির and এবং সমস্ত উপাদানগুলিকে করে কোভেরিয়েন্স ম্যাট্রিক্স। আমি তখন পেয়েছিα=KK1(1σxi2σT2)Kσxi2σT2α=40401(18.7915200.7112)=0.9807 আমি তখন 40 টি আলাদা ক্রোনব্যাক ফলাফল গণনা করি যা প্রতিটি ডাক্তার যখন অপসারণ করা হবে তখন ঘটবে ডেটা সেটটি। ক্রোনবাচের আলফায় শূন্যে নেতিবাচকভাবে অবদান রেখে এমন কোনও ডাক্তারকে আমি ভারী করেছিলাম। ক্রোনবাচের আলফায় তাদের ইতিবাচক অবদানের সমানুপাতিক অবশিষ্ট ডাক্তারদের জন্য আমি ওজন নিয়ে এসেছি।

  3. মোট আইটেম সংশোধন দ্বারা ওজন। আমি সমস্ত সামগ্রিক আইটেম সম্পর্কিত সম্পর্কিত গণনা করি এবং তারপরে প্রতিটি ডাক্তারের ওজনের সম্পর্কগুলির আকারের সাথে আনুপাতিক।

  4. রিগ্রেশন কোফিয়েনটিস দ্বারা ওজন।

একটি জিনিস আমি এখনও নিশ্চিত নই যে কোন পদ্ধতিটি অন্যটির চেয়ে "আরও ভাল" কাজ করছে তা কীভাবে বলা যায়। পূর্বে আমি পিয়ার্স স্কিল স্কোরের মতো জিনিসগুলি গণনা করছিলাম, যা উদাহরণস্বরূপ উপযুক্ত যেখানে বাইনারি পূর্বাভাস এবং বাইনারি ফলাফল রয়েছে for যাইহোক, এখন আমার 0 থেকে 1 এর পরিবর্তে 0 থেকে 7 অবধি পূর্বাভাস রয়েছে আমি কি সমস্ত ভারী স্কোর> 3.50 থেকে 1 এবং সমস্ত ওজনযুক্ত স্কোর <3.50 থেকে 0 তে রূপান্তর করব?


আমরা কি বলতে পারি যে No Cancer (3)হয় Cancer (2)? এটি আপনার সমস্যাটিকে কিছুটা সহজ করবে।
ওয়েইন

1
উত্তর: আপনার ডেটা স্ট্রাকচার, বিভিন্ন কলামে বিভিন্ন ভেরিয়েবল (রোগীর ক্যান্সার রয়েছে কিনা; মূল্যায়ন কতটা আত্মবিশ্বাসী) হওয়া প্রায় সবসময়ই ভাল। এগুলিকে "ক্যান্সার নয় (3) হিসাবে মিশ্রিত করা আপনার বিকল্পগুলিকে মারাত্মকভাবে সীমাবদ্ধ করে।
Rolando2

@ ওয়াইন সর্বাধিক আত্মবিশ্বাসের সাথে ক্যান্সারের পূর্বাভাস থেকে শুরু করে সর্বোচ্চ আত্মবিশ্বাসের Cancer (4)সাথে কোনও ক্যান্সারের পূর্বাভাস পর্যন্ত ডেটা নেই No Cancer (4)। আমরা এটি বলতে পারি না No Cancer (3)এবং Cancer (2)একইরকম, তবে আমরা বলতে পারি একটি ধারাবাহিকতা রয়েছে Cancer (1)এবং এই ধারাবাহিকের মাঝের পয়েন্টগুলি হয় এবং No Cancer (1)
ব্যবহারকারী1205901 - মনিকা

@ Rolando2 পরামর্শের জন্য ধন্যবাদ। আমি আমার নিজের ডেটা ফাইলে জিনিসগুলিকে পুনরায় সাজিয়েছি যাতে এখন সেগুলি আলাদা হয়ে যায়।
ব্যবহারকারী1205901 - মনিকা

1
মনে রাখবেন যে আপনার প্রান্তিকতা একটি টিউনযোগ্য প্যারামিটার , সুতরাং উপযুক্ত কাটঅফ আপনার মূল্যায়নের মানদণ্ডের উপর নির্ভর করবে। যেহেতু আমি আপনার মেট্রিকের সাথে অপরিচিত ছিলাম আমি এটি গুগল করেছিলাম এবং আসলে প্রথম হিটটি আপনার পক্ষে প্রাসঙ্গিক হতে পারে: সর্বাধিক পিয়ার্স দক্ষতা স্কোরের একটি নোট (2007)
জিওম্যাট 22

উত্তর:


7

প্রথমে আমি দেখতে পাব যে চিকিত্সকরা একে অপরের সাথে একমত হয় কিনা। আপনি আলাদাভাবে 50 জন চিকিত্সক বিশ্লেষণ করতে পারবেন না, কারণ আপনি মডেলটির চেয়ে বেশি উপকার পাবেন - এক ডাক্তার সুযোগসুখে দুর্দান্ত দেখাবে।

আপনি 10 পয়েন্ট স্কেলের মধ্যে আত্মবিশ্বাস এবং নির্ণয়ের একত্রিত করার চেষ্টা করতে পারেন। যদি কোনও চিকিত্সকরা বলেন যে রোগীর ক্যান্সার নেই, এবং তারা খুব আত্মবিশ্বাসী, এটি 0 If যদি ডক বলেন যে তাদের ক্যান্সার রয়েছে এবং তারা খুব আত্মবিশ্বাসী, এটি একটি 9. they তারা যদি ডক্ট বলেন তারা না করেন, এবং আত্মবিশ্বাসী নয়, এটি একটি 5 ইত্যাদি

আপনি যখন ভবিষ্যদ্বাণী করার চেষ্টা করছেন, আপনি কিছু প্রকারের রিগ্রেশন বিশ্লেষণ করেন তবে এই ভেরিয়েবলগুলির কার্যকারিতা ক্রম সম্পর্কে চিন্তা করে এটি অন্যভাবে। রোগীর ক্যান্সার কিনা তা নির্ণয়ের কারণ, ফলাফলটি নির্ণয়ের।

আপনার সারিগুলি রোগী হওয়া উচিত এবং আপনার কলামগুলি ডাক্তার হওয়া উচিত। আপনার এখন এমন পরিস্থিতি রয়েছে যা সাইকোমেট্রিক্সে সাধারণ (যে কারণে আমি ট্যাগটি যুক্ত করেছি)।

তারপরে স্কোরগুলির মধ্যে সম্পর্কগুলি দেখুন। প্রতিটি রোগীর গড় স্কোর এবং প্রতিটি ডাক্তারের কাছ থেকে স্কোর থাকে। গড় স্কোর কি প্রতিটি ডাক্তারের স্কোরের সাথে ইতিবাচকভাবে সম্পর্কযুক্ত? যদি তা না হয় তবে সেই চিকিত্সক সম্ভবত বিশ্বাসযোগ্য নয় (এটিকে আইটেম-টোটাল পারস্পরিক সম্পর্ক বলা হয়)। কখনও কখনও আপনি মোট স্কোর (বা গড় স্কোর) থেকে একজন ডাক্তারকে সরিয়ে ফেলেন এবং দেখুন যে চিকিত্সক অন্য সমস্ত ডাক্তারদের গড়ের সাথে মিল রাখে - এটি হ'ল সংশোধিত আইটেমের সম্পূর্ণ সম্পর্ক।

আপনি ক্রোনবাচের আলফা (যা আন্তঃ-শ্রেণীর সম্পর্কের একটি রূপ) এবং প্রতিটি ডাক্তার ছাড়াই আলফা গণনা করতে পারেন could আপনি যখন কোনও চিকিত্সক যুক্ত করেন তখন আলফা সর্বদা উত্থিত হওয়া উচিত, সুতরাং আপনি যখন কোনও চিকিত্সককে অপসারণ করেন তখন তা যদি উঠে আসে তবে সেই চিকিত্সকের রেটিং সন্দেহ হয় (এটি প্রায়শই আপনাকে সংশোধিত আইটেম-টোটাল পারস্পরিক সম্পর্ক থেকে আলাদা কিছু বলে না)।

আপনি যদি আর ব্যবহার করেন তবে এই ধরণের জিনিসটি সাইক প্যাকেজে পাওয়া যাবে, আলফা ফাংশনটি ব্যবহার করে। আপনি যদি স্টাটা ব্যবহার করেন তবে কমান্ডটি আলফা, এসএএস-এ এটি প্রোক করর, এবং এসপিএসে এটি স্কেল, নির্ভরযোগ্যতার অধীনে।

তারপরে আপনি প্রতিটি ডাক্তারের গড় স্কোর হিসাবে বা স্কেল গণনা করতে পারেন বা ওজনযুক্ত গড় (পারস্পরিক সম্পর্কের মাধ্যমে ভারিত) এবং দেখুন যে স্কোরটি সত্য নির্ণয়ের ভবিষ্যদ্বাণীপূর্ণ।

অথবা আপনি এই পর্যায়ে এড়াতে এবং প্রতিটি ডাক্তারের স্কোর পৃথকভাবে নির্ণয় করতে পারেন এবং রিগ্রেশন প্যারামিটারগুলি ওজন হিসাবে গণ্য করতে পারেন।

নির্দ্বিধায় স্পষ্টতা জিজ্ঞাসা করুন এবং আপনি যদি কোনও বই চান তবে আমি স্ট্রাইনার এবং নরম্যানের "স্বাস্থ্য পরিমাপের স্কেলগুলি" পছন্দ করি।

-সম্পাদনা: ওপিএস অতিরিক্ত তথ্যের উপর ভিত্তি করে।

বাহ, এটি ক্রোনবাচের আলফার হ্যাক। আমি যখন একবার এটি দেখেছি তখনই ভুল হয় যখন উচ্চতর হয়।

আমি এখন লজিস্টিক রিগ্রেশন করব এবং আরওসি বক্ররেখার দিকে নজর দেব।

রিগ্রেশন এবং পারস্পরিক সম্পর্কের মাধ্যমে ওজনের মধ্যে পার্থক্য নির্ভর করে আপনি কীভাবে চিকিত্সকরা প্রতিক্রিয়া জানাচ্ছেন তার উপর নির্ভর করে। কিছু ডক্স সাধারণত আরও আত্মবিশ্বাসী হতে পারে (আরও দক্ষ না হয়ে) এবং তাই তারা চূড়ান্ত ব্যাপ্তিকে আরও বেশি ব্যবহার করতে পারে। যদি আপনি এটির জন্য সংশোধন করতে চান তবে রিগ্রেশনের চেয়ে পারস্পরিক সম্পর্ক ব্যবহার করে তা করে। আমি সম্ভবত রিগ্রেশন দ্বারা ওজন করব, কারণ এটি মূল ডেটা রাখে (এবং কোনও তথ্য বর্জন করে না)।

সম্পাদনা (2): প্রতিটি আউটপুট কতটা পূর্বাভাস করেছিল তা দেখতে আমি লজেস্টিক রিগ্রেশন মডেলগুলি দৌড়েছি। tl / dr: তাদের মধ্যে কিছুই নেই।

আমার কোডটি এখানে:

d <- read.csv("Copy of Cancer data - Weightings.csv")

mrc <- glm(cancer ~ weightrc, data = d, family = "binomial")
mun <- glm(cancer ~ unweight, data = d, family = "binomial")
mca <- glm(cancer ~ weightca, data = d, family = "binomial")
mic <- glm(cancer ~ weightic, data = d, family = "binomial")

d$prc <- predict(mrc, type = "response")
d$pun <- predict(mun, type = "response")
d$pca <- predict(mca, type = "response")
d$pic <- predict(mic, type = "response")

par(mfrow = c(2, 2))
roc(d$cancer, d$prc, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pun, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pca, ci = TRUE, plot = TRUE)
roc(d$cancer, d$pic, ci = TRUE, plot = TRUE)

4 আরওসি বক্ররেখা

এবং আউটপুট:

> par(mfrow = c(2, 2))
> roc(d$cancer, d$prc, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$prc, ci = TRUE,     plot = TRUE)

Data: d$prc in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9831
95% CI: 0.9637-1 (DeLong)
> roc(d$cancer, d$pun, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pun, ci = TRUE,     plot = TRUE)

Data: d$pun in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9808
95% CI: 0.9602-1 (DeLong)
> roc(d$cancer, d$pca, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pca, ci = TRUE,     plot = TRUE)

Data: d$pca in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9854
95% CI: 0.9688-1 (DeLong)
> roc(d$cancer, d$pic, ci = TRUE, plot = TRUE)

Call:
roc.default(response = d$cancer, predictor = d$pic, ci = TRUE,     plot = TRUE)

Data: d$pic in 81 controls (d$cancer 0) < 27 cases (d$cancer 1).
Area under the curve: 0.9822
95% CI: 0.9623-1 (DeLong)

1
খুব ভালো. এবং, আপনার যুক্তি যেমন মঞ্জুরি দেয়, তেমনি কিছু ডাক্তার ট্রেন্ডটি বক করার সময় অনন্য অন্তর্দৃষ্টি অবদানের মাধ্যমে আলফাটিকে আরও খারাপ করে দেবে।
রোলানো 2

@ জেরেমি-মাইল এই উত্তরটির জন্য ধন্যবাদ, এবং এটি সম্পর্কে ক্ষেত্রের প্রশ্নগুলির সদয় অফার। আপনার পরামর্শ অনুসারে আমি প্রয়োগের চেষ্টা করেছি এবং ফলাফলের কিছু পোস্ট করার জন্য ওপিকে সম্পাদনা করেছি। আমি যে বিষয়টি নিয়ে ভাবছি তা হ'ল আমি কি আপনার পোস্টটি সঠিকভাবে ব্যাখ্যা করেছি কিনা এবং ফলাফলটি পূর্বাভাস দেওয়ার ক্ষেত্রে অন্যান্য পদ্ধতির তুলনায় একত্রিত করার কয়েকটি নির্দিষ্ট পদ্ধতিগুলি আরও ভালভাবে কাজ করছে তা দেখাতে এটি কী গ্রহণ করবে।
ব্যবহারকারী1205901 - মনিকা

তথ্য পোস্ট করার জন্য ধন্যবাদ। আমি এটি পরে দেখুন। (আপনি কোন সফ্টওয়্যার ব্যবহার করছেন?)
জেরেমি মাইলস

@ জেরেমি মাইলস এই সম্পাদনাটি পোস্ট করার জন্য ধন্যবাদ! আমি ম্যাটল্যাব ব্যবহার করছি, তবে আমি আর সম্পর্কে শিফট আপ এবং তার পরিবর্তে এটি ব্যবহার করতে যথেষ্ট জানি, কারণ আপনি ইতিমধ্যে আর কোড পোস্ট করেছেন code আমি গণনা করেছি যে এসপিএসে ক্রোনবাচের আলফা - আপনি কি আর এর থেকে আলাদা মান পাবেন?
ব্যবহারকারী1205901 - মনিকা

1
হ্যাঁ, এটাই আমি ভাবছিলাম। সুতরাং প্রতিটি ডাক্তার একটি আলাদা ওজন পান।
জেরেমি মাইলস

2

বাক্সের বাইরে দুটি পরামর্শ:

  1. আপনি আপনার লজিস্টিক রিগ্রেশন এর ক্ষতির ফাংশনে ওজন ব্যবহার করতে পারেন, যাতে চিকিত্সক যে রোগীকে পি = 1 দিয়ে ক্যান্সার করেছেন তার দ্বিগুণ প্রভাব পড়তে পারে যার বলে যে তাকে পি = 0.75 দিয়ে ক্যান্সার হয়েছে has আপনার সম্ভাব্যতাগুলিকে ওজনে সঠিকভাবে রূপান্তর করতে ভুলবেন না।
  2. প্রায়শই অবহেলিত একটি পরিবার র‌্যাঙ্কিংয়ের মডেল। রেঙ্কারগুলির মধ্যে তিনটি বড় গ্রুপ রয়েছে: আপনার ইনপুটটি কী তার উপর নির্ভর করে তালিকার দিকের, পয়েন্টওয়াইজ এবং পেয়ারওয়াই র্যাঙ্কিং। দেখে মনে হচ্ছে আপনি আপনার ক্ষেত্রে পয়েন্টওয়াইজ র‌্যাঙ্কিং ব্যবহার করতে পারেন ।

সম্ভাব্যতাগুলিকে ওজনে সঠিকভাবে রূপান্তর করার জন্য আপনি কি কোনও উপায়ের পরামর্শ দিতে পারেন? আমি এই ধারণাটি গুগল করার চেষ্টা করেছি তবে কীভাবে এটি করা যায় সে সম্পর্কে কোনও সুস্পষ্ট পরামর্শ খুঁজে পাইনি।
ব্যবহারকারী1205901 - মনিকা

@ ব্যবহারকারী1205901, আমি খুব সাধারণ কিছু মনে রেখেছিলাম: Pচিকিত্সক দ্বারা ক্যান্সার হওয়ার সম্ভাবনা, তারপরে (পাইথন স্বরলিপি): y=[1 if p >= 0.5 else 0 for p in P]এবং w=[abs(p-0.5)*2 for p in P]। তারপরে মডেলটিকে প্রশিক্ষণ দিন:LogisticRegression().fit(X,y,w)
রিকার্ডো ক্রুজ ২

ক্ষতির ফাংশনে এটি উদাহরণস্বরূপ, ক্যান্সার না হওয়ার জন্য ওজনের দ্বিগুণ ০.২ এর তুলনায় ০.০ করতে হবে (০.০ -> ০.৮ এবং ০.২ -> ০..6)। যদি ডাক্তার অনিশ্চিত হন (পি ~ 0.5) তবে পর্যবেক্ষণ ক্ষতিতে প্রায় কিছুই অবদান রাখে না। তিনি যে মডেলটিই ব্যবহার করেন তার ক্ষতি ক্ষতিতে ফাংশনটিতে একটি ভেক্টর যুক্ত করার জন্য সমর্থন করা দরকার, যা বেশিরভাগ মডেল সমর্থন করে। আমি জানি না এটি কোনও ভাল কিনা, তবে এটি চেষ্টা করা তুচ্ছ মনে হয়। তাকে প্রথমে একটি মেট্রিক নির্দিষ্ট করা দরকার। ক্ষতির ফাংশনটি তিনি যে পরিমাণে মেট্রিক বাড়িয়ে তুলতে চান তাতে আরও দরজী হতে পারে।
রিকার্ডো ক্রুজ

2

(এটি আমার দক্ষতার ক্ষেত্রের বাইরে, সুতরাং জেরেমি মাইলসের উত্তর আরও নির্ভরযোগ্য হতে পারে))

এখানে একটি ধারণা।

প্রথম, কল্পনা করুন যে কোনও আত্মবিশ্বাসের স্তর নেই। তারপরে প্রতিটি রোগীর জন্যআমি=1...এন, তাদের হয় ক্যান্সার আছে বা না আমি{0,1}, এবং প্রতিটি ডাক্তার =1...মি হয় তাদের ক্যান্সার ধরা পড়েছে বা না, আমি{0,1}

একটি সহজ পদ্ধতির ধারণা করা হয় যে, চিকিত্সকরা প্রদত্ত রোগীর রোগ নির্ণয়ের সাথে একমত বা দ্বিমত পোষণ করতে পারে, আমরা যদি রোগীর সত্যিকারের অবস্থাটি জানি তবে প্রতিটি ডাক্তারের নির্ণয়কে স্বাধীন হিসাবে বিবেচনা করা যেতে পারে। যে,আমিহয় শর্তসাপেক্ষে স্বাধীন প্রদত্তআমি। অনুমান করা সহজ যে পরামিতিগুলির সাথে নায়েভ বেয়েস নামে পরিচিত একটি সংজ্ঞায়িত শ্রেণিবদ্ধের ফলস্বরূপ ।

বিশেষত, প্রাথমিক প্যারামিটারগুলি বেসের হার, পি[]1এনΣআমিআমি, এবং শর্তসাপেক্ষ নির্ণয়ের সম্ভাবনা

পি[|]ΣআমিআমিআমিΣআমিআমি
মনে রাখবেন যে এই পরবর্তী পরামিতিটি ডাক্তারের জন্য নির্ণয়ের একটি ওজনযুক্ত গড় , যেখানে ওজন হ'ল আসল রোগীর শর্ত আমি

এখন যদি এই মডেলটি যুক্তিসঙ্গত হয়, তবে আত্মবিশ্বাসের স্তরগুলিকে অন্তর্ভুক্ত করার একটি উপায় হ'ল ভারগুলি সামঞ্জস্য করা। তাহলে শর্তযুক্ত সম্ভাবনা হয়ে উঠত

পি[|,W]ΣআমিআমিWআমিআমিΣআমিWআমিআমি
এখানে Wআমি0 এমন একটি ওজন যা আত্মবিশ্বাসের স্তরের জন্য অ্যাকাউন্ট করে আমি

মনে রাখবেন যে যদি আপনার ওজনগুলি সম্ভাব্যতা হিসাবে কাস্ট করা হয় W[0,1], তারপরে আপনি " বার্নোল্লি শর্টকাট" সূত্রটি ব্যবহার করতে পারেন

পি[|W]=W(1-)1-W
অ্যাকাউন্টে =0 কেস যথাযথভাবে।

দ্রষ্টব্য: এটির জন্য আপনার সফ্টওয়্যারটি দেওয়া 0^0=1উচিত 0^0=NaN, যা সাধারণ তবে পরীক্ষণযোগ্য! বিকল্পভাবে আপনি নিশ্চিত করতে পারেনW(0,1)যেমন, আত্মবিশ্বাস থাকলে {1...কে} তারপর W=/(কে+ +1) কাজ করবে


@ ওয়াইনের মন্তব্য প্রসঙ্গে: আপনি যদি বলেন No Cancer (3) = Cancer (2), এটি আমার ওজন মডেলটি ব্যবহারের সাথে সামঞ্জস্যপূর্ণW[]=কে, থেকে 25=1-35। বিকল্পভাবে, আপনি যদি বলেন No Cancer (3) = Cancer (3), এটি এর সাথে সামঞ্জস্যপূর্ণW[]=কে+ +1, থেকে 36=1-36
জিওম্যাট

আমি কি বুঝতে পারি তা চেক করতে পারি?
পি[|,W]ΣআমিআমিWআমিআমিΣআমিWআমিআমি
সঠিকভাবে? যদি ফলাফলগুলি [1,0,1] হয় এবং কোনও চিকিত্সকের পূর্বাভাস [0,1,1], এবং চিকিত্সকের ওজন [0.2,0.4,0.8] হয় তবে ওজনযুক্ত শর্তসাপেক্ষ রোগ নির্ণয়ের সম্ভাবনা 0.5 হয়?
ব্যবহারকারী1205901 - মনিকা

দুঃখিত, আমি বুঝতে পেরেছি যে আমি ঠিক এটির উদ্দেশ্য করেছিলাম ওজন করা, অর্থাত্ δ[0,1]পরিবর্তে সূচক চেয়ে {0,1}। সুতরাং আপনার ক্ষেত্রেδআমি=Wআমি(আমি=1)+ +(1-Wআমি)(আমি=0)δ=[0.8,0.4,0.8]। তারপরপি[,δ]=δ¯=0.8+ +0+ +0.83=230.8যখন, পি[2]=¯=23 এবং পি[δ]=δ¯=560.8। সুতরাংপি[|δ]=পি[,δ]/পি[δ]=0.8 এবং পি[δ|]=পি[,δ]/পি[]=0.8
জিওম্যাট 22

0

আপনার প্রশ্ন থেকে দেখা যাচ্ছে যে আপনি যা পরীক্ষা করতে চান তা হ'ল আপনার পরিমাপের ব্যবস্থা। প্রক্রিয়াজাতকরণ ইঞ্জিনিয়ারিং রাজ্যে, এটি একটি অ্যাট্রিবিউট পরিমাপ সিস্টেম বিশ্লেষণ বা এমএসএ হবে।

এই লিঙ্কটি প্রয়োজনীয় নমুনা আকার এবং এই ধরণের একটি অধ্যয়ন পরিচালনার জন্য গণনাগুলি চালানোর জন্য কিছু দরকারী তথ্য সরবরাহ করে। https://www.isixsigma.com/tools-templates/measurement-systems-analysis-msa-gage-rr/making-sense-attribute-gage-rr-calculations/

এই অধ্যয়নের মাধ্যমে আপনার একই রোগীকে কমপক্ষে দুবার একই তথ্য দিয়ে রোগ নির্ণয়ের জন্যও ডাক্তার প্রয়োজন হবে।

আপনি এই অধ্যয়ন দুটি পদ্ধতির একটিতে পরিচালনা করতে পারেন। চিকিত্সক এবং প্রতিটি চিকিত্সক দ্বারা চুক্তি নির্ধারণ করতে আপনি সাধারণ ক্যান্সার / কোনও ক্যান্সার রেটিং ব্যবহার করতে পারবেন না। আদর্শভাবে, তাদেরও একই স্তরের আত্মবিশ্বাসের সাথে নির্ণয় করতে সক্ষম হওয়া উচিত। তারপরে প্রতিটি চিকিত্সকের মধ্যে এবং তার দ্বারা চুক্তি পরীক্ষা করার জন্য আপনি পুরো 10 পয়েন্ট স্কেল ব্যবহার করতে পারেন। (প্রত্যেকেরই একমত হওয়া উচিত যে ক্যান্সার (5) একই রেটিং, কোনও ক্যান্সার (1) একই রেটিং নয়, এবং সি।)

লিঙ্কযুক্ত ওয়েবসাইটে গণনাগুলি আপনার পরীক্ষার জন্য আপনি যে কোনও প্ল্যাটফর্ম ব্যবহার করতে পারেন তা পরিচালনা করা সহজ।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.