আমি একটি ক্লাস্টার অ্যালগরিদমের র্যান্ড সূচকটি কীভাবে গণনা করব তা নির্ধারণ করার চেষ্টা করছি, তবে আমি কীভাবে সত্য এবং মিথ্যা নেতিবাচক গণনা করতে পারি সেই স্থানে আটকে আছি।
এই মুহুর্তে আমি তথ্য পুনরুদ্ধারের একটি পরিচিতি (ম্যানিং, রাঘাভান এবং স্কটিজ, ২০০৯) বইয়ের উদাহরণটি ব্যবহার করছি। 359 পৃষ্ঠায় তারা কীভাবে র্যান্ড সূচক গণনা করতে পারে সে সম্পর্কে কথা বলছেন। এই উদাহরণের জন্য তারা তিনটি ক্লাস্টার ব্যবহার করে এবং ক্লাস্টারগুলিতে নিম্নলিখিত অবজেক্ট থাকে।
- aaaaab
- abbbbc
- aaccc
আমি অবজেক্টটি প্রতিস্থাপন করি (অক্ষরের মূল লক্ষণগুলি, তবে ধারণা এবং গণনা একই থাকে)। তারা কী সম্পর্কে কথা বলছে তা দেখার জন্য আমি বই থেকে সঠিক শব্দটি দেব:
আমরা প্রথমে টিপি + এফপি গণনা করি। তিনটি ক্লাস্টারে যথাক্রমে,,,, এবং points পয়েন্ট রয়েছে, সুতরাং একই ক্লাস্টারে থাকা মোট "পজিটিভ" বা ডকুমেন্টের জোড়া:
টিপি + এফপি = + + = 15 + 15+ 10 = 40 বেছে নিন
এর মধ্যে ক্লাস্টার 1-এ জোড়া, ক্লাস্টার 2-এ বি জোড়, 3 ক্লাস্টারে সি জোড় এবং 3 টি ক্লাস্টারের জুটি সত্য ধনাত্মক:
টিপি = + + + = 10 + 6 + 3 + 1 = 20
সুতরাং, এফপি = 40 - 20 = 20।
এখানে অবধি গণনাগুলি পরিষ্কার, এবং আমি অন্য উদাহরণগুলি গ্রহণ করলে আমি একই ফলাফল পেতে পারি, তবে যখন আমি মিথ্যা নেতিবাচক এবং সত্য নেতিবাচক ম্যানিং এট আল গণনা করতে চাই। নিম্নলিখিত বিবরণ:
নিম্নলিখিত কন্টিনজেন্সি টেবিলের ফলে এফএন এবং টিএন একইভাবে গণনা করা হয়:
কন্টিনজেন্সি টেবিলটি নীচে দেখায়:
+--------+--------+
| TP: 20 | FN: 24 |
+--------+--------+
| FP: 20 | TN: 72 |
+--------+--------+
বাক্য: "এফএন এবং টিএন একইভাবে গণনা করা হয়" আমার কাছে পরিষ্কার নয় এবং টিএন এবং এফএন গণনা করার জন্য আমার কোন সংখ্যাগুলি দরকার তা আমি বুঝতে পারি না। আমি নিম্নলিখিতগুলি করে টেবিলের ডান দিকটি গণনা করতে পারি:
টিপি + এফপি + এফএন + টিএন = = = 136
সূত্র: http://en.wikedia.org/wiki/Rand_index
সুতরাং, এফএন + টিএন = 136 - টিপি + এফপি = 136 - 40 = 96, তবে কীভাবে ভেরিয়েবলগুলি পৃথকভাবে গণনা করা যায় তা নির্ধারণে আমার সত্যিই সহায়তা হয় না। বিশেষত যখন লেখকরা বলেছেন: "এফএন এবং টিএন একইভাবে গণনা করা হয়"। আমি কিভাবে দেখতে পাচ্ছি না। এছাড়াও আমি যখন অন্য উদাহরণগুলিতে দেখি তারা প্রত্যেকে জোড়া দেখে কন্টিনজেন্সি টেবিলের প্রতিটি কক্ষ গণনা করে।
উদাহরণস্বরূপ: http : //www.otlet-inst متبادل. org/ wikics / Clustering_Problems.html#toc-Subsection-4.1
আমার প্রথম প্রশ্ন, ম্যানিং এট আল (২০০৯) এর উপর ভিত্তি করে, আপনি যদি কেবলমাত্র টিপি এবং এনপি জানেন তবে কি টিএন এবং এফএন গণনা করা সম্ভব? এবং যদি তা হয় তবে প্রদত্ত উদাহরণের ভিত্তিতে অনুরূপ গণনা কেমন দেখাচ্ছে?