কোন এসভিএম শ্রেণিবিন্যাসের জন্য আরও শ্রেণিবদ্ধকারী আরও সঠিক?


10

আমি এসভিএম শ্রেণিবিন্যাস শিখছি এবং একটি সমস্যার মুখোমুখি। আমি নিশ্চিত নই যে এই দ্বিধাটির কোনও পরিভাষা আছে কিনা।

ধরে নিন আমরা SVM দ্বারা রোগীকে শ্রেণিবদ্ধ করতে চাই স্বাস্থ্যকর ব্যক্তিদের (উভয় লিঙ্গের) এবং যকৃতের ক্যান্সারে আক্রান্ত ব্যক্তিদের (উভয় লিঙ্গের) নমুনাগুলি দিয়ে class যদি আমরা স্বাস্থ্যকর মানুষদের নমুনা শ্রেনী 1 হিসাবে এবং ক্যান্সারে আক্রান্ত ব্যক্তিদের 2 ম শ্রেণির হিসাবে নমুনা দিয়ে থাকি তবে আমরা কোনও বাইনারি এসভিএম প্রশিক্ষণ দিতে এবং নতুন কোনও রোগীর পূর্বাভাস দেওয়ার জন্য একটি শ্রেণিবদ্ধ 1 পেতে পারি। এখন, অন্য দৃশ্যের চিত্র দিন। ধরে নিন যে আমরা প্রথমে এসভিএম শ্রেণিবিন্যাসের আগে সমস্ত নমুনা লিঙ্গ দ্বারা ভাগ করি। প্রতিটি লিঙ্গের জন্য আমরা এখনও স্বাস্থ্যকর রোগীদের তুলনায় ক্যান্সারে আক্রান্ত রোগীদের 2 টি শ্রেণিতে বিভক্ত করে এবং বাইনারি এসভিএম প্রশিক্ষণ দিয়ে যথাক্রমে শ্রেণিবদ্ধ 2 এবং মহিলা এবং পুরুষ নমুনার জন্য শ্রেণিবদ্ধ 3 পেতে। প্রশ্নটি হল যদি কোনও নতুন মহিলা রোগী থাকেন, তবে আরও সঠিক ভবিষ্যদ্বাণী পেতে কোন শ্রেণিবদ্ধ, 1 বা 2 ব্যবহার করা উচিত? আমার যে যুক্তি রয়েছে তার জন্য এখানে দ্বিধা

(1) যখন নমুনার সংখ্যা বড় হয়, ভবিষ্যদ্বাণীটি আরও সঠিক হওয়া উচিত। এই যুক্তির ভিত্তিতে ক্লাসিফায়ার 1 ভাল পছন্দ বলে মনে হচ্ছে।

(২) তবে, আমরা যদি প্রথমে নমুনাটিকে মহিলা এবং পুরুষ গ্রুপগুলিতে ভাগ করি তবে নতুন রোগী (অজানা পরীক্ষার নমুনা) মহিলা হওয়ায় শ্রেণিবদ্ধ 2 আরও ভাল পছন্দ বলে মনে হচ্ছে।

এই ধরণের দ্বিধাটির কি কোনও পরিভাষা রয়েছে বা কেউ আরও কোনও তথ্য জানেন বা কীভাবে এই সমস্যাটি সমাধান করবেন? আমি এমনকি নিশ্চিত নই যে এটি কোনও বৈধ প্রশ্ন এবং নাভিজ্ঞ প্রশ্নের জন্য আগেই দুঃখিত। ধন্যবাদ


4
সাধারণভাবে এর উত্তর দেওয়া যায় না। সম্ভবত আমরা যদি জানতাম যে লিঙ্গ ক্যান্সারে কতটা প্রভাবিত করে এবং আপনার কতগুলি নমুনা রয়েছে, কোন ক্ষতির কার্যকারিতা আপনি ব্যবহার করেন ইত্যাদি cross ক্রস বৈধতা ব্যবহার করে পরীক্ষা করা সম্ভবত খুব সহজ easier
অ্যাড্রিয়ানএন

ধন্যবাদ। এটা বোঝা যায়। আমি অনুমান করি যে এখানে কোনও সাধারণ নিয়ম থাকা উচিত নয়।
ক্যাসি

"এই সমস্যাটি সমাধানের জন্য আমার কীভাবে এমএল ব্যবহার করা উচিত" সম্পর্কে একটি সাধারণ এমএল প্রশ্নের মতো মনে হচ্ছে। কোন স্ট্যান্ডার্ড উত্তর নেই। বিভিন্ন গুরুত্বপূর্ণ পদ্ধতির চেষ্টা করা এবং কোন কৌশলগুলি সবচেয়ে সঠিক ভবিষ্যদ্বাণী ফলাফলের দিকে পরিচালিত করে তা দেখার জন্য এটির গুরুত্বপূর্ণ / স্বীকৃত / মানক। সাধারণ শিরোনাম হ'ল "অ্যাবস্ট্রাক্ট এমএল কাঠামোয় বাস্তব বিশ্বের সমস্যার প্রতিনিধিত্ব" বা মোটামুটি "মডেলিং" এবং ভাল স্টাড
vzn

উত্তর:


2

আপনার এই বৈশিষ্ট্যটি স্বয়ংক্রিয়ভাবে ফিচার নির্বাচন এবং অ্যালগরিদমগুলিতে এক নজর দেওয়া উচিত । এটি ঠিক আছে যদি আপনি এমএল থেকে নতুন হন এবং পুরো বৈশিষ্ট্য নির্বাচন প্রক্রিয়াটি বুঝতে না পেরে ঠিক সঠিক অনুজ্ঞান পান এবং তারপরে আপনি প্রক্রিয়াটি স্বয়ংক্রিয় করতে একটি লাইব্রেরি ব্যবহার করতে পারেন।

একটি শেখার আলগোরিদিম থাকার চাবি ধারণা তাই যে এটা নিদর্শন জানতে পারেন ... সবচেয়ে আপনি কি করতে পারেন, সাহায্যের হয় তাকে (অ-অপ্রয়োজনীয়) ডেটা প্রচুর প্রদান করে এবং একটি ভাল পদক্ষেপ preprocessing না থাকার আউট, সাধারণত কাপড় জড়িত যে বৈশিষ্ট্য নির্বাচন এবং স্বাভাবিককরণের মতো

একটি বন্ধুত্বপূর্ণ নোটে, শেখার অ্যালগরিদমগুলি প্রয়োগ করার সময়, আপনার ডেটাসেটটি কেবলমাত্র 'দেখার' দ্বারা পরিবর্তন করার চেষ্টা করা উচিত নয় , যদি না আপনার কাছে এমন কংক্রিট মেট্রিক থাকে যেগুলি এটির পরিবর্তনের প্রয়োজনের সাক্ষ্য দেয়, বহুবার, এটি হয়েছে, শেখা অ্যালগরিদম এমন বৈশিষ্ট্যগুলির দিকে উচ্চ পক্ষপাত রাখেন যা শ্রেণিবদ্ধকরণ প্রক্রিয়াতে এমনকি দূরবর্তীভাবে 'সম্পর্কিত' বলে মনে হয় না। আপনার ডেটাতে কোনও পরিবর্তন আনার আগে সর্বদা একটি বৈশিষ্ট্য নির্বাচনের পদক্ষেপটি করার চেষ্টা করুন।


1

মেশিন লার্নিং প্রক্রিয়ার এই ধরণের পদক্ষেপের জন্য একটি সাধারণ শিরোনাম হ'ল ডেটা প্রিপ্রোসেসিং, যা উইকিপিডিয়া বলেছে "পরিষ্কার করা, সাধারণীকরণ, রূপান্তরকরণ, বৈশিষ্ট্য নিষ্কাশন এবং নির্বাচন ইত্যাদি" includes

মেশিন লার্নিংয়ের আরেকটি দিক হ'ল "মডেল তৈরি করা"। এর মধ্যে সিদ্ধান্তগুলি অন্তর্ভুক্ত থাকে যেমন কতগুলি ক্লাস সনাক্ত করা যায়, এমএল কাঠামোর "আকার" বা "মাত্রা" কী হবে (যেমন "এসএনএম-তে কতগুলি কার্নেল অন্তর্ভুক্ত থাকবে" ইত্যাদি), কোনও এনএন-তে নিউরনের সংখ্যার নির্বাচনের সাথে মোটামুটি অনুরূপ alog মডেল). দুর্ভাগ্যক্রমে কিছু রেফ এই পদক্ষেপটি এড়িয়ে যায় বা "গ্লোস ওভার" করে। তবে পরিসংখ্যানগুলির সাথে এটি সাধারণ হিসাবে লক্ষ্য করুন এবং কিছু পরিসংখ্যান বইয়ের একটি ভাল বর্ণনা থাকবে।

এমএল ধরণের পদ্ধতির ক্ষেত্রে এটি প্রচলিত যে কার্যকর প্রিপ্রোসেসিং এবং মডেলিং উভয়ই নির্ধারণের জন্য শক্তিশালী পুনরাবৃত্তি / প্রতিক্রিয়া / বিবর্তন প্রক্রিয়া রয়েছে। পরীক্ষক বিভিন্ন প্রিপ্রোসেসিং এবং মডেলিং আইডিয়া চেষ্টা করে এবং আরও সফলগুলির দিকে চালিত করেন। থাম্বের সাধারণ নিয়মটি হ'ল "ভবিষ্যদ্বাণীগুলি তত ভাল, আরও একটি সঠিকভাবে [এবং সম্ভবতঃ বাস্তবতাত্ত্বিকভাবে ] প্রিপ্রোসেসিং এবং মডেলিং", তবে এটিও দেওয়া হয়েছে যে ওভারফিটিং সতর্কতার সাথে বাতিল করা হয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.