সমর্থন ভেক্টর মেশিন এবং হাইপারপ্লেনের জন্য অন্তর্দৃষ্টি


15

আমার প্রকল্পে আমি বাইনারি শ্রেণিবদ্ধকরণ (1 বা 0) পূর্বাভাস দেওয়ার জন্য একটি লজিস্টিক রিগ্রেশন মডেল তৈরি করতে চাই।

আমার 15 টি ভেরিয়েবল রয়েছে যার মধ্যে 2 টি শ্রেণিবদ্ধ, বাকিগুলি ক্রমাগত এবং পৃথক পৃথক ভেরিয়েবলের মিশ্রণ।

লজিস্টিক রিগ্রেশন মডেলটি ফিট করার জন্য আমাকে এসভিএম, পার্সেপট্রন বা লিনিয়ার প্রোগ্রামিং ব্যবহার করে রৈখিক পৃথকতা পরীক্ষা করার পরামর্শ দেওয়া হয়েছে। লিনিয়ার পৃথকীকরণের জন্য পরীক্ষার বিষয়ে এখানে দেওয়া পরামর্শের সাথে এই সম্পর্কগুলি ।

মেশিন লার্নিংয়ের নবাগত হিসাবে আমি উপরে উল্লিখিত অ্যালগরিদমগুলি সম্পর্কে প্রাথমিক ধারণাগুলি বুঝতে পারি তবে ধারণাগতভাবে আমি কল্পনা করতে সংগ্রাম করি যে আমরা কীভাবে এতগুলি মাত্রা বিশিষ্ট ডেটা আলাদা করতে পারি অর্থাৎ আমার ক্ষেত্রে 15।

অনলাইন উপাদানের সমস্ত উদাহরণ সাধারণত দুটি সংখ্যক ভেরিয়েবলের (উচ্চতা, ওজন) একটি 2 ডি প্লট দেখায় যা বিভাগগুলির মধ্যে একটি স্পষ্ট ফাঁক দেখায় এবং এটি বোঝা সহজ করে তোলে তবে বাস্তব বিশ্বের ডেটা সাধারণত সাধারণত অনেক উচ্চ মাত্রার হয়। আমি আইরিস ডেটাসেটের দিকে ফিরে টানছি এবং তিনটি প্রজাতির মধ্যে হাইপারপ্লেন ফিট করার চেষ্টা করছি এবং কীভাবে বিশেষত দু'টি প্রজাতির মধ্যে এটি করা অসম্ভব তা যদি কঠিন হয় তবে এই দুটি শ্রেণি এই মুহূর্তে আমাকে ছেড়ে যায়।

যখন আমাদের আরও মাত্রাগুলির উচ্চতর অর্ডার থাকে তখন এটি কীভাবে অর্জন করতে পারে , এটি কী ধরে নেওয়া হয় যে আমরা যখন এই বিচ্ছিন্নতা অর্জনের জন্য একটি উচ্চ মাত্রিক জায়গার মানচিত্রের জন্য কার্নেলগুলি ব্যবহার করি এমন কয়েকটি বৈশিষ্ট্য অতিক্রম করি?

লিনিয়ার বিচ্ছিন্নতার জন্য পরীক্ষা করার জন্য মেট্রিকটি কী ব্যবহৃত হয়? এটি কি এসভিএম মডেলের নির্ভুলতা অর্থাৎ বিভ্রান্তির ম্যাট্রিক্সের উপর ভিত্তি করে নির্ভুলতা?

এই বিষয়টিকে আরও ভালভাবে বুঝতে কোনও সহায়তা প্রশংসা হবে। এছাড়াও নীচে আমার ডেটাসেটে দুটি ভেরিয়েবলের প্লটের একটি নমুনা রয়েছে যা দেখায় যে এই দুটি ভেরিয়েবলগুলি কীভাবে ওভারল্যাপ করে pping

এখানে চিত্র বর্ণনা লিখুন


1
আপনার পোস্টে বিভিন্ন স্বতন্ত্র প্রশ্ন ছিটানো আছে বলে মনে হচ্ছে। তাদের সমস্তকে একটি তালিকায় রাখুন বা অপ্রয়োজনীয় প্রশ্নগুলি সরিয়ে দিন। এটি উত্তর এবং আরও ভাল উত্তরের জন্য আরও বেশি লোককে আকৃষ্ট করে
অক্টোবাল

2
2 ডি থেকে উচ্চ মাত্রিক পরিস্থিতিতে যাওয়ার সময় সাধারণত স্বজ্ঞাতাকে কল্পনা থেকে প্রচুর সাহায্যের প্রয়োজন হয়, প্রায়শই, অন্তর্দৃষ্টি সম্পূর্ণভাবে ভেঙে যায়। নিম্ন মাত্রিক সমস্যার অনেকগুলি উচ্চ মাত্রিক সংস্করণ রয়েছে যা পুরো আলাদা বিশ্বের বলে মনে হয় যেখানে জিনিসগুলি আলাদাভাবে কাজ করে,
ফেরামাতের

উত্তর:


14

আমি কেন একটি মাত্রার শ্রেণিবদ্ধকে দুটি শ্রেণি পৃথক করার জন্য আরও ভাল কাজ করতে সাহায্য করে সে সম্পর্কে কিছুটা ধারণা অর্জনে আপনাকে সাহায্য করার চেষ্টা করতে যাচ্ছি।

ভাবুন আপনার কাছে ক্রমাগত দুটি ভবিষ্যদ্বাণী রয়েছেএক্স1এক্স2এন=3

এন = 3

এখন ক্লাস 1 এবং কিছু 2 শ্রেনীতে কিছু পয়েন্ট নির্ধারণের কথা কল্পনা করুন যে নোট করুন আমরা ক্লাসগুলি পয়েন্টগুলিতে কীভাবে নির্ধারিত করি তা বিবেচনা না করে আমরা সর্বদা একটি লাইন আঁকতে পারি যা পুরোপুরি দুটি ক্লাসকে আলাদা করে দেয়।

তবে এখন বলি আমরা একটি নতুন পয়েন্ট যুক্ত করি:

এন = 4

পি=2

তবে এখন যদি আমরা আরও একজন ভবিষ্যদ্বাণী যুক্ত করি তবে কী হয় এক্স3

পি = 3, এন = 4

পি=3এন=4

পিপি+ +1

এই সমস্ত বিষয় হ'ল আমরা যদি রাখিএনপি

এফএনএফএনএফএফপিএফএন=পি+ +1এফ হয় তবে এর সমস্ত পরিমাপযোগ্য ফাংশনের স্থানপিভেরিয়েবলগুলি তখন এটি পয়েন্টের সংখ্যাকে ছিন্নভিন্ন করতে পারে। ভাঙনের এই ধারণাটি, যা আমাদের সম্ভাব্য শ্রেণিবদ্ধদের একটি সেটের জটিলতা সম্পর্কে বলে দেয়, এটি পরিসংখ্যান শেখার তত্ত্ব থেকে আসে এবং শ্রেণীবদ্ধদের একটি সেট কী পরিমাণে ওভারফিট করতে পারে তার পরিমাণ সম্পর্কে বিবৃতি দিতে ব্যবহার করা যেতে পারে। আপনি যদি এতে আগ্রহী হন তবে আমি লাক্সবার্গ এবং শেলকোফফকে "স্ট্যাটিস্টিকাল লার্নিং থিয়োরি: মডেল, কনসেপ্টস এবং ফলাফল" (২০০৮) এর উচ্চ প্রস্তাব দিই ।


আপনার বিস্তারিত প্রতিক্রিয়ার জন্য অনেক ধন্যবাদ, এটি আমাকে বহুমাত্রিক বৈশিষ্ট্যগুলির ধারণা এবং কীভাবে সেগুলি স্বজ্ঞাতভাবে পৃথক করা যায় তা আরও ভালভাবে বুঝতে সহায়তা করেছে।
TheGoat

7

আপনি যখন নিম্ন মাত্রিক জায়গাগুলি সম্পর্কে নিজের স্বীকৃতিটি গ্রহণ করেন এবং এটিকে উচ্চ মাত্রিক জায়গাগুলিতে প্রয়োগ করেন তখন ভুল করা সহজ। আপনার স্বজ্ঞাততা এক্ষেত্রে ঠিক পিছনের দিকে। এটি নিম্ন স্থানের চেয়ে উচ্চতর মাত্রিক স্থানে পৃথকীকরণের হাইপারপ্লেন খুঁজে পাওয়া অনেক সহজ বলে প্রমাণিত হয়েছে।

যদিও কোনও দুটি জোড়া ভেরিয়েবলের দিকে তাকানোর সময়, লাল এবং নীল রঙের বিতরণগুলি ওভারল্যাপিং হয়, সমস্ত 15 ভেরিয়েবল একবারে একবার দেখলে এটি খুব সম্ভব যে তারা মোটেও ওভারল্যাপ না করে।


2

আপনার 15 টি ভেরিয়েবল রয়েছে, তবে আপনার নির্ভরশীল ভেরিয়েবলের বৈষম্যের জন্য এগুলির সমস্তই সমান তাত্পর্যপূর্ণ নয় (এর মধ্যে কিছুগুলি প্রায় অপ্রাসঙ্গিক হতে পারে))

প্রিন্সিপাল কম্পোনেন্ট অ্যানালাইসিস (পিসিএ) সেই 15 ভেরিয়েবলের একটি লিনিয়ার ভিত্তিক সংশোধন করে এবং তাদের অর্ডার দেয়, যাতে প্রথম কয়েকটি উপাদান সাধারণত বেশিরভাগ বৈকল্পিকতা ব্যাখ্যা করে। সুতরাং এটি আপনাকে একটি 15-মাত্রিক সমস্যাটিকে (বলুন) একটি 2,3,4, বা 5-মাত্রিক সমস্যা হ্রাস করতে দেয়। সুতরাং এটি চক্রান্ত আরও স্বজ্ঞাত করে তোলে; সাধারণত আপনি সংখ্যাসূচক (বা উচ্চ কার্ডিনালিটি অর্ডিনাল) ভেরিয়েবলের জন্য দুটি বা তিনটি অক্ষ ব্যবহার করতে পারেন, তারপরে তিনটি অতিরিক্ত মাত্রার জন্য চিহ্নিতকারী রঙ, আকার এবং আকার ব্যবহার করুন (আপনি যদি কম কার্ডিনালিটি অর্ডিনালগুলি একত্রিত করতে পারেন তবে আরও বেশি)। সুতরাং 6 টি অতি গুরুত্বপূর্ণ পিসির সাথে ষড়যন্ত্র করার ফলে আপনাকে আপনার সিদ্ধান্তের পৃষ্ঠের আরও পরিষ্কার ধারণা দেওয়া উচিত।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.