এলডিএ বনাম পারসেপ্ট্রন


9

অন্যান্য তত্ত্বাবধানে শেখার কৌশলগুলির মধ্যে কীভাবে এলডিএ 'ফিট করে' তার জন্য আমি একটি অনুভূতি পাওয়ার চেষ্টা করছি। আমি ইতিমধ্যে এলডিএ সম্পর্কে এখানে কিছু এলডিএ-এস্কু পোস্ট পড়েছি। আমি পার্সেপট্রনের সাথে ইতিমধ্যে পরিচিত, তবে এখনই এলডিএ শিখছি।

এলডিএ তত্ত্বাবধানে শেখার অ্যালগরিদমের পরিবারে কীভাবে 'ফিট' হয়? এই অন্যান্য পদ্ধতিগুলির তুলনায় এর ত্রুটিগুলি কী হতে পারে এবং এর জন্য আরও কী কী ব্যবহার করা যেতে পারে? কেন এলডিএ ব্যবহার করবেন, যখন কেউ কেবল ব্যবহারের জন্য বলতে পারেন, উদাহরণস্বরূপ অনুধাবনকারী?


1
আমি মনে করি আপনি তত্ত্বাবধানে পড়াশুনা কী তা সম্পর্কে বিভ্রান্ত হতে পারেন। কে-অর্থ হ'ল একটি নিরীক্ষণযোগ্য শিখন ক্লাস্টারিং অ্যালগরিদম। পারসেপ্ট্রন হ'ল তত্ত্বাবধানে থাকা শিক্ষার শ্রেণিবিন্যাস অ্যালগরিদম যা এমন একটি হাইপারপ্লেন আবিষ্কার করার চেষ্টা করে যা ইতিবাচক পর্যবেক্ষণ থেকে নেতিবাচককে পৃথক করে। এলডিএ হ'ল এমন একটি পদ্ধতি যা তত্ত্বাবধানে শ্রেণিবিন্যাসের জন্য ব্যবহার করা যেতে পারে তবে তদারকি বৈশিষ্ট্য নির্বাচনের জন্য বেশি ব্যবহৃত হয়। এলডিএ শ্রেণিবদ্ধের অনুমানের জন্য @ অ্যাডামোর উত্তর দেখুন।
বিটওয়াইজ

@ বিটওয়াইফ উফফ! আমি জানি না কেন আমি কেন-কে এখানে রেখেছি। হ্যাঁ, এটি একটি নিরীক্ষণ করা অ্যালগরিদম। আমি এটি একটি সম্পাদনায় মুছে ফেলব।
ক্রিয়েস্ট্রন

@ বিটওয়াইজ এলডিএ এবং পেরসেপ্ট্রন সম্পর্কে আপনি যা বলেছেন তা সম্পর্কে, হ্যাঁ, এটিই আমাকে বিভ্রান্ত করছে। এলডিএ একটি হাইপারপ্লেন সন্ধান করার চেষ্টা করে যাতে আপনার ডেটা প্রজেক্ট করা যায়, যেমন এটি আন্তঃক্লাস্টারের বৈচিত্রকে সর্বাধিক করে তোলে while তারপরে সীমান্তে আপনার একটি শ্রেণিবদ্ধ রয়েছে। পারসেপ্ট্রন অনুরূপ কিছু করে, এতে এটি লেবেলযুক্ত ডেটা ছিন্ন করার জন্য একটি সর্বোত্তম হাইপারপ্লেনও সন্ধান করার চেষ্টা করে। তাহলে কেন একে অপরকে ব্যবহার করবেন?
ক্রিয়েটরন

উত্তর:


15

অ্যাডামো উপরোক্ত মন্তব্যে যেমন পরামর্শ দিয়েছেন, আপনি স্ট্যাটিস্টিকাল লার্নিংয়ের উপাদানগুলি (যা আমি এইচটিএফ বলব) এর চতুর্থ অধ্যায়টি পড়ার চেয়ে আরও ভাল করতে পারবেন না যা এলডিএকে অন্যান্য রৈখিক শ্রেণিবদ্ধকরণ পদ্ধতির সাথে তুলনা করে, অনেক উদাহরণ দেয় এবং ব্যবহারটি নিয়েও আলোচনা করে পিসিএর শিরাতে একটি মাত্রা-হ্রাস কৌশল হিসাবে এলডিএর যা টিটিএনফ্যানস উল্লেখ করেছে, বরং এটি জনপ্রিয়।

শ্রেণিবিন্যাসের দৃষ্টিকোণ থেকে, আমি মনে করি মূল পার্থক্যটি এটি। কল্পনা করুন যে আপনার দুটি ক্লাস রয়েছে এবং আপনি সেগুলি আলাদা করতে চান। প্রতিটি শ্রেণীর একটি সম্ভাবনার ঘনত্ব ফাংশন রয়েছে। সর্বোত্তম সম্ভাব্য পরিস্থিতি যদি আপনি এই ঘনত্বের কার্যগুলি জানতেন তবে আপনি ভবিষ্যদ্বাণী করতে পারবেন যে বিন্দুটি কোন বিন্দুটির সাথে সম্পর্কিত হবে সেই বিন্দুতে শ্রেণি-নির্দিষ্ট ঘনত্বগুলি মূল্যায়ন করে।

কিছু ধরণের শ্রেণিবদ্ধকারী ক্লাসগুলির ঘনত্বের ফাংশনগুলির একটি সান্নিধ্য সন্ধান করে পরিচালনা করে। এলডিএ এর মধ্যে একটি; এটি এই ধারণাটি তৈরি করে যে একই ঘনত্বগুলি একই কোভারিয়েন্স ম্যাট্রিক্সের সাথে ঘনত্বগুলি স্বাভাবিক করে তোলে। এটি একটি শক্তিশালী অনুমান, তবে এটি যদি প্রায় সঠিক হয় তবে আপনি একটি ভাল শ্রেণিবদ্ধ পাবেন। অন্যান্য অনেক শ্রেণিবদ্ধরাও এই ধরণের পদ্ধতিকে গ্রহণ করে তবে স্বাভাবিকতা ধরে নেওয়ার চেয়ে আরও নমনীয় হওয়ার চেষ্টা করেন। উদাহরণস্বরূপ, এইচটিএফ এর 108 পৃষ্ঠা দেখুন।

অন্যদিকে, পৃষ্ঠা 210 এ, এইচটিএফ সতর্ক করে:

শ্রেণিবিন্যাস যদি চূড়ান্ত লক্ষ্য হয় তবে পৃথক শ্রেণীর ঘনত্বগুলি ভালভাবে শেখা অপ্রয়োজনীয় হতে পারে এবং বাস্তবে বিভ্রান্তিকর হতে পারে।

আরেকটি পদ্ধতির মধ্যে রয়েছে কেবলমাত্র দুটি শ্রেণির মধ্যে একটি সীমানা সন্ধান করা, যা পার্সেপ্রেস্ট্রন তা করে। এর আরও পরিশীলিত সংস্করণ হ'ল সহায়তা ভেক্টর মেশিন। এই পদ্ধতিগুলি কার্নেলাইজেশন নামক একটি প্রযুক্তি ব্যবহার করে ডেটাতে বৈশিষ্ট্যগুলি যুক্ত করার সাথেও একত্রিত করা যেতে পারে। এটি এলডিএর সাথে কাজ করে না কারণ এটি স্বাভাবিকতা সংরক্ষণ করে না, তবে শ্রেণিবদ্ধের জন্য কোনও সমস্যা নেই যা কেবল একটি পৃথক পৃথক হাইপারপ্লেনের সন্ধান করছে।

এলডিএ এবং একটি শ্রেণিবদ্ধের মধ্যে পার্থক্য যা পৃথক পৃথক হাইপারপ্লেনের সন্ধান করে টি-টেস্ট এবং সাধারণ পরিসংখ্যানগুলিতে কিছু ননপ্রেমেটারিক বিকল্পের মধ্যে পার্থক্যের মতো। পরবর্তীটি আরও দৃust় (উদাহরণস্বরূপ, বিদেশিদের কাছে) তবে এর অনুমানগুলি সন্তুষ্ট হলে প্রাক্তনটি সর্বোত্তম।

আরও একটি মন্তব্য: এটি উল্লেখ করার মতো হতে পারে যে কিছু লোকের এলডিএ বা লজিস্টিক রিগ্রেশন জাতীয় পদ্ধতি ব্যবহারের জন্য সাংস্কৃতিক কারণ থাকতে পারে, যা আনোভা টেবিলে, অনুমানের পরীক্ষাগুলি এবং এই জাতীয় জিনিসগুলিকে আশ্বাস দেয়। এলডিএ আবিষ্কার করেছিলেন ফিশার; পার্সেপেট্রন মূলত একটি মানব বা প্রাণী নিউরনের মডেল ছিল এবং পরিসংখ্যানের সাথে তার কোনও সংযোগ ছিল না। এটি অন্যান্য উপায়েও কাজ করে; কিছু লোক সাপোর্ট ভেক্টর মেশিনের মতো পদ্ধতি পছন্দ করতে পারে কারণ তাদের ধরণের কাটিয়াড হিপস্টার-ক্রেডিট রয়েছে যা বিংশ শতাব্দীর পদ্ধতিগুলি কেবল মেলে না। এর মানে এই নয় যে তারা আরও ভাল। ( হ্যাকারদের জন্য মেশিন লার্নিংয়ে এর একটি ভাল উদাহরণ আলোচনা করা হয়েছে , যদি আমি সঠিকভাবে স্মরণ করি))


"কিছু লোক সাপোর্ট ভেক্টর মেশিনের মতো পদ্ধতি পছন্দ করতে পারে কারণ তাদের ধরণের হিপস্টার-ক্রেডিট ধরণের রয়েছে যা বিংশ শতাব্দীর পদ্ধতিগুলি কেবল মেলে না।" হাঃ হাঃ হাঃ! আসলেই সত্য. বিটিডব্লিউ আপনার কাছে খুব পরিষ্কার এবং নির্ভুলভাবে বিষয়গুলি ব্যাখ্যা করার জন্য একটি দক্ষতা রয়েছে। ধন্যবাদ! জিনিসগুলি কীভাবে একসাথে ফিট হয় এবং আপনি এটি সরবরাহ করেছিলেন সে সম্পর্কে আমার একটি 'মানচিত্র' দরকার needed
ক্রিয়েট্রন

2

স্বজ্ঞাততার জন্য, এই কেসটি বিবেচনা করুন:

এখানে চিত্র বর্ণনা লিখুন

রেখাটি দুটি ও ক্লাসের মধ্যে "অনুকূল সীমানা" উপস্থাপন করে।

এলডিএ একটি হাইপারপ্লেন সন্ধান করার চেষ্টা করে যা আন্তঃক্র্লাস্টার বৈকল্পকে ন্যূনতম করে এবং আন্তঃক্লাস্টার বৈকল্পিককে সর্বাধিক করে তোলে এবং তারপরে এই হাইপারপ্লেনের সীমানাকে অরথোগোনাল হিসাবে নিয়ে যায়। এখানে, এটি সম্ভবত কাজ করবে না কারণ ক্লাস্টারগুলির একই দিকের বৃহত্তর বৈচিত্র রয়েছে।

অন্যদিকে, একটি পার্সেপট্রন ভাল বিভাজন হাইপারপ্লেন খুঁজে পাওয়ার আরও ভাল সুযোগ থাকতে পারে।

গাউসীয় বন্টন রয়েছে এমন শ্রেণীর ক্ষেত্রে, যদিও এলডিএ সম্ভবত আরও ভাল করবে, যেহেতু পার্সেপট্রন কেবলমাত্র একটি পৃথক হাইপারপ্লেন আবিষ্কার করে যা উপাত্তগুলির সাথে সামঞ্জস্যপূর্ণ, কোন হাইপারপ্লেনটি বেছে নেয় তার গ্যারান্টি না দিয়ে (সেখানে অসীম সংখ্যা থাকতে পারে) ধারাবাহিক হাইপারপ্লেনের)। তবে পার্সেপেট্রনের আরও পরিশীলিত সংস্করণগুলি কয়েকটি অনুকূল বৈশিষ্ট্য সহ হাইপারপ্লেন বেছে নিতে পারে যেমন ক্লাসগুলির মধ্যে মার্জিন সর্বাধিক করে তোলা (এটি মূলত সমর্থন ভেক্টর মেশিনগুলিই করে)।

এছাড়াও লক্ষ করুন যে এলডিএ এবং পার্সেপট্রন উভয়ই কার্নেল ট্রিকের মাধ্যমে অ-লিনিয়ার সিদ্ধান্তের সীমানায় প্রসারিত হতে পারে ।


1

এলডিএ এবং অন্যান্য পদ্ধতির মধ্যে সবচেয়ে বড় পার্থক্যগুলির একটি হ'ল এটি কেবলমাত্র একটি ডেটা মেশিন লার্নিং কৌশল যা সাধারণত বিতরণ করা হয় বলে ধরে নেওয়া হয়। এটি অনুপস্থিত ডেটা বা কাটছাঁটির ক্ষেত্রে দুর্দান্ত হতে পারে যেখানে আপনি খুব অদ্ভুত এবং / বা আকর্ষণীয় পরিস্থিতিতে সম্ভাব্যতা সর্বাধিক করতে EM অ্যালগরিদম ব্যবহার করতে পারেন। ক্যাভেট সম্রাট কারণ মাল্টিমোডাল ডেটার মতো মডেল অপব্যবহারগুলি খারাপ ফলাফল করার পূর্বাভাস দিতে পারে যেখানে কে-মানে ক্লাস্টারিং আরও ভাল করতে পারত। এলডিএতে সুপ্ত ভেরিয়েবলগুলি বা ক্লাস্টারিং সনাক্ত করতে EM এর সাথে মাল্টিমোডাল ডেটাও গণনা করা যেতে পারে।

উদাহরণস্বরূপ, ধরুন আপনি সিডি 4 গণনার উপর ভিত্তি করে 5 বছরে এইডসের একটি ধনাত্মক নির্ণয়ের বিকাশের সম্ভাবনা পরিমাপ করতে খুঁজছেন আরও ধরুন যে আপনি কোনও নির্দিষ্ট বায়োমারকারের মান জানেন না যা সিডি 4 গুনের প্রভাব ফেলে এবং আরও ইমিউনোপ্রপ্রেসের সাথে যুক্ত। সিডি 4 গণনা 400 এর অধীনে বেশিরভাগ সাশ্রয়ী মূল্যের অ্যাসে সনাক্তকরণের কম সীমাবদ্ধতার নীচে। ইএম অ্যালগরিদম আমাদের পুনরুক্তিযুক্ত ডিএফের জন্য সিডি 4 এর জন্য এলডিএ এবং বায়োমারকার অ্যাসাইনমেন্ট এবং উপায় এবং স্বতন্ত্রতার পুনরাবৃত্তি গণনা করতে দেয়।


ধন্যবাদ আদম, যদিও আমি এখন নিজেকে আরও বিভ্রান্ত মনে করি। :-) এলডিএ কীভাবে আরও খারাপ / খারাপ বলে যে পার্সেপট্রন, বা অন্যান্য তত্ত্বাবধানে শেখার কৌশল? ইএম অ্যালগো সম্পর্কিত, আপনি এটি বলার সুযোগে ব্যবহার করছেন যে আপনি এলডিএর পক্ষে সমাধান করতে পারবেন, কোনও ইএম আলগো ব্যবহার করে , সঠিক?
ক্রিয়েস্ট্রন

1
@ অ্যাডামো, আমি স্পষ্টতা যোগ করতে চাই যে ডেটা হ্রাস কৌশল যেমন এলডিএ স্বাভাবিকতার উপর নির্ভর করে না, ঠিক তেমন পিসিএ করে না। এলডিএর মধ্যে স্বাভাবিকতা 1) স্ট্যাটিস্টিকাল টেস্টিং (বাক্সের এম পরীক্ষা ইত্যাদি), 2) শ্রেণিবিন্যাসের অনুমান।
ttnphns

@ttnphns স্বাভাবিকতা অনুমান করার অর্থ এলডিএ একটি এমএল কৌশল। এমএল একটি ভাল জিনিস। আমি উল্লিখিত উদাহরণে সুনির্দিষ্ট সতর্কতাগুলি কঠিন সমস্যা সমাধানে এমএল ব্যবহার করে। এই সমাধানগুলি কেবলমাত্র অত্যাধুনিক সিমুলেশন এবং / বা বিজিজি দিয়েই সম্ভব হবে।
আদমো

@ দ্য গ্র্যাপিবিয়ান্ড এলওডি মহল দূরত্ব বিটিএন দুটি গ্রুপকে সর্বাধিক করে তোলে। এসএলপি (একক স্তর পার্সেপট্রন, বা নেট) বৈশিষ্ট্য স্পেসে হাইপারপ্লেন আঁকে যা সর্বাধিক শ্রেণিবিন্যাসের নির্ভুলতা তৈরি করে ... আমার মনে হয়। একটি ভাল শুরু করার জায়গাটি হ'ল টিবস / হাস্টি বইটি পড়া। আমাকে নিজেই এটি ব্রাশ করতে হবে।
আদমো
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.