শ্রেণিবিন্যাসের জন্য আমি কীভাবে এইচএমএমকে প্রশিক্ষণ দেব?


12

সুতরাং আমি বুঝতে পারি যে আপনি যখন এইচএমএমকে শ্রেণিবিন্যাসের জন্য প্রশিক্ষণ দেন তখন মানক পদ্ধতিটি হয়:

  1. প্রতিটি শ্রেণীর জন্য ডেটা সেটগুলিতে আপনার ডেটা সেটগুলি আলাদা করুন
  2. প্রতি ক্লাসে একজন করে এইচএমএম প্রশিক্ষণ দিন
  3. পরীক্ষার সেটটিতে প্রতিটি উইন্ডোকে শ্রেণিবদ্ধ করার জন্য প্রতিটি মডেলের সম্ভাবনা তুলনা করুন

তবে আমি কীভাবে প্রতিটি ক্লাসে এইচএমএম প্রশিক্ষণ দেব? আমি কি একসাথে এক শ্রেণীর সাথে সম্পর্কিত ডেটাটি একত্রিত করি? তবে কি টাইম সিরিজের ডেটাগুলি ক্রমানুসারে বোঝানো হচ্ছে না - এবং আমি যদি তা করি তবে আমি বলছি যে কিছু ডেটা পয়েন্ট ক্রমাগত যখন সেগুলি হয় না?

আরও কংক্রিট হওয়ার জন্য আমার কাছে কিছু ইইজি তথ্য রয়েছে যা একটি 96xT ম্যাট্রিক্স যেখানে আমার 96 টি বৈশিষ্ট্যযুক্ত ভেক্টর রয়েছে যা বিভিন্ন চ্যানেল থেকে বিভিন্ন ফ্রিকোয়েন্সিগুলির পাওয়ার বর্ণালী ঘনত্ব এবং টি সংকেতের সময়ের দৈর্ঘ্য (কিছু নমুনার হারে)

এটি উইন্ডোতে বিভক্ত করা যেতে পারে যা আমি পরীক্ষামূলক প্রোটোকল (ডেটা লেবেলযুক্ত) থেকে জানি এবং তাই আমি প্রতিটি ক্লাসের জন্য 96 * টি ম্যাট্রিকের সেট একসাথে সংগ্রহ করতে পারি। যেখানে টি টি এর চেয়ে কম এবং প্রতিটি উইন্ডোর আকার নির্দেশ করে।

এরপরে আমি কীভাবে এই ডেটাতে এইচএমএমকে প্রশিক্ষণ দেব? যদি এটি সাহায্য করে আমি pmtk3 টুলকিটটি ব্যবহার করার চেষ্টা করছি, তবে আমি সত্যিই যে কোনও কিছু ব্যবহার করতে খুলি - পাওয়ার বর্ণালি ঘনত্বগুলি ক্রমাগত বিচ্ছিন্ন না হওয়ায় এটি সত্যিকারের মূল্যবান পর্যবেক্ষণগুলি মোকাবেলা করতে সক্ষম হতে হবে (ডিফল্ট ম্যাটল্যাব টুলবক্স কেবলমাত্র ডিল করতে পারে স্বতন্ত্র পর্যবেক্ষণ সহ)।

লেবেলযুক্ত ডেটা সম্পর্কে প্রশিক্ষণ প্রাপ্ত কোনও মানসিক অবস্থার জন্য ইইজি ডেটা উইন্ডোজকে শ্রেণিবদ্ধ করতে সক্ষম হবার উদ্দেশ্য। এটি বার্লিন বিসিআই প্রতিযোগিতা ডেটা ব্যবহার করে মস্তিষ্ক-কম্পিউটার ইন্টারফেসের সমস্যা ।


1
কি এই পৃষ্ঠার মামলা প্রয়োজন কি?
15-25 এ

দেখে মনে হচ্ছে - আমি এটি চেষ্টা করে দেখতে চেষ্টা করব। এটি স্পষ্টতই কেবল বহুজাতিকের পরিবর্তে গাউসীয় এবং গাউসীয় মডেলগুলির মিশ্রণের অনুমতি দেয়। এবং এটি প্রদর্শিত হয় আপনি একাধিক পর্যবেক্ষণে বিশ্বব্যাপী কোনও মডেলকে প্রশিক্ষণ দিতে পারেন তাই এটি দুর্দান্ত দেখাচ্ছে। আমি পাইথনকে যাইহোক সঠিকভাবে শেখার অর্থ করছি কারণ এর ব্যাপক ব্যবহার রয়েছে। ধন্যবাদ :)
অ্যালেক্স ম্যাকমুরে

উত্তর:


9

শ্রেণিবিন্যাসের জন্য এইচএমএমগুলি ব্যবহারের জন্য আপনি যে পদ্ধতির বর্ণনা করেছেন তা সত্যই কেবল সেটিংগুলিতে প্রযোজ্য যেখানে আপনার স্বতন্ত্র সিকোয়েন্স রয়েছে যেখানে আপনি শ্রেণিবদ্ধ করতে চান। উদাহরণস্বরূপ, আমি যদি বাক্যগুলির অনুভূতিকে ধনাত্মক বা নেতিবাচক হিসাবে শ্রেণিবদ্ধ করছিলাম তবে আপনি বর্ণিত হিসাবে আমি প্রত্যেকটির জন্য এইচএমএম তৈরি করতে পারি। আমি এখানে সম্পর্কিত সম্পর্কিত উত্তর দেখুন । পোস্টারিয়ারগুলির তুলনা করার আগে আমি শ্রেণিবদ্ধ হওয়ার জন্য অর্থপূর্ণ খণ্ডগুলিতে ক্রমগুলি ভেঙে ফেলতে পারি এই ধারণার উপরে কীভাবে পর্যবেক্ষণ করুন তা লক্ষ্য করুন। আপনার সমস্যার একটি বড় দৈর্ঘ্যের টাইম সিরিজ কার্যকর হওয়ায় এটি আপনার সমস্যার ক্ষেত্রে হবে বলে মনে হচ্ছে না । এখানে আমি চেষ্টা করব কি।T

আপনি রেডডিতে উল্লেখ করেছেন যে আপনি প্রতিটি শ্রেণীর জন্য একটি একক রাষ্ট্র নির্ধারণ করতে দ্বিধাগ্রস্ত ছিলেন। আপনি কি এই চেষ্টা করেছেন? এটি আপনার বিবেচনার মতো খারাপ কাজ করতে পারে না। এই ক্ষেত্রে অনুমানের সমস্যাটিও উল্লেখযোগ্যভাবে সহজ। রূপান্তর সম্ভাবনাগুলি অনুমান করা সহজ, আপনি কেবল প্রয়োজনীয়ভাবে গণনা করুন। অস্থায়ী দিকগুলি উপেক্ষা করে আপনি পর্যবেক্ষণ করা ডেটা এবং সংশ্লিষ্ট শ্রেণীর উপর ভিত্তি করে প্রতিটি রাজ্যের জন্য নির্গমন সম্ভাবনার সাথে খাপ খাইয়ে নিতে পারেন।

আপনি যদি নিশ্চিত হন যে এটি একটি খারাপ ধারণা, বা এটি খারাপ সম্পাদন করেছে তবে এখনও জেনারেটাল মডেলগুলির সাথে লেগে থাকতে চান, আপনি হায়ারারিকাল এইচএমএম এর মতো কিছু ব্যবহার করতে পারেন। উদাহরণস্বরূপ, আপনি শীর্ষ-স্তরের রাজ্যগুলিকে শ্রেণীর প্রতিনিধিত্ব করতে এবং তারপরে নিম্ন স্তরের এইচএমএমগুলিকে ক্লাসের মধ্যে অস্থায়ী পরিবর্তনের মডেল করার অনুমতি দিতে পারেন। অনুরূপ কিছু অর্জন করতে আপনি একটি বড় এইচএমএমও ব্যবহার করতে পারেন। যদি আপনার ক্লাস থাকে তবে , , ফর্মের প্রতিটি শ্রেণির জন্য রাজ্যগুলি (তাই সম্পূর্ণরূপে রাজ্যগুলি) বরাদ্দ করুন । প্রশিক্ষণের সময় আপনি HMM সময়ে একটি রাষ্ট্রের রূপান্তরের একমাত্র বরাদ্দ ইতিবাচক সম্ভাবনা বাধ্য করতে হবে যেখানেএন এন × কে এস কে আই কে = 1 , , কে আই = 1 , এন টি কে টিKNN×Kskik=1,,Ki=1,Ntk সময়ে ট্যাগ ম্যাচ । আমি এটি কিছুটা বিশ্রীভাবে বলতে পারি তাই আমি আশা করি এটি আমার অর্থ কী তা পরিষ্কার হয়ে গেছে। স্পষ্টতই আপনি এটিকে ক্লাসে বিভিন্ন সংখ্যক রাজ্যের সংখ্যায়িত করতে সাধারণীকরণ করতে পারেন। সম্ভবত অন্যান্য ধরণের ডায়নামিক বায়েশিয়ান নেটওয়ার্কগুলিও আপনি ব্যবহার করতে পারেন। কেভিন মারফি এর থিসিস একটি দুর্দান্ত রেফারেন্স। তিনি এইচএইচএমএসকে এইচএমএসে রূপান্তর করার বিষয়েও আলোচনা করেন।t

শেষ অবধি, আপনি শর্তাধীন র্যান্ডম ফিল্ডের মতো বৈষম্যমূলক মডেলটিতে যেতে পারেন। একটি বৈষম্যমূলক মডেল আপনাকে আরও জটিল বৈশিষ্ট্যগুলি সহজেই অন্তর্ভুক্ত করতে এবং হাতের কাছে থাকা সমস্যার সরাসরি সমাধান করার অনুমতি দেয় (শর্তাধীন ঘনত্বের অনুমান)। এটিই সম্ভবত আমি প্রথমে চেষ্টা করব।


পর্যবেক্ষণকৃত মানগুলি অবিচ্ছিন্ন তাই আমি কোনও গাউসিয়ান বা জিএমএম ফিট করব। হিসাবে reddit আলোচনা এটি মডেল ক্ষমতা সীমাবদ্ধ। স্থিতিশীল মডেলের তুলনায় টেম্পোরাল দিকটি শ্রেণিবিন্যাসের নির্ভুলতায় কীভাবে প্রভাব ফেলবে তা দেখতে আমি এই মডেলটি ব্যবহার করছি। আমি সচেতন যে বৈষম্যমূলক মডেলগুলি শ্রেণিবিন্যাসের জন্য আরও ভাল হতে পারে এবং মারফি এর থিসিসের বিটগুলি পড়েছে। এটি আকর্ষণীয় বলে মনে হচ্ছে তবে আমার এইচএমএমকে আমার অধ্যাপক সুপারিশ করেছিলেন (এটি একটি উন্মুক্ত প্রকল্প) তাই আমি এটি চেষ্টা করব। ভবিষ্যতে আমি ইইজি / এমইজি সিগন্যালের সাথে আরও কাজ করতে চাই যদিও আমি অন্য সময়ে অন্য পদ্ধতিগুলি চেষ্টা করব। :)
অ্যালেক্স ম্যাকমুরে

1
শেষ পর্যন্ত আমি একাধিক পর্যবেক্ষণের জন্য স্ক্লার্ন এবং এর সমর্থন ব্যবহার করেছি। এটি সঠিকভাবে কাজ করেছে বলে মনে হয়েছিল। আমার কোডটি খনন করা উচিত এবং এটি দেখতে আসলে এটি কীভাবে ডিল করে।
অ্যালেক্স ম্যাকমুরে

1
অ্যালেক্স, আপনি কীভাবে "একাধিক পর্যবেক্ষণের জন্য স্কলার্ন এবং এর সমর্থন" হিসাবে উল্লেখ করেন তার কোনও লিঙ্ক বা উদাহরণ সরবরাহ করতে পারেন? আমি এই সমস্যাটি (এবং এইচএমএমকে কীভাবে "বলতে" সম্পর্কিত একাধিক পর্যবেক্ষণ একক শ্রেণীর লেবেলের অন্তর্ভুক্ত) এর সাথে সম্পর্কিত সমস্যাটি এখন বহু বছর ধরে পড়েছি এবং আপনি কীভাবে তাদের সম্বোধন করেছেন তা জানতে আগ্রহী।
রুবেনুলিস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.