আমি যা পড়েছি তা থেকে:
A Distant supervision algorithm usually has the following steps:
1] It may have some labeled training data
2] It "has" access to a pool of unlabeled data
3] It has an operator that allows it to sample from this unlabeled
data and label them and this operator is expected to be noisy in its labels
4] The algorithm then collectively utilizes the original labeled training data
if it had and this new noisily labeled data to give the final output.
স্ব-শিক্ষণ ( ইয়েটস, আলেকজান্ডার, ইত্যাদি। "পাঠ্যকর্মকর্তা: ওয়েবে তথ্য উন্মুক্তকরণ।" মানব ভাষা প্রযুক্তিগুলির কার্যবিবরণী: অ্যাসোসিয়েশন ফর কমপিটেশনাল ল্যাঙ্গিস্টিক্সের উত্তর আমেরিকান অধ্যায়ের বার্ষিক সম্মেলন: বিক্ষোভের জন্য। সংযুক্তি ভাষাবিজ্ঞান, 2007. ):
লার্নার দুটি পদক্ষেপে কাজ করে। প্রথমত, এটি স্বয়ংক্রিয়ভাবে তার নিজস্ব প্রশিক্ষণ ডেটাটিকে ইতিবাচক বা নেতিবাচক হিসাবে লেবেল করে। দ্বিতীয়ত, এটি একটি লেভেল ডেটা কোনও নাইভ বেয়েস শ্রেণিবদ্ধ প্রশিক্ষণার্থে ব্যবহার করে।
দুর্বল তদারকি (হফম্যান, রাফেল, ইত্যাদি। "ওভারল্যাপিং সম্পর্কের তথ্য আহরণের জন্য জ্ঞান-ভিত্তিক দুর্বল তদারকি।" কমপিটেশনাল ভাষাতত্ত্বের জন্য অ্যাসোসিয়েশনের ৪৯ তম বার্ষিক সভার কার্যক্রিয়া: মানব ভাষা প্রযুক্তি-খণ্ড ১. কম্পিউটেশনাল ভাষাতত্ত্বের সমিতি, ২০১১ ।):
একটি আরও প্রতিশ্রুতিবদ্ধ পদ্ধতির, যা প্রায়শই "দুর্বল" বা "দূর" তদারকি বলা হয়, তাত্পর্যপূর্ণভাবে একটি পাঠ্যসূচীর সাথে সম্পর্কিত পাঠ্যের সাথে মেলামেশার মাধ্যমে নিজস্ব প্রশিক্ষণ ডেটা তৈরি করে।
লেবেলিং হিউরিস্টিক প্রশিক্ষিত শ্রেণিবদ্ধকারী হিসাবে স্ব-প্রশিক্ষণটি কিছুটা আলাদা বলে মনে হচ্ছে ব্যতিক্রম ব্যতীত আমার কাছে এটি সমস্তই একরকম লাগে and এবং লেবেলিং পর্ব এবং শ্রেণিবদ্ধ প্রশিক্ষণ পর্বের মধ্যে একটি লুপ রয়েছে। তবে ইয়াও, লিমিন, সেবাস্তিয়ান রিডেল এবং অ্যান্ড্রু ম্যাককালাম। " লেবেলযুক্ত ডেটা ছাড়াই সমষ্টিগত ক্রস-ডকুমেন্ট রিলেশন এক্সট্রাকশন " "প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের অনুশীলন পদ্ধতিগুলির উপর ২০১০ সালের সম্মেলনের কার্যক্রম। অ্যাসোসিয়েশন ফর কম্পিউটেশনাল ভাষাতত্ত্ব, 2010. দাবি করেছেন যে দূরবর্তী তদারকি == স্ব প্রশিক্ষণ == দুর্বল তদারকি ision
এছাড়াও, অন্যান্য প্রতিশব্দ আছে ?