এই উত্তরটি টেনসরফ্লো সম্পর্কিত নয়, ব্যয় ক্রিয়াকলাপগুলির সাধারণ পক্ষে এবং আপনার প্রশ্নের অংশটি বেশিরভাগ "এই বিষয় সম্পর্কে কিছু ব্যাখ্যা" সম্বোধন করবে।
বেশিরভাগ উদাহরণ / টিউটোরিয়ালে আমি অনুসরণ করেছি, ব্যবহৃত ব্যয় ফাংশনটি কিছুটা নির্বিচারে ছিল। মূল বিষয়টি পাঠককে একটি নির্দিষ্ট পদ্ধতির সাথে পরিচয় করিয়ে দেওয়ার জন্য ছিল, বিশেষত ব্যয়টির জন্য নয়। সরঞ্জামগুলির সাথে পরিচিত হওয়ার জন্য টিউটোরিয়ালটি অনুসরণ করা আপনাকে থামিয়ে দেওয়া উচিত নয়, তবে আমার উত্তরটি আপনাকে কীভাবে আপনার নিজের সমস্যার জন্য ব্যয় কার্যকারিতা চয়ন করতে সহায়তা করবে।
যদি আপনি ক্রস-এন্ট্রপি, লজিট, এল 2 মান বা কোনও নির্দিষ্ট কিছু সম্পর্কিত উত্তর চান তবে আমি আপনাকে একাধিক, আরও নির্দিষ্ট প্রশ্ন পোস্ট করার পরামর্শ দিচ্ছি। এটি সম্ভাব্যতা বাড়িয়ে তুলবে যে নির্দিষ্ট জ্ঞানযুক্ত কেউ আপনার প্রশ্নটি দেখবে।
কাঙ্ক্ষিত ফলাফল অর্জনের জন্য সঠিক ব্যয় কার্যকারিতা নির্বাচন করা মেশিন লার্নিং সমস্যার একটি গুরুত্বপূর্ণ বিষয়। প্রাথমিক পদ্ধতি, যদি আপনি নিজের পদ্ধতিটি থেকে ঠিক কী চান তা না জানেন, তবে রিগ্রেশন সমস্যাগুলির জন্য মীন স্কয়ার ত্রুটি (উইকিপিডিয়া) এবং শ্রেণিবিন্যাসের সমস্যার জন্য শতাংশের ত্রুটি ব্যবহার করা। তবে, আপনি যদি আপনার পদ্ধতি থেকে ভাল ফলাফল চান , আপনার ভাল সংজ্ঞা দেওয়া দরকার , এবং এইভাবে পর্যাপ্ত ব্যয় কার্যকারিতাটি সংজ্ঞায়িত করতে হবে। এটি ডোমেন জ্ঞান (আপনার ডেটা কী, আপনি কী অর্জন করার চেষ্টা করছেন) এবং আপনার নিষ্পত্তি করার সরঞ্জামগুলির জ্ঞান উভয় থেকেই আসে।
টেনসরফ্লোতে ইতিমধ্যে প্রয়োগ করা ব্যয় ক্রিয়াকলাপগুলির মাধ্যমে আমি আপনাকে গাইড করতে পারি বলে আমি বিশ্বাস করি না, কারণ সরঞ্জামটির আমার কাছে খুব কম জ্ঞান রয়েছে তবে আমি আপনাকে বিভিন্ন ব্যয়ের ক্রিয়াকলাপ কীভাবে লিখতে এবং মূল্যায়ন করতে পারি তার একটি উদাহরণ দিতে পারি।
খরচ ফাংশন মধ্যে বিভিন্ন পার্থক্য আঁকা, আমাদের বাইনারি শ্রেণীবিন্যাস সমস্যা, যেখানে আমরা চাই, উদাহরণ ব্যবহার করার অনুমতি প্রতিটি নমুনা জন্য , বর্গ ।xnf(xn)∈{0,1}
গণনামূলক বৈশিষ্ট্য দিয়ে শুরু ; "একই জিনিস" পরিমাপ করার জন্য দুটি কার্য কীভাবে বিভিন্ন ফলাফল হতে পারে। নিম্নলিখিত, সাধারণ ব্যয় কার্যকারিতা নিন; ত্রুটির শতাংশ আপনার যদি নমুনা থাকে, হ'ল পূর্বাভাসীকৃত শ্রেণি এবং প্রকৃত ক্লাস হয়, আপনি ছোট করতে চানNf(yn)yn
- 1N∑n{10 if f(xn)≠yn otherwise=∑nyn[1−f(xn)]+[1−yn]f(xn) ।
এই ব্যয় কার্যটি সহজে ব্যাখ্যাযোগ্য হওয়ার সুবিধা রয়েছে। তবে এটি মসৃণ নয়; যদি আপনার কাছে মাত্র দুটি নমুনা থাকে তবে ফাংশনটি "জাম্পিং" থেকে 0, 0.5 থেকে 1 হয়ে যায় 1. এটি এড়ানোর এক উপায় হ'ল কার্যের সম্ভাব্যতাগুলি ব্যবহারের জন্য ব্যয় কার্যকারিতা পরিবর্তন করা; । ফাংশন হয়ে যায়p(yn=1|xn)
- 1N∑nynp(yn=0|xn)+(1−yn)p(yn=1|xn) ।
এই ফাংশনটি মসৃণ, এবং গ্রেডিয়েন্ট বংশোদ্ভূত পদ্ধতির সাথে আরও ভাল কাজ করবে। আপনি একটি 'সূক্ষ্ম' মডেল পাবেন। তবে এর অন্যান্য সমস্যাও রয়েছে; যদি আপনার কাছে অস্পষ্ট একটি নমুনা থাকে তবে ধরা যাক যে চেয়ে ভাল কিছু বলার মতো পর্যাপ্ত তথ্য আপনার কাছে নেই । তারপরে, এই ব্যয় ফাংশনে গ্রেডিয়েন্ট বংশদ্ভুত ব্যবহারটি এমন একটি মডেলকে নিয়ে যাবে যা এই সম্ভাবনাটি যতটা সম্ভব বাড়িয়ে তোলে এবং এইভাবে, সম্ভবত ওভারফিট।p(yn=1|xn)=0.5
এই ফাংশনের আর একটি সমস্যা হ'ল যদি যখন হয় তবে আপনি সঠিক বলে নিশ্চিত হন তবে আপনি ভুল। এই সমস্যাটি এড়াতে, আপনি সম্ভাবনার লগ নিতে পারেন, । হিসাবে এবং , নিম্নলিখিত ফাংশন সমস্যা নেই পূর্ববর্তী অনুচ্ছেদ বর্ণিত:p(yn=1|xn)=1yn=0logp(yn|xn)log(0)=∞log(1)=0
- 1N∑nynlogp(yn=0|xn)+(1−yn)logp(yn=1|xn) ।
এটি চিত্রিত করা উচিত যে একই জিনিসটিকে অনুকূল করতে , ত্রুটির শতাংশ, আলাদা সংজ্ঞা বিভিন্ন ফলাফল দিতে পারে যদি তারা গণনাগতভাবে বোঝা সহজ হয়।
এটা তোলে খরচ কাজকর্মের জন্য সম্ভব এবং পরিমাপ একই ধারণা , কিন্তু অনেক ভালো ফল করার জন্য আপনার পদ্ধতি হতে পারে ।ABAB
এখন আসুন দেখুন কীভাবে বিভিন্ন ব্যয়ের ক্রিয়াকলাপ বিভিন্ন ধারণাটি পরিমাপ করতে পারে। তথ্য পুনরুদ্ধারের প্রসঙ্গে, গুগল অনুসন্ধানের মতো (যদি আমরা র্যাঙ্কিং উপেক্ষা করি), আমরা ফিরে আসা ফলাফলগুলি চাই
মনে রাখবেন যে আপনার অ্যালগরিদম যদি সমস্ত কিছু ফিরিয়ে দেয় তবে এটি প্রতিটি প্রাসঙ্গিক ফলাফলটি ফিরিয়ে দেবে এবং এর ফলে উচ্চতর স্মরণ রয়েছে, তবে খুব কম নির্ভুলতা রয়েছে। অন্যদিকে, যদি এটি কেবলমাত্র একটি উপাদান ফেরত দেয় তবে এটি যে সর্বাধিক নির্দিষ্ট তা প্রাসঙ্গিক, এটির উচ্চ নির্ভুলতা থাকবে তবে কম স্মরণ।
এই জাতীয় অ্যালগরিদম বিচার করার জন্য, সাধারণ ব্যয়ের কাজটি হ'ল স্কোর (উইকিপিডিয়া) । সাধারণ ক্ষেত্রে দেখা যায় -score, যা স্পষ্টতা এবং রিকল সমান ওজন দেয়, কিন্তু সাধারণ ক্ষেত্রে এটা -score, এবং আপনি বদলাতে পারেন পেতেFF1Fββ
- উচ্চতর রিকাল, আপনি যদি ব্যবহার করেনβ>1
- উচ্চতর নির্ভুলতা, যদি আপনি ব্যবহার করেন ।β<1
এই জাতীয় দৃশ্যে, ব্যয় কার্যকারিতাটি বেছে নেওয়া আপনার অ্যালগরিদমকে কী ট্রেড অফ করতে হবে তা বেছে নেওয়া হচ্ছে ।
আরও একটি উদাহরণ যা প্রায়শই উত্থাপিত হয় তা হ'ল চিকিত্সা নির্ণয়ের ক্ষেত্রে, আপনি একটি ব্যয় কার্যকারিতা চয়ন করতে পারেন যা তার চেয়ে বেশি ভাল তার উপর নির্ভর করে আরও মিথ্যা নেতিবাচক বা মিথ্যা ধনাত্মককে শাস্তি দেয়:
- আরও স্বাস্থ্যবান মানুষ অসুস্থ হিসাবে শ্রেণীবদ্ধ করা হয়েছে (তবে তারপরে আমরা স্বাস্থ্যকর লোকদের চিকিত্সা করতে পারি, যা ব্যয়বহুল এবং তারা যদি অসুস্থ না হয় তবে তাদের ক্ষতি করতে পারে)
- আরও অসুস্থ ব্যক্তিদের স্বাস্থ্যকর হিসাবে শ্রেণীবদ্ধ করা হচ্ছে (তবে তারা চিকিত্সা ছাড়াই মারা যেতে পারে)
উপসংহারে, ব্যয়ের ক্রিয়াটি সংজ্ঞায়িত করা আপনার অ্যালগরিদমের লক্ষ্য নির্ধারণ করছে। অ্যালগরিদম সেখানে পৌঁছানোর উপায় নির্ধারণ করে।
পার্শ্ব দ্রষ্টব্য: কিছু ব্যয় কার্যক্রমে তাদের লক্ষ্যে পৌঁছানোর জন্য দুর্দান্ত অ্যালগরিদম উপায় রয়েছে। উদাহরণস্বরূপ, এসভিএম (উইকিপিডিয়া) এর দ্বৈত সমস্যা সমাধানের মাধ্যমে ন্যূনতম হিন্জ ক্ষতির (উইকিপিডিয়া) সর্বনিম্ন করার একটি দুর্দান্ত উপায়