কীভাবে আপনার মেশিন শেখার সমস্যা হতাশ?


207

একটি স্ট্যান্ডার্ড মেশিন-শেখার দৃশ্যের কল্পনা করুন:

আপনি একটি বৃহত্তর মাল্টিভিয়ারেট ডেটাসেটের মুখোমুখি হয়ে আছেন এবং এটি সম্পর্কে আপনার কাছে অস্পষ্ট ধারণা রয়েছে। আপনার যা করা দরকার তা হ'ল আপনার যা কিছু রয়েছে তার ভিত্তিতে কিছু পরিবর্তনশীল সম্পর্কে ভবিষ্যদ্বাণী করা। যথারীতি, আপনি ডেটা পরিষ্কার করেন, বর্ণনামূলক পরিসংখ্যানগুলি দেখুন, কিছু মডেল চালান, তাদের ক্রস-বৈধকরণ করুন ইত্যাদি several আপনি এই জাতীয় সমস্যাটিতে ঘন্টা, দিন বা সপ্তাহ কাটাতে পারেন ...

প্রশ্ন হ'ল: কখন থামব? আপনি কীভাবে জানবেন যে আপনার ডেটা আসলে হতাশ এবং সমস্ত অভিনব মডেলগুলি আপনাকে সমস্ত ক্ষেত্রে বা অন্য কোনও তুচ্ছ সমাধানের গড় ফলাফলের পূর্বাভাস দেওয়ার চেয়ে আরও ভাল কিছু করতে পারে না?

অবশ্যই এটি একটি পূর্বাভাসযোগ্যতা বিষয়, তবে যতদূর আমি জানি, বহুবিধ ডেটাতে কিছু চেষ্টা করার আগে তার পূর্বাভাসের মূল্যায়ন করা শক্ত। নাকি আমি ভুল করছি?

দাবি অস্বীকার: এই প্রশ্নটি এই দ্বারা অনুপ্রাণিত হয়েছিল আমি কখন মডেল সন্ধান বন্ধ করব? যে খুব মনোযোগ আকর্ষণ করে না। রেফারেন্সের জন্য এই জাতীয় প্রশ্নের উত্তর দেওয়া ভাল লাগবে।


1
এই সমস্যার ব্যবহারিক দিক থেকে (যেমন @ স্টিফানকোলাসা করেছেন) বা নিখুঁত শর্তে (কিছু উপপাদ্য যা একটি নির্দিষ্ট মডেল দেখায় কোনও সমস্যা শিখতে পারে যদি নির্দিষ্ট শর্তগুলি সন্তুষ্ট হয়) উত্তর দেওয়া যেতে পারে। তুমি কোনটি চাও?
সুপারবেস্ট

3
এটি কম্পিউটার বিজ্ঞানের ক্লাসিক থামানো সমস্যার মতো বলে মনে হচ্ছে ? আসুন ধরা যাক আপনার কাছে কিছুটা অ্যালগরিদম রয়েছে নির্বিচারে জটিলতা যা ইনপুট ডেটা অনুসন্ধান করে ডি প্রেডিকটিভ মডেলগুলি সন্ধান করে, এবং যখন ডেটার জন্য "ভাল" মডেল খুঁজে পায় তখন অ্যালগরিদম থামে। A এবং D- তে উল্লেখযোগ্য কাঠামো যুক্ত না করে, আমি দেখতে পাচ্ছি না যে আপনি কীভাবে এটিকে ইনপুট ডি প্রদত্তভাবে থামিয়ে দিতে পারবেন কিনা তা আপনি কীভাবে বলতে পারবেন যে শেষ পর্যন্ত A সফল হবে বা চিরতরে অনুসন্ধান চালিয়ে যাবে কিনা?
ম্যাথু গন

@ সর্বোপরি এটি উভয়ই হতে পারে। আপনার যদি কিছু যোগ করার থাকে তবে নির্দ্বিধায় উত্তর দিন। আমি কখনও উপপাদ্য সম্পর্কে শুনিনি যা বাস্তব জীবনের বহুমাত্রিক কোলাহলপূর্ণ ডেটা নিয়ে কাজ করার বিষয়ে কিছুই বলে না, তবে আপনি যদি এটি প্রয়োগ করেন এমন কোনও কিছু জানেন তবে আমি আপনার উত্তরটি পড়তে আগ্রহী।
টিম

3
@ স্টিফেনকোলাসার উত্তরের ভিত্তিতে, আপনি আরও একটি প্রশ্নটি স্পিন করে ফেলতে পারেন যে 'আমার কাজটি এতদূর নিয়ে বিষয় বিশেষজ্ঞদের কাছে নিয়ে যাওয়া উচিত এবং আমার ফলাফলগুলি (বা ফলাফলের অভাব) নিয়ে আলোচনা করা উচিত?'
রবার্ট ডি গ্রাফ

এছাড়াও সম্পর্কিত থ্রেড: stats.stackexchange.com/questions/28057/…
জান কুক্কা 19

উত্তর:


241

Forecastability

আপনি ঠিক বলেছেন যে এটি পূর্বাভাসের প্রশ্ন। সেখানে হয়েছে forecastability উপর কয়েকটি নিবন্ধ মধ্যে IIF এর বৃত্তিক ওরিয়েন্টেড জার্নাল দূরদর্শিতা । (সম্পূর্ণ প্রকাশ: আমি একটি সহযোগী সম্পাদক।)

সমস্যাটি হ'ল পূর্বাভাস "ইতিবাচক" ক্ষেত্রে নির্ধারণ করা ইতিমধ্যে শক্ত।

কয়েকটি উদাহরণ

ধরুন আপনার কাছে এর মতো টাইম সিরিজ রয়েছে তবে জার্মান কথা বলতে পারবেন না:

ডিম

আপনি কীভাবে এপ্রিল মাসে বড় শৃঙ্গকে মডেল করবেন এবং আপনি কীভাবে কোনও তথ্য পূর্বাভাসে অন্তর্ভুক্ত করবেন?

আপনি যদি না জানতেন যে এই সময়ের সিরিজটি একটি সুইস সুপার মার্কেট চেইনে ডিমের বিক্রি, যা পশ্চিমা ক্যালেন্ডার ইস্টারের ঠিক আগে পৌঁছেছে , আপনার কোনও সুযোগ থাকবে না। এছাড়াও, ইস্টার ক্যালেন্ডারে প্রায় ছয় সপ্তাহের মধ্যে চলে যাওয়ার সাথে সাথে, যে কোনও পূর্বাভাসে ইস্টারের নির্দিষ্ট তারিখটি অন্তর্ভুক্ত নয় (ধরে নিলে, বলুন যে এটি কেবল কিছু মৌসুমের শীর্ষে ছিল যা পরের বছরের নির্দিষ্ট সপ্তাহে পুনরুত্থিত হবে) সম্ভবত খুব দূরে হবে।

একইভাবে, ধরে নিন আপনার নীচের নীল রেখাটি রয়েছে এবং 2010-02-28 এ যা ঘটেছিল তা মডেল করতে চান 2010-02-27 এ "স্বাভাবিক" নিদর্শন থেকে আলাদা:

হকি খেলা

আবার, যখন কানাডিয়ানদের পূর্ণ একটি শহর পুরোপুরি টিভিতে অলিম্পিক আইস হকি ফাইনাল খেলা দেখবে তখন কী ঘটেছিল তা না জেনে, এখানে কী ঘটেছিল তা বোঝার কোনও সুযোগ আপনার নেই, এবং কখনই এরকম কিছু ঘটবে তা আপনি অনুমান করতে পারবেন না to

অবশেষে, এটি দেখুন:

Outlier

এটি নগদ এবং বহনের দোকানে দৈনিক বিক্রয়ের একটি সিরিজ । (ডানদিকে, আপনার একটি সাধারণ টেবিল রয়েছে: ২৮২ দিনের শূন্য বিক্রয় ছিল, ৪২ দিনের মধ্যে 1 টি বিক্রয় ছিল ... এবং একদিনে 500 টি বিক্রি হয়েছিল)) এটি কী জিনিস তা আমি জানি না।

আজ অবধি, আমি জানি না যে ৫০০ টি বিক্রয় নিয়ে একদিন কী ঘটেছিল My আমার সর্বোত্তম অনুমান যে কোনও গ্রাহক এই পণ্যটি যা ছিল তার একটি বৃহত পরিমাণ প্রি-অর্ডার করেছিলেন এবং এটি সংগ্রহ করেছিলেন। এখন, এটি না জেনে, এই নির্দিষ্ট দিনের জন্য কোনও পূর্বাভাস খুব দূরে থাকবে। বিপরীতভাবে, অনুমান করুন যে এটি ঠিক ইস্টারের আগে ঘটেছিল, এবং আমাদের কাছে একটি বোবা স্মার্ট অ্যালগরিদম রয়েছে যা বিশ্বাস করে এটি একটি ইস্টার প্রভাব হতে পারে (সম্ভবত এটি ডিম?) এবং পরের ইস্টারটির জন্য আনন্দের সাথে 500 ইউনিট পূর্বাভাস করেছে। ওহ, পারে যে ভুল হয়ে যেতে পারে।

সারাংশ

সব ক্ষেত্রেই আমরা দেখতে পাই যে পূর্বাভাসটি কেবলমাত্র তখনই বুঝতে পারে যখন আমাদের ডেটাগুলিকে প্রভাবিত করে এমন সম্ভাব্য কারণগুলির সম্পর্কে যথেষ্ট গভীর ধারণা হয়। সমস্যাটি হ'ল আমরা যদি এই কারণগুলি না জানি তবে আমরা জানি না যে আমরা সেগুলি না জানি। অনুযায়ী ডোনাল্ড রামসফেল্ড :

[টি] এখানে পরিচিত পরিচিত; আমরা জানি কিছু আছে. আমরা জানি যে অজানা রয়েছে; এর অর্থ হল আমরা জানি এমন কিছু জিনিস রয়েছে যা আমরা জানি না। তবে অজানা অজানাও রয়েছে - আমরা যা জানি না আমরা তা জানি না।

যদি হকি সম্পর্কে ইস্টার বা কানাডিয়ানদের ভবিষ্যদ্বাণী আমাদের কাছে অজানা, তবে আমরা আটকে রয়েছি - এবং আমাদের সামনে এগিয়ে যাওয়ার কোনও উপায়ও নেই, কারণ আমাদের কী প্রশ্ন জিজ্ঞাসা করা উচিত তা আমরা জানি না।

এগুলিতে হ্যান্ডেল পাওয়ার একমাত্র উপায় হ'ল ডোমেন জ্ঞান সংগ্রহ করা।

উপসংহার

আমি এ থেকে তিনটি সিদ্ধান্ত নিয়েছি:

  1. আপনার মডেলিং এবং ভবিষ্যদ্বাণীতে আপনাকে সর্বদা ডোমেন জ্ঞান অন্তর্ভুক্ত করতে হবে।
  2. এমনকি ডোমেন জ্ঞান থাকা সত্ত্বেও, আপনার পূর্বাভাস এবং ব্যবহারকারীদের কাছে গ্রহণযোগ্য হওয়ার পূর্বাভাসের জন্য পর্যাপ্ত তথ্য পাওয়ার নিশ্চয়তা নেই। উপরে যে আউটলেট দেখুন।
  3. যদি "আপনার ফলাফলগুলি দুর্বিষহ হয়" তবে আপনি যতটা অর্জন করতে পারেন তার চেয়ে বেশি আশা করছেন। আপনি যদি ন্যায্য মুদ্রা টসের পূর্বাভাস দিচ্ছেন তবে 50% নির্ভুলতার বেশি পাওয়ার কোনও উপায় নেই। বাহ্যিক পূর্বাভাস নির্ভুলতার মানদণ্ডকে বিশ্বাস করবেন না।

তলদেশের সরুরেখা

এখানে আমি কীভাবে বিল্ডিং মডেলগুলি প্রস্তাব করব - এবং কখন থামবে তা লক্ষ্য করুন:

  1. আপনার যদি ইতিমধ্যে এটি না থাকে তবে ডোমেন জ্ঞানের সাথে কারও সাথে কথা বলুন।
  2. পদক্ষেপ 1 এর উপর ভিত্তি করে সম্ভাব্য ইন্টারঅ্যাকশন সহ আপনি যে ডেটা পূর্বাভাস করতে চান তার প্রধান চালকদের সনাক্ত করুন।
  3. ক্রম-বৈধতা বা একটি হোল্ডআউট নমুনা ব্যবহার করে মডেলগুলি নির্ধারণ করুন step পদক্ষেপ অনুযায়ী শক্তি ক্রম হ্রাস ক্রমে ড্রাইভারগুলি সহ পুনরাবৃত্তভাবে মডেলগুলি তৈরি করুন।
  4. যদি আপনার পূর্বাভাসের নির্ভুলতা আরও কিছু না বাড়ায় তবে হয় পদক্ষেপ 1 এ ফিরে যান (উদাহরণস্বরূপ, আপনি ব্যাখ্যা করতে পারবেন না এমন নির্লজ্জ ভুল-ভবিষ্যদ্বাণী সনাক্ত করে এবং ডোমেন বিশেষজ্ঞের সাথে এগুলি নিয়ে আলোচনা করে), বা স্বীকার করুন যে আপনি আপনার শেষের দিকে পৌঁছেছেন মডেলদের ক্ষমতা। আপনার বিশ্লেষণকে আগে থেকে সময়-বক্সিং করা সহায়তা করে।

নোট করুন যে আমি যদি আপনার আসল মডেল প্লেটؤসটি ব্যবহার করি তবে বিভিন্ন শ্রেণির মডেলগুলি চেষ্টা করার পরামর্শ দিচ্ছি না। সাধারণত, আপনি যদি যুক্তিসঙ্গত মডেলটি দিয়ে শুরু করেন, তবে আরও কিছু পরিশীলিত জিনিস ব্যবহারের ফলে শক্তিশালী উপকার পাওয়া যাবে না এবং কেবল "পরীক্ষার সেটটিতে অত্যধিক উপযোগী" হতে পারে। আমি এটি প্রায়শই দেখেছি, এবং অন্যান্য লোকেরা তাতে একমত হয়


10
আমি সম্পূর্ণরূপে একমত যে দুর্দান্ত উত্তর জন্য +1। সমস্যাটি বিস্তৃত হওয়ায় এখনও আমি অন্যান্য উত্তরের প্রত্যাশার পরে এটি (এখনও) গ্রহণ করছি না।
টিম

1
অবশ্যই। আমি এ সম্পর্কেও অন্য কারও দৃষ্টিভঙ্গি দেখতে চাই!
স্টিফান কোলাসা

9
If you are forecasting a fair coin toss, then there is no way to get above 50% accuracy.। আপনি সেখানে সবকিছু বলেছিলেন।
ওয়ালফ্রাট

3
ডোমেন জ্ঞান ব্যবহার করে আপনি প্রথম দুটি ক্ষেত্রে নতুন বৈশিষ্ট্য যুক্ত করতে পারেন (উদাহরণস্বরূপ, ইস্টার এবং টিভি দেখার সংখ্যা পর্যন্ত সময়, যদিও পরবর্তীটির নিজস্ব পূর্বাভাসের প্রয়োজন) আরও ভাল ফলাফল পেতে। উভয় ক্ষেত্রেই পরিস্থিতি হতাশ। সত্যিই আকর্ষণীয় অংশটি হল ন্যায্য মুদ্রার একটি সেট সেট থেকে ডোমেন জ্ঞানটি কীভাবে বলা যায় to
করোলিস জুডেলė

4
@ কারোলিস জুডেলė: এটিই আমার বক্তব্য। আমাদের পরিস্থিতি কখন হতাশ, আমরা তাও জানতে পারি না, যদি না আমরা কোনও বিশেষজ্ঞের সাথে কথা বলি ... এবং তারপরে, কখনও কখনও বিশেষজ্ঞ আমাদের উভয়কেই সহায়তা করতে পারে না, এবং বিশেষজ্ঞদের কাছে "অজানা" রয়েছে, যা সম্ভবত অন্য কেউ হতে পারে জানি।
স্টিফান কোলাসা

57

স্টিফান কোলাসার উত্তরটি দুর্দান্ত, তবে আমি এটি যুক্ত করতে চাই যে প্রায়শই একটি অর্থনৈতিক স্টপ শর্তও রয়েছে:

  1. আপনি যখন কোনও গ্রাহকের জন্য এমএল করছেন এবং মজাদার জন্য নয়, তখন গ্রাহক কী পরিমাণ অর্থ ব্যয় করতে আগ্রহী তা একবার দেখে নেওয়া উচিত। যদি তিনি আপনার ফার্মটি 5000 ডলার প্রদান করে এবং আপনি একটি মডেল সন্ধানে এক মাস ব্যয় করেছেন, আপনি অর্থ হ্রাস করবেন। তুচ্ছ মনে হচ্ছে, তবে আমি দেখেছি "একটি সমাধান অবশ্যই হবে !!!!" - এমন চিন্তাভাবনা যা বিপুল ব্যয়কে ছাড়িয়ে গেছে। সুতরাং অর্থ বের হয়ে গেলে থামুন এবং আপনার গ্রাহকের কাছে সমস্যাটি জানান।
  2. আপনি যদি কিছু কাজ করে থাকেন তবে আপনার প্রায়শই বর্তমান ডেটাসেট দিয়ে কী সম্ভব তা অনুভূতি হয়। মডেলটি দিয়ে আপনি যে পরিমাণ অর্থ উপার্জন করতে পারবেন তা প্রয়োগ করার চেষ্টা করুন, যদি পরিমাণটি তুচ্ছ বা নেট নেতিবাচক হয় (উদাহরণস্বরূপ ডেটা সংগ্রহ করার সময়, কোনও সমাধান বিকাশ করা ইত্যাদি) আপনার থামানো উচিত।

উদাহরণস্বরূপ: আমাদের কাছে এমন একজন গ্রাহক ছিলেন যিনি তার মেশিনগুলি ভেঙে যাওয়ার আগে ভবিষ্যদ্বাণী করতে চেয়েছিলেন, আমরা বিদ্যমান ডেটা বিশ্লেষণ করেছি এবং মূলত শব্দ পেয়েছি। আমরা প্রক্রিয়াটি খনন করে দেখলাম যে সবচেয়ে গুরুত্বপূর্ণ ডেটা রেকর্ড করা হয়নি এবং সংগ্রহ করা খুব কঠিন ছিল। তবে সেই ডেটা ছাড়াই আমাদের মডেলটি এতটাই দুর্বল ছিল যে কেউ এটি ব্যবহার করবে না এবং এটি ক্যানড।

আমি যখন বাণিজ্যিক পণ্য নিয়ে কাজ করার সময় অর্থনীতির উপর দৃষ্টি নিবদ্ধ করেছিলাম তখনও এই নিয়মটি একাডেমিয়া বা মজাদার প্রকল্পগুলির জন্যও প্রযোজ্য - যদিও এই জাতীয় পরিস্থিতিতে অর্থের কোনও উদ্বেগ কম থাকে, সময় এখনও একটি বিরল পণ্য। E. g। শিক্ষাব্যবস্থায় আপনার কাজ করা বন্ধ করা উচিত যখন আপনি কোনও বাস্তব ফলাফল না পান এবং আপনার কাছে আরও কিছু আশানুরূপ প্রকল্প রয়েছে projects তবে সেই প্রকল্পটি ফেলে দেবেন না - দয়া করে নাল প্রকাশ করুন বা "আরও / অন্যান্য ডেটা প্রয়োজন" ফলাফলগুলিও গুরুত্বপূর্ণ, সেগুলিও গুরুত্বপূর্ণ!


1
+1 অবশ্যই একটি দুর্দান্ত পয়েন্ট! আমি অনুমান করি যে এই প্রশ্নের সমস্ত উত্তর "সুস্পষ্ট" বলে মনে হতে পারে তবে আমি রেফারেন্সের জন্য জড়ো হওয়া সমস্ত "সুস্পষ্ট" জিনিস কোথাও দেখিনি।
টিম

3
বিটিডব্লিউ, এই স্টপিং রুলটি অ-ব্যবসায়িক ক্ষেত্রেও প্রযোজ্য: উদাহরণস্বরূপ, আপনি যদি কিছু গবেষণা করেন তবে আমাদের ফলাফলগুলির কিছু বিমূর্ত মূল্য রয়েছে এবং "আশাহীন" বিশ্লেষণ অব্যাহত রাখা কেবলমাত্র আপনার বিশ্লেষণের মানটি ছাড়িয়ে যাওয়ার পরেও কার্যকর হবে is পরিবর্তে করতে পারে। সুতরাং বাস্তবে এই সিদ্ধান্ত তাত্ত্বিক যুক্তি আরও সাধারণ করা যেতে পারে।
টিম

2
আমি মনে করি "কেউই ist ব্যবহার করত না এবং ক্যানড ছিল" সম্ভবত "" কেউ এটি ব্যবহার করত না এবং এটি ক্যানড করা হত "- এ পরিবর্তন করা উচিত - এটি কি আপনার উদ্দেশ্যযুক্ত অর্থ?
সিলভারফিশ 13

2
ধন্যবাদ। আমি বলব যে এটি কেবল সময়ের কথা নয়, আপনি এই সময়টি অন্যরকমভাবে বিনিয়োগ করতে পারেন । পরিবর্তে আপনি নিজের জীবন বাঁচানোর জন্য ওষুধ নিয়ে গবেষণা প্রকল্পে কাজ করতে পারেন তবে ফলাফলগুলি থেকে জনসাধারণও উপকৃত হবেন
টিম

2
@ খ্রিস্টিয়ানসৌয়ার ইঞ্জিনিয়ার হিসাবে আমার অভিজ্ঞতায় সেন্সর (সিএফ গেজস) এবং একটি কার্যকর উদ্দেশ্যগুলির মধ্যে একটি অমিলের সমস্যা সম্ভবত ট্রানজিস্টারের উদ্ভাবনের পূর্বাভাস দেয়।
রবার্ট ডি গ্রাফ

9

আরও একটি উপায় আছে। নিজেকে জিজ্ঞাসা করুন -

  1. কে বা কোনটি এই নির্দিষ্ট পরিবর্তকের সর্বোত্তম সম্ভাব্য পূর্বাভাস তৈরি করে? "
  2. আমার মেশিন লার্নিং অ্যালগরিদম সেরা পূর্বাভাসের চেয়ে ভাল বা খারাপ ফলাফল তৈরি করে?

সুতরাং, উদাহরণস্বরূপ, যদি আপনার বিভিন্ন ফুটবল দলের সাথে প্রচুর পরিমাণে ভেরিয়েবল যুক্ত থাকে এবং আপনি কে জিতবেন সে সম্পর্কে পূর্বাভাস দেওয়ার চেষ্টা করছিলেন, তবে আপনি আপনার মেশিন লার্নিংয়ের ফলাফলের সাথে তুলনা করার জন্য বুকমেকার প্রতিক্রিয়াগুলি বা ভিড় উত্সাহিত কিছু প্রকারের দিকে তাকিয়ে থাকতে পারেন machine অ্যালগরিদম। আপনি যদি ভাল হন তবে আপনি সীমাতে থাকতে পারেন, আরও খারাপ হলে স্পষ্টতই উন্নতির সুযোগ রয়েছে।

আপনার উন্নতি করার ক্ষমতা দুটি বিষয়ের উপর নির্ভর করে (বিস্তৃতভাবে):

  1. আপনি কি এই বিশেষ কাজে সেরা বিশেষজ্ঞ হিসাবে একই ডেটা ব্যবহার করছেন?
  2. আপনি কি এই বিশেষ কাজে সেরা বিশেষজ্ঞ হিসাবে কার্যকরভাবে ডেটা ব্যবহার করছেন?

এটি ঠিক আমি কী করতে চাইছি তার উপর নির্ভর করে, তবে মডেল তৈরি করার সময় আমি যেদিকে যাচ্ছি সেদিকে চালিত করার জন্য এই প্রশ্নের উত্তরগুলি ব্যবহার করার ঝোঁক রয়েছে, বিশেষত আমি ব্যবহার করতে পারি এমন আরও ডেটা চেষ্টা করে বা মনোনিবেশ করার জন্য কিনা মডেল পরিমার্জন করার চেষ্টা করছি।

আমি স্টিফানের সাথে একমত যে সাধারণত এটি করার সর্বোত্তম উপায় হল একটি ডোমেন বিশেষজ্ঞকে জিজ্ঞাসা করা।


1
প্রকৃতপক্ষে আপনার উত্তর @ স্টেফান কোলাসার উত্তরের সাথে বিরোধিতা করে যেখানে তিনি সাহিত্যের উল্লেখ করেছেন যে প্রস্তাবিত মানদণ্ডগুলি বরং বিভ্রান্তিকর।
টিম

1
@ টিম: সম্পূর্ণ প্রকাশ - সেই লিঙ্কটি আমি নিজেই লিখেছি এমন মানদণ্ডে একটি নিবন্ধে গিয়েছিল। তবুও, আমি আমার সিদ্ধান্তে দাঁড়াচ্ছি: সমস্ত চাহিদা পূর্বাভাসের নির্ভুলতার মানদণ্ডগুলি আমি খুব সম্ভবত আপেলের সাথে কমলার সাথে তুলনা করেছি। আমি এইভাবে বাহ্যিক মানদণ্ডের দিকে চেয়ে কিছুটা সংশয়ী। উপরন্তু, আমি এই উত্তর কিছুটা প্রশ্ন begs মনে করি। আপনার এমএল অ্যালগরিদম একবার "সর্বাধিক পরিচিত" -এর উন্নতি হয়, আপনি কীভাবে জানবেন যে আপনি আরও উন্নতি করতে পারেন, বা আমরা হতাশার মালভূমি অর্জন করেছি কিনা?
স্টিফান কোলাসা

1
আমার সাম্প্রতিক ব্যবহারের ক্ষেত্রেটি ভিন্ন ছিল rather ইন্টারনেটে তাদের পোস্টিং থেকে কারা নিজেকে মেরে ফেলার ঝুঁকি নিয়েছিল আমি ভবিষ্যদ্বাণী করার চেষ্টা করছিলাম। বিভিন্ন মানসিক পরীক্ষাগুলি রয়েছে যেগুলি পিএইচকিউ 9 এর মতো হতাশার তীব্রতা পরিমাপ করতে ব্যবহার করতে পারে। এটির বহুল ব্যবহৃত চিকিত্সা পরীক্ষা হিসাবে এর বৈধতা এবং নির্ভরযোগ্যতা যেমন "একটি সংক্ষিপ্ত হতাশার তীব্রতা পরিমাপের পিএইচকিউ -9 বৈধতা" হিসাবে যথেষ্ট কাজ রয়েছে। আমি খুঁজে পেয়েছি যে নির্ভরযোগ্যতা এবং অন্যান্য কাগজপত্রের অন্যান্য পদক্ষেপগুলি মেশিন লার্নিং থেকে সম্ভাব্য ফলাফলগুলি অর্জন করতে পারে সেই হিসাবে একটি ভাল সূচনা পয়েন্ট point
গ্যাভিন পটার

1
আপনি অবশ্যই সঠিক, "সর্বাধিক পরিচিত" এর উন্নতি সম্পর্কে, আরও ভাল মডেলের সন্ধান চালিয়ে যাবেন কিনা তা বলার উপায় নেই। তবে আমার অভিজ্ঞতায় এটি বাস্তব দুর্লভ পরিস্থিতিতে দেখা যায়। আমার বেশিরভাগ কাজটি মনে হয় মেশিন লার্নিংয়ের মাধ্যমে ক্ষেত্রের সেরা বিশেষজ্ঞের দিকে উন্নতি করার চেষ্টা না করে দক্ষতার রায়গুলি প্রয়োগ করার চেষ্টা করা।
গ্যাভিন পটার
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.