দক্ষতা মেশিন শিখতে পাওয়া?


71

দেখে মনে হচ্ছে ডেটা মাইনিং এবং মেশিন লার্নিং এত জনপ্রিয় হয়ে উঠেছে যে এখন প্রায় প্রতিটি সিএস শিক্ষার্থী শ্রেণিবদ্ধ, ক্লাস্টারিং, স্ট্যাটিস্টিকাল এনএলপি ... ইত্যাদি সম্পর্কে জানে তাই তাই মনে হয় যে ডেটা মাইনারদের সন্ধান করা আজকাল কোনও কঠিন কাজ নয়।

আমার প্রশ্ন: একটি ডেটা মাইনার কী কী দক্ষতা শিখতে পারে যা তাকে অন্যের চেয়ে আলাদা করে তোলে? তাকে খুব সহজে খুঁজে পাওয়া যায় না এমন কাউকে তার মতো মানুষ বানানো।


6
এটি অন্যরকম প্রশ্নের জবাব দেওয়ার সময়, আমার পুরানো উত্তরের কয়েকটি পয়েন্ট এখানে বয়ে যেতে পারে। আসাদ নীচে তার খুব সুন্দর উত্তরে অনুরূপ কিছু মন্তব্য করেছে।
কার্ডিনাল

উত্তর:


62

আমি একাধিকবার দেখেছি বিকাশকারীরা এমএল কৌশলগুলি ব্যবহার করে। এটি সাধারণ প্যাটার্ন:

  1. অভিনব নাম সহ গ্রন্থাগার ডাউনলোড করুন;
  2. এটি কীভাবে ব্যবহার করতে হয় তা পড়তে 10 মিনিট ব্যয় করুন (কোনও পরিসংখ্যান, গণিত, ইত্যাদি);
  3. এটি ডেটা দিয়ে ফিড করুন (কোনও প্রাকপ্রসেসিং নেই);
  4. কর্মক্ষমতা পরিমাপ করুন (উদাহরণস্বরূপ ক্লাসগুলি সম্পূর্ণ ভারসাম্যহীন হলেও যথাযথতা) এবং তার 99% নির্ভুলতার সাথে এটি কতটা দুর্দান্ত তা প্রত্যেককে বলুন;
  5. মহাকাব্যিক ব্যর্থ ফলাফলের সাথে উত্পাদন স্থাপন;
  6. এমন কাউকে সন্ধান করুন যা বুঝতে সাহায্য করে যে তাদেরকে কীভাবে সাহায্য করতে চলেছে কারণ নির্দেশিকা ম্যানুয়ালটি মোটেই অর্থ দেয় না।

এর সহজ উত্তরটি হ'ল (বেশিরভাগ) সফ্টওয়্যার ইঞ্জিনিয়ারগণ পরিসংখ্যান এবং গণিতে খুব দুর্বল। এই যে কেউ তাদের সাথে প্রতিযোগিতা করতে চান সুবিধা হয়। অবশ্যই পরিসংখ্যান লোকেরা তাদের কোড কোড লেখার প্রয়োজন হলে তাদের স্বাচ্ছন্দ্যের অঞ্চল থেকে বাইরে। যে ধরনের ভূমিকা সত্যিই বিরল হয়ে ওঠে তা হ'ল ডেটা সায়েন্টিস্ট। এটি এমন কেউ যিনি অ্যাক্সেসের জন্য কোড লিখতে এবং প্রচুর পরিমাণে ডেটা নিয়ে খেলতে এবং সেগুলির মধ্যে মানটি খুঁজে পেতে পারেন।


14
এলএল এ "তার 99% নির্ভুলতার সাথে সবাইকে বলুন যে এটি কতটা দুর্দান্ত"
জ্যাক টোয়াইন

2
+1 আমি সবকিছুর সাথে একমত। "[...] ডেটা সায়েন্টিস্ট It এটি এমন কেউ যিনি অ্যাক্সেসের জন্য কোড লিখতে পারেন এবং প্রচুর পরিমাণে ডেটা দিয়ে খেলতে পারেন এবং সেগুলির মধ্যে মান খুঁজে পেতে পারেন" " আমার কাছে যা পরামর্শ দেয় এটি প্রাকৃতিকভাবে বিরল থাকা উচিত, যেহেতু জটিল পরিসংখ্যান এবং ভিত্তিগত সমস্যাগুলি মোকাবেলা করার পাশাপাশি কোনও কিছুকে একটি উত্পাদন কোডে রূপান্তর করা বেশিরভাগ প্রাণীর পক্ষে অসম্ভব বলে মনে হয়। এটিতে কেন আমাদের কার্ডিওভাসকুলার সার্জন, অ্যানাস্থেসিওলজিস্ট, নিউরোলজিস্ট, নার্স, হাসপাতালের প্রশাসক ইত্যাদি রয়েছে বা সিভিল, অ্যারোনটিক, মাইনিং, কেমিক্যাল, মেকানিক্যাল ইঞ্জিনিয়ারস ইত্যাদি রয়েছে তাও ব্যাখ্যা করে
থমাস স্পিডেল

2
আমার কাছে, এটি সত্যিকার অর্থে কারও স্ট্যান্ড আউট এমএল প্রার্থী হওয়া দরকার - এর একটি এমএল বাশ বেশি of আপনার মতো শব্দগুলি এমন কাউকে বর্ণনা করছেন যা প্রশ্নটি কী তা সম্পর্কে নিশ্চিত হওয়ার আগেই "উত্তর" পাওয়ার দিকে খুব বেশি মনোযোগী। মূলত, আপনার "টিপিক্যাল এমএল" ব্যক্তি হ'ল এমন ব্যক্তি যার পরিকল্পনা করার দক্ষতা নেই, এবং কেউ যারা লাঙ্গল লাফানোর আগে "ক্লায়েন্ট" এর সাথে কী করার পরিকল্পনা নিয়ে আলোচনা করেন না এবং "উত্তর" দিয়ে ফিরে আসেন। এটি এমন কিছু নয় যা ভাল গণিত / পরিসংখ্যান দ্বারা সহায়তা করে - এটি এমন একটি বিষয় যা ভাল যোগাযোগের দক্ষতা প্রয়োজন।
সম্ভাব্যতাবিরোধী

61

এটা কি সম্পর্কে

কেবল কৌশল সম্পর্কে জানার পক্ষে চিড়িয়াখানার প্রাণী জানার অনুরূপ - আপনি তাদের নাম রাখতে পারেন, তাদের বৈশিষ্ট্যগুলি বর্ণনা করতে পারেন, সম্ভবত বন্যগুলিতে তাদের সনাক্ত করতে পারেন।

এগুলি কখন ব্যবহার করতে হবে তা বোঝা, সমস্যাগুলি এড়ানোর সময় কোনও প্রয়োগ ক্ষেত্রের মধ্যে কার্যকরী গাণিতিক মডেলগুলি তৈরি করা, তৈরি করা, পরীক্ষা করা এবং মোতায়েন করা --- এগুলি আমার মতে দক্ষতা যা আলাদা করে দেয়।

বিজ্ঞানের উপর জোর দেওয়া উচিত , ব্যবসা, শিল্প এবং বাণিজ্যিক সমস্যাগুলির জন্য একটি নিয়মতান্ত্রিক, বৈজ্ঞানিক পদ্ধতির প্রয়োগ করা। তবে এর জন্য ডেটা মাইনিং এবং মেশিন লার্নিংয়ের চেয়ে আরও বৃহত্তর দক্ষতা প্রয়োজন, কারণ রবিন ব্লুর "এ ডেটা সায়েন্স রেন্ট" তে প্ররোচিতভাবে যুক্তি দিয়েছিলেন ।

সুতরাং কেউ কি করতে পারে?

অ্যাপ্লিকেশন অঞ্চল : আপনার আগ্রহের নিকটবর্তী বা আপনার নিয়োগকর্তার কাছাকাছি থাকা বিভিন্ন অ্যাপ্লিকেশন অঞ্চলগুলি সম্পর্কে শিখুন। মডেলটি কীভাবে তৈরি হয়েছিল এবং সেই অঞ্চলে মান যুক্ত করতে কীভাবে এটি ব্যবহৃত হয়েছিল তা বোঝার চেয়ে অঞ্চলটি প্রায়শই কম গুরুত্বপূর্ণ। একটি ক্ষেত্রে সফল যারা মডেলগুলি প্রায়শই একই জায়গায় কাজ করে এমন বিভিন্ন অঞ্চলে প্রতিস্থাপন এবং প্রয়োগ করা যেতে পারে।

প্রতিযোগিতা : ডেটা মাইনিং প্রতিযোগিতার সাইট কাগল চেষ্টা করুন , অন্যের একটি দলে বেশি পছন্দ করুন joining (ক্যাগল: ভবিষ্যদ্বাণীপূর্ণ মডেলিং প্রতিযোগিতার একটি প্ল্যাটফর্ম। সংস্থাগুলি, সরকার এবং গবেষকরা ডেটাসেট এবং সমস্যা উপস্থাপন করে এবং বিশ্বের সেরা ডেটা বিজ্ঞানীরা সেরা সমাধান উত্পাদন করতে প্রতিযোগিতা করে))

মৌলিক বিষয়গুলি : চারটি রয়েছে: (1) পরিসংখ্যানগুলিতে শক্ত ভিত্তি, (2) যুক্তিসঙ্গতভাবে ভাল প্রোগ্রামিং দক্ষতা, (3) কীভাবে জটিল ডেটা কোয়েরিগুলি গঠন করা যায়, (4) বিল্ডিং ডেটা মডেলগুলি। যদি কোনও দুর্বল হয়, তবে এটি শুরু করার জন্য গুরুত্বপূর্ণ জায়গা।


এই বিষয়ে কয়েকটি উদ্ধৃতি :

। Something আমি খুব শীঘ্রই কোনও কিছুর নাম জানা এবং কিছু জানার মধ্যে পার্থক্যটি শিখেছি। আপনি বিশ্বের সমস্ত ভাষায় একটি পাখির নাম জানতে পারবেন, তবে শেষ হয়ে গেলে আপনি পাখি সম্পর্কে যা কিছু জানবেন না ... তাই পাখিটি দেখুন এবং দেখুন এটি কী করছে - এটাই কী গণনা করা যায়। '' - রিচার্ড ফেনম্যান, "দ্য মেকিং অব এ সায়েন্টিস্ট", পি 14 আপনি কী যত্ন নেন অন্য লোকেরা কী ভাবছেন, 1988

মনে রেখ:

Business these এই ব্যবসায়িক বিজ্ঞান [ডেটা সায়েন্স] প্রকল্পগুলি সম্পাদনের জন্য প্রয়োজনীয় দক্ষতার সংমিশ্রণ খুব কমই একজন ব্যক্তির মধ্যে থাকে। কেউ (আই) ব্যবসায় কী করে, (ii) কীভাবে পরিসংখ্যানগুলি ব্যবহার করতে হয়, এবং (iii) কীভাবে ডেটা এবং ডেটা প্রবাহ পরিচালনা করতে পারে তার ত্রিগল ক্ষেত্রগুলিতে কেউ কেউ প্রকৃতপক্ষে বিস্তৃত জ্ঞান অর্জন করতে পারত যদি তা হয় তবে তিনি বা সে অবশ্যই প্রদত্ত খাতে ব্যবসায়িক বিজ্ঞানী (ওরফে, "ডেটা সায়েন্টিস্ট") দাবি করতে পারে। কিন্তু এই ধরনের ব্যক্তিদের মুরগি দাঁত যেমন প্রায় হিসাবে বিরল '' -। রবিন Bloor, একটি ডাটা বিজ্ঞান গলাবাজি , অগাস্ট 2013, বিশ্লেষণ ইনসাইড

এবং পরিশেষে:

`Map মানচিত্রটি অঞ্চল নয় '' '- আলফ্রেড কোরজিবস্কি, 1933, বিজ্ঞান ও স্যানিটি।

সর্বাধিক বাস্তব, প্রয়োগ করা সমস্যাগুলি কেবল `` মানচিত্র '' থেকে অ্যাক্সেসযোগ্য নয়। গাণিতিক মডেলিংয়ের সাথে ব্যবহারিক জিনিসগুলি করার জন্য অবশ্যই বিশদ, সূক্ষ্মতা এবং ব্যতিক্রমগুলি সহ গ্রুবি পেতে আগ্রহী। এই অঞ্চলটি প্রথম হাতে জানার জন্য কোনও কিছুই বিকল্প হতে পারে না।



6
+1 টি। বাক্সের বাইরে সমাধানগুলি আপনার প্রতিষ্ঠানের নির্দিষ্ট ব্যবসায়িক সমস্যার জন্য খুব কমই কাজ করে। আপনাকে টেইলার্স এবং উন্নত করা দরকার এবং এর জন্য আপনার বুঝতে হবে হুডের নীচে কী রয়েছে।
ঝুবার্ব

4
@ ঝুবার্ব - আমি মনে করি এটি কেবলমাত্র আংশিক সত্য। "বাক্সের বাইরে" সমাধানগুলি দুর্দান্ত প্রভাব হিসাবে ব্যবহৃত হতে পারে, কেবল সর্বদা নয়, এবং সাধারণত কোনও কাজ শুরু থেকে শেষ করার জন্য নয় not কৌশলটি জেনে যাচ্ছে আপনি কখন "বাক্সের সমাধানগুলি ছাড়াই" ব্যবহার করে দূরে সরে যেতে পারবেন এবং কখন আরও উপযুক্ত পদ্ধতির প্রয়োজন হবে।
সম্ভাব্যতাবিরোধী

41

আমি যা বলেছি তার সাথে একমত। আমার কাছে যা দাঁড়ায় তা হ'ল:

  1. কয়েকজন মেশিন লার্নিং "বিশেষজ্ঞ" কীভাবে তারা এমএল প্রয়োগ করতে চান সেই বিষয়ে আগ্রহী
  2. ভবিষ্যদ্বাণীমূলক নির্ভুলতা এবং সঠিক স্কোরিং বিধিগুলি কতটা সত্যই বুঝতে পারে
  3. বৈধতার নীতিগুলি কত কম বোঝে
  4. একটি কালো বক্স বনাম একটি traditionalতিহ্যগত রিগ্রেশন মডেল কখন ব্যবহার করবেন তা কতজন জানেন know
  5. "বিশেষজ্ঞরা" কেউই কীভাবে বয়েস সর্বোত্তম সিদ্ধান্ত বা ক্ষতি / উপযোগ / ব্যয় কার্যকারিতা অধ্যয়ন করেছেন বলে মনে হয় না [বোঝার এই অভাব প্রায়শই পূর্বাভাসিত ঝুঁকির পরিবর্তে শ্রেণিবিন্যাস ব্যবহার করার সময় প্রদর্শিত হয়]

3
আপনি 4 এ বিস্তারিত ব্যাখ্যা করতে চান? আপনি কী বলতে চাইছেন তা আমি পুরোপুরি বুঝতে পারছি না

17
আমি ভাবতাম যে আইটেমটি বোঝা সবচেয়ে সহজ ছিল। এখানে একটি উদাহরণ রয়েছে: অধ্যয়নের একটি নির্দিষ্ট ক্ষেত্রে মনে করুন যে আমাদের পূর্বের অভিজ্ঞতা ছিল যে বেশিরভাগ ভেরিয়েবলগুলি additively কাজ করে। একটি অ্যাডিটিভ রিগ্রেশন মডেল ফিটিং করা যা পূর্বাভাসকারীকে লাইনারিভাবে পরিচালনা করতে অনুমান করে না (উদাহরণস্বরূপ, রিগ্রেশন স্প্লাইন ব্যবহার করে) একটি ব্যাখ্যাযোগ্য এবং দরকারী পরিসংখ্যানের মডেল সরবরাহ করবে। অন্যদিকে এসএমএম বা এলোমেলো বন ব্যবহার করা খুব তাড়াতাড়ি ব্যাখ্যা করা শক্ত হবে, কোনও বিভাজনীয় প্রভাব ফেলবে না এবং ননলাইনারের সাথে যুক্ত মডেলটির চেয়ে ভাল পূর্বাভাস দেবে না।
ফ্রাঙ্ক হ্যারেল

7
হ্যাঁ, বিষয়টির অগভীরতার পক্ষে। এমনকি এমএল ওয়ার্ল্ডেও নয়, আমি প্রায়শই এই প্রবণতাটি দেখি যে কোনও ম্যাজিক বাক্সে কাঁচা ডেটা বেলতে চান এবং দুর্দান্ত অন্তর্দৃষ্টি পপ আউট করতে চান। এই লোকেরা যা খুঁজছেন তা হ'ল একটি কৃত্রিম মস্তিষ্ক।
ডেরেনডাব্লু

3
বিশেষ করে আইটেম 1 এর জন্য +1। ডোমেনটির প্রতি আগ্রহের অভাবের প্রমাণ হ'ল ডোমেন জ্ঞান প্রয়োগের জন্য ব্ল্যাক বক্সটি কীভাবে 'খুলুন' এবং কীভাবে পরিবর্তন করা যায় তা জেনে রাখা দরকার। ব্ল্যাক বক্সের মাধ্যমে, আমি এন্ট্রি লেভেলের বেশিরভাগ ক্ষেত্রে এমএল এমনকি বেসিক স্ট্যাটিস্টিকাল মডেলিংয়ের কৌশলগুলিও সেই কালো বাক্সে রেখেছি। যদি আগ্রহ / ক্ষমতা না থাকে তবে ডোমেন জ্ঞান প্রয়োগ করা আরও কঠিন।
মেডিওয়ালার্ক ব্র্যাডের

7
@ ড্যারেনডাব্লু: প্রবণতাটি নামটিতেও প্রতিফলিত হয়েছে: "মেশিন লার্নিং" মেশিনটি যে অর্থটি শিখেছে তার সাথে ... নিজেই ... কেবল কাঁচা ডেটা বেলন। হাসেটি, তিবশিরানী, ইত্যাদি দ্বারা নির্বাচিত কম গ্ল্যামারাস নাম (তবে আরও সঠিক আইএমও) এর মধ্যে পার্থক্য করুন: "স্ট্যাটিস্টিকাল লার্নিং"। বিভিন্ন অর্থ, বিভিন্ন ব্যাখ্যা, সবই পরিসংখ্যানগত নীতির উল্লেখ করে।
আসাদ ইব্রাহিম

11

ভিড় থেকে নিজেকে আলাদা করার জন্য এখানে কয়েকটি জিনিস দেওয়া হয়েছে:

  • অ্যাপ্লিকেশন ডোমেন বা ডোমেনগুলি বুঝতে। তা হ'ল ব্যবসায়ের পরিবেশ বা অন্য প্রসঙ্গ।
  • বড় ছবিটি বুঝুন। এই অত্যন্ত গুরুত্বপূর্ণ! মেশিন লার্নিং অধ্যয়নরত লোকেরা প্রায়শই বিশদে হারিয়ে যায়। আপনার এমএল মডেলগুলি যে সামগ্রীতে ফুটে উঠবে সে সম্পর্কে ভাবুন। প্রায়শই এমএল অংশটি অনেক বড় ব্যবস্থার কেবল একটি ছোট অংশ is পুরো সিস্টেমটি বুঝুন।
  • অধ্যয়ন ইউটিলিটি এবং সিদ্ধান্ত তত্ত্ব এবং বায়েশিয়ান অনুমান, এখনই যা "সাধারণ" এমএল মডেল হিসাবে বিবেচিত হয় তা নয় বায়েশিয়ান অনুমান সমস্ত সমস্যার প্রাসঙ্গিক তথ্য আনার ধারণাটিকে আনুষ্ঠানিক করার একমাত্র উপায়। ইউটিলিটি এবং সিদ্ধান্তের তত্ত্বটি মানগুলিকে ছবিতে আনতে চলেছে।

সমস্ত তিনটি পয়েন্টের জন্য প্রযোজ্য সামগ্রিক বার্তা: বড় চিত্রটি দেখুন, বিশদে হারাবেন না।


4

যে দক্ষতা অন্যদের থেকে পৃথক করে একটি ডেটা মাইনার সেট করে তা হ'ল মেশিন লার্নিং মডেলগুলি ব্যাখ্যা করার দক্ষতা। বেশিরভাগ একটি মেশিন তৈরি করেন, ত্রুটিটি রিপোর্ট করুন এবং তারপরে থামুন। বৈশিষ্ট্যগুলির মধ্যে গাণিতিক সম্পর্ক কী? প্রভাবগুলি অ্যাডেটিভ বা অ-যুক্ত বা উভয়ই? বৈশিষ্ট্যগুলির কোনও কি অপ্রাসঙ্গিক? মেশিনটি কি নাল অনুমানের অধীনে প্রত্যাশা করা হয়েছে যে তথ্যগুলিতে কেবল সুযোগের নিদর্শন রয়েছে? মডেল কি স্বাধীন ডেটাতে সাধারণীকরণ করে? এই নিদর্শনগুলির অধ্যয়নরত সমস্যাটির অর্থ কী? অনুমান কি? অন্তর্দৃষ্টি কি? কেন একটি ডোমেন বিশেষজ্ঞ উত্তেজিত করা উচিত? মেশিনটি কি ডোমেন বিশেষজ্ঞকে নতুন প্রশ্ন জিজ্ঞাসা এবং নতুন পরীক্ষার ডিজাইন করবে? ডেটা মাইনার কীভাবে কার্যকরভাবে মডেল এবং এর প্রভাবগুলি বিশ্বের কাছে জানাতে পারে?


8
+1 সম্মত - যদিও আপনি যা বর্ণনা করেন তাকে পরিসংখ্যান বলা হয়।
থমাস স্পিডেল

4

আমি সেখানে "নরম দক্ষতা" ধারণাটি প্রকাশ করব।

  • এক্স এক্স পদ্ধতিটির জন্য কে "বিশেষজ্ঞ" তা স্বীকৃতি দেওয়া এবং তাদের জ্ঞানটি ট্যাপ করতে সক্ষম হওয়া (আপনার এরিয়িংয়ের বিষয়ে সবকিছু জানতে সক্ষম হওয়া বা আশা করা উচিত নয়)। অন্যের সাথে সহযোগিতা করার ক্ষমতা এবং ইচ্ছুকতা।

  • এমএলে ব্যবহৃত গণিতের সাথে "বাস্তব বিশ্বের" অনুবাদ বা প্রতিনিধিত্ব করার ক্ষমতা।

  • আপনার দর্শনের পদ্ধতিগুলি বিভিন্ন শ্রোতার কাছে বিভিন্ন উপায়ে ব্যাখ্যা করার ক্ষমতা - কখন কী বিবরণে ফোকাস করতে হবে এবং কখন পিছিয়ে যেতে হবে এবং আরও বিস্তৃত প্রসঙ্গে দেখুন knowing

  • সিস্টেমগুলির চিন্তাভাবনা, ব্যবসায়ের অন্যান্য ক্ষেত্রগুলিতে আপনার ভূমিকা কীভাবে ফিড হয় এবং এই ক্ষেত্রগুলি কীভাবে আপনার কাজে ফিরে আসে তা দেখতে সক্ষম হয়ে।

  • অনিশ্চয়তার একটি উপলব্ধি এবং বোঝা এবং এটি মোকাবেলা করার জন্য কিছু কাঠামোগত পদ্ধতি রয়েছে having আপনার অনুমানগুলি কী তা পরিষ্কারভাবে জানাতে সক্ষম হচ্ছেন।


4

ভাল জেনারেলাইজ করতে সক্ষম হওয়া

এটি একটি ভাল মডেলের সারমর্ম। এবং এটি মেশিন লার্নিংয়ের শিল্পের সেরা অনুশীলনকারীদের ভিড় থেকে পৃথক করে তোলে তার সারমর্ম।

লক্ষ্যটি অদেখা তথ্যের উপর পারফরম্যান্স অনুকূল করা, প্রশিক্ষণের ক্ষতি হ্রাস করা নয় Unders ওভার-ফিটিং এবং আন্ডার-ফিটিং উভয় কীভাবে এড়ানো যায় তা জানা। এমন মডেলগুলি নিয়ে আসছেন যা খুব জটিল নয় সমস্যাটি বর্ণনা করার ক্ষেত্রে খুব সহজ নয়। সর্বাধিক সম্ভবের চেয়ে প্রশিক্ষণের-সেটটির সংক্ষিপ্তসার উত্তোলন করা।

অবাক করা ব্যাপার যে প্রায়শই, অভিজ্ঞ মেশিন লার্নিং অনুশীলনকারীরাও এই নীতিটি অনুসরণ করতে ব্যর্থ হন। একটি কারণ হ'ল মানুষ দুটি বিশাল তত্ত্ব-বনাম-অনুশীলনের বিশালতার পার্থক্যের প্রশংসা করতে ব্যর্থ :

  • প্রশিক্ষণের ডেটা খুব বড় হয়ে গেলেও হাতে থাকা প্রশিক্ষণ-উপাত্তের তুলনায় সমস্ত সম্ভাব্য উদাহরণগুলির স্থানটি কত বড় ।
  • পূর্ণ "হাইপোথিসিস স্পেস" কত বড় : কোনও সমস্যার জন্য সম্ভাব্য মডেলের সংখ্যা, ব্যবহারিক "সমাধানের স্থান" এর তুলনায়: আপনি যা ভাবতে পারেন এবং আপনার সফ্টওয়্যার / সরঞ্জামগুলি প্রতিনিধিত্ব করতে সক্ষম সবকিছুই।

২ য় বিশেষত বোধগম্য, কারণ এমনকি ইনপুট এবং একটি বাইনারি ফলাফলের সহজতম সমস্যার জন্যও there সম্ভাব্য ইনপুট-উদাহরণ রয়েছে এবং সম্ভাব্য মডেলের একটি তাত্পর্যপূর্ণ বৃহত সংখ্যা 2 ^ রয়েছে।N2N2N

উপরের উত্তরগুলির বেশিরভাগ আরও সুনির্দিষ্ট এবং দৃ concrete় উপায়ে বলেছিল। ভাল জেনারেলাইজেশন করা আমি মনে করি, এটি করা সবচেয়ে সংক্ষিপ্ততম উপায়।


2

অনুশীলনে মেশিন লার্নিংয়ের পরিচালনা করার সময় আমি দুটি অংশ দেখতে পাচ্ছি

  1. ইঞ্জিনিয়ারিং (যা সমস্ত অ্যালগোরিদমকে কভার করে, বিভিন্ন প্যাকেজ শিখতে, প্রোগ্রামিং করে)।

  2. কৌতূহল / যুক্তি (ডেটাতে আরও ভাল প্রশ্ন জিজ্ঞাসা করার ক্ষমতা)।

আমি মনে করি 'কৌতূহল / যুক্তি' এমন দক্ষতা যা অন্যকে থেকে আলাদা করে। উদাহরণস্বরূপ, আপনি যদি ক্যাগল সম্পূর্ণ হওয়ার লিডার বোর্ডগুলি দেখতে পান, তবে অনেক লোক সাধারণ (অনুরূপ) অ্যালগরিদম ব্যবহার করতে পারে, তফাতটি কী ঘটে, কোনও ব্যক্তি কীভাবে যুক্তিযুক্তভাবে ডেটাটিকে প্রশ্নবিদ্ধ করে এবং এটি তৈরি করে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.