লিনিয়ার রিগ্রেশন কখন "মেশিন লার্নিং" বলা উচিত?


90

সাম্প্রতিক এক কথোপকথনে স্পিকারের বিমূর্তি দাবি করেছে যে তারা মেশিন লার্নিং ব্যবহার করছে। আলাপ চলাকালীন, মেশিন লার্নিং সম্পর্কিত একমাত্র বিষয় ছিল তারা তাদের ডেটাতে রৈখিক প্রতিরোধ সম্পাদন করে। 5 ডি প্যারামিটার স্পেসে সেরা-ফিট সহগের গণনা করার পরে, তারা একটি সিস্টেমে এই সহগগুলি অন্য সিস্টেমের সেরা-ফিট সহগের সাথে তুলনা করে।

লিনিয়ার রিগ্রেশন মেশিন লার্নিং কখন কেবল সেরা-ফিট লাইন সন্ধানের বিপরীতে হয়? (গবেষকের বিমূর্ত বিভ্রান্তিকরটি কি ছিল?)

সাম্প্রতিক সমস্ত মনোযোগ মেশিন লার্নিংয়ের সাথে এই ধরণের পার্থক্য করা গুরুত্বপূর্ণ বলে মনে হচ্ছে।

আমার প্রশ্নটি এই জাতীয় মত, এই প্রশ্নটি ব্যতীত "লিনিয়ার রিগ্রেশন" এর সংজ্ঞা জিজ্ঞাসা করে, যেখানে খনি জিজ্ঞাসা করে যে লিনিয়ার রিগ্রেশন (যার বিস্তৃত অ্যাপ্লিকেশন রয়েছে) যথাযথভাবে "মেশিন লার্নিং" বলা যেতে পারে।

ব্যাখ্যা

লিনিয়ার রিগ্রেশন কখন মেশিন লার্নিংয়ের সমান তা আমি জিজ্ঞাসা করছি না। যেমন কেউ উল্লেখ করেছেন যে, একটি একক অ্যালগরিদম অধ্যয়নের ক্ষেত্র গঠন করে না। আমি যখন জিজ্ঞাসা করছি এটি সঠিকভাবে যখন বলা যায় যে একজন যখন মেশিন লার্নিং করছে তখন যখন অ্যালগোরিদম ব্যবহার করা হয় তা কেবল একটি লিনিয়ার রিগ্রেশন।

সমস্ত কৌতুক একপাশে (মন্তব্য দেখুন), আমি এটি জিজ্ঞাসার অন্যতম কারণ হ'ল এটি বলা অনৈতিক যে কেউ যদি প্রকৃতপক্ষে মেশিন লার্নিং না করে থাকে তবে আপনার নামে কয়েকজন সোনার তারা যুক্ত করার জন্য মেশিন লার্নিং করছেন। (বহু বিজ্ঞানী তাদের কাজের জন্য সেরা-ফিট লাইন কিছু টাইপ নিরূপণ কিন্তু তার মানে এই নয় যে, তারা মেশিন লার্নিং করছ।) অন্যদিকে, সেখানে পরিষ্কারভাবে পরিস্থিতিতে যখন রৈখিক রিগ্রেশনের হয় মেশিন লার্নিং অংশ হিসেবে ব্যবহার করা হচ্ছে। আমি এই পরিস্থিতিগুলিকে শ্রেণিবদ্ধ করার জন্য বিশেষজ্ঞদের সন্ধান করছি। ;-)


13
হতে পারে আপনি থ্রেডটি দেখতে চান: " দুটি সংস্কৃতি: পরিসংখ্যান বনাম মেশিন লার্নিং? "।
usεr11852

75
আপনি যখনই আপনার রেট কার্ডের ফি দ্বিগুণ করতে চান তখন আপনার রিগ্রেশনটির নাম 'মেশিন লার্নিং' রাখা উচিত।
সাইকোরাক্স

3
পার্থক্য আছে. পড়াশোনা একটি প্রক্রিয়া। একটি সেরা ফিট একটি উদ্দেশ্য। আমার উত্তর নীচে দেখুন। সত্যই, শব্দের একই অর্থ হয় না, যদিও শব্দটি একই প্রসঙ্গে হাজির হতে পারে, "পাখি উড়ে" এর মতো, কেউ দু'জনকে সংযুক্ত করতে পারে, তবে পাখিগুলি উড়ান হয় না, এবং যদিও উড়ন্ত পাখিদের জন্য হয় তবে এটি চ -18 যুদ্ধবিমান পাশাপাশি।
কার্ল

20
যখন আপনি চতুর্দিকে যেতে চান @ সাইকোরাক্স এবং গভীর শিক্ষা
ফ্রাঙ্ক ডারননকোর্ট

11
@ ফ্র্যাঙ্কডেরননকোর্ট "মেশিন লার্নিংয়ের সমস্যাগুলি সমাধান করতে বড় ডেটা এনভায়রনমেন্টে গভীর জ্ঞান ব্যবহার করে আমি ডেটা বিজ্ঞানী" লিংকডইন প্রোফাইলের জন্য একটি দুর্দান্ত শিরোনাম বলে মনে হচ্ছে;)
টিম

উত্তর:


78

আপনার প্রশ্নের উত্তর দিয়ে একটি প্রশ্ন: মেশিন লার্নিং আসলে কী? স্ট্যাটিস্টিকাল লার্নিংয়ের ট্রেভর হাসি, রবার্ট তিবশিরানী এবং জেরোম ফ্রেডম্যান , মেশিন লার্নিং এ প্রবিলিস্টিক দৃষ্টিভঙ্গিতে কেভিন পি মারফি , প্যাটার্ন রিকগনিশন অ্যান্ড মেশিন লার্নিংয়ে ক্রিস্টোফার বিশপ , ইয়ান গুডফেলো, ডিপ লার্নিংয়ে ইয়োশুয়া বেঙ্গিও এবং অ্যারন কাউভিলি । অন্যান্য মেশিন লার্নিং "বাইবেলগুলি" মেশিন লার্নিংয়ের একটি হিসাবে "এলগরিদম" হিসাবে লিনিয়ার রিগ্রেশনকে উল্লেখ করে। মেশিন লার্নিং আংশিকভাবে প্রয়োগ করা পরিসংখ্যানগুলির জন্য একটি গুঞ্জনফলক এবং পরিসংখ্যান এবং মেশিন লার্নিংয়ের মধ্যে পার্থক্য প্রায়শই অস্পষ্ট।


4
সত্য তবে এগুলি বৃহত পরিমাণে ননওভারল্যাপিং সাহিত্য, পদ্ধতি এবং অ্যালগরিদম সহ প্রচুর পরিমাণে শৃঙ্খলাবদ্ধ। উদাহরণস্বরূপ, আজকের বিশ্ব মেশিন লার্নিংয়ে, ডেটা এবং কম্পিউটার সায়েন্স গ্রেডগুলি তহবিল, অনুদান এবং কাজের সুযোগগুলির ক্ষেত্রে পরিসংখ্যানবিদদের তুলনায় অনেক এগিয়ে, আপনি এটির নাম দিন।
মাইক হান্টার

6
@ ডি জনসন তাই এটি নতুন প্যাকেজের সাথে পরিসংখ্যান প্রয়োগ করেছে, বেশি দামে বিক্রি হচ্ছে ..? আমি মনে করি না যে এটি ট্রেন্ডি সত্য যে এটি একটি শব্দগুচ্ছ হিসাবে তৈরি করে না। বায়েশিয়ান পরিসংখ্যানগুলির নিজস্ব পদ্ধতি, জার্নাল, সম্মেলন, হ্যান্ডবুক এবং অ্যাপ্লিকেশন রয়েছে যা শাস্ত্রীয় পরিসংখ্যানের সাথে আংশিকভাবে অ-ওভারল্যাপিং রয়েছে - এটি কী এটি একটি শৃঙ্খলা হিসাবে পরিসংখ্যানের থেকে পৃথক করে তোলে?
টিম

3
হা. এমএল অনুশীলনকারীদের সম্পর্কে আরও সাধারণ পর্যবেক্ষণের সাথে আমার পর্যবেক্ষণের বিষয়টি অবহেলা করেছি যা কেবল এমএল নয়, সরলভাবে সংকীর্ণ অনুশীলনকারীরা প্রতিটি ক্ষেত্র এবং পেশার জন্য স্থানীয় । এটি এক ধরণের পেশাগত বিপত্তি - মানব ব্যর্থতা পড়ুন - যে লোকেরা তাদের তাত্ক্ষণিক প্রয়োজন এবং আগ্রহের বাইরে তথ্যের দিকে অন্ধ হয়ে যায়। সিভিও এর ব্যতিক্রম নয়।
মাইক হান্টার

23
(+1) আমি স্বীকার করি যে কোনও স্পষ্ট পার্থক্য নেই। আমি যে পরিমাণে পার্থক্যের কথা চিন্তা করি, আমি সাধারণত এমএলকে ভবিষ্যদ্বাণীগুলির সাথে আরও বেশি উদ্বিগ্ন এবং প্যারামিটার অনুক্রমের সাথে সম্পর্কিত হিসাবে পরিসংখ্যানগুলিকে বেশি ভাবি (যেমন, প্রতিক্রিয়ার পৃষ্ঠতলের মডেলিংয়ের জন্য পরীক্ষামূলক নকশা এমএলটিতে আদর্শ হবে না?)। সুতরাং সেই অর্থে, ওপির উদাহরণ - যেখানে রিগ্রেশন
সহগগুলি

3
লিও ব্রেইমানের দুটি সংস্কৃতিও দেখুন যা @ জিওম্যাটট 22 এর অনুরূপ একটি বিন্দু তৈরি করে: এমএল সঠিক ভবিষ্যদ্বাণীকে কেন্দ্র করে। মডেলটি সত্য কিনা তা গুরুত্বপূর্ণ নয়। ধ্রুপদী পরিসংখ্যানগুলি "সত্য" মডেলটির সন্ধান করছে, কোনও অর্থে, বা কমপক্ষে এমন একটি মডেল যা ডেটা তৈরির প্রক্রিয়াগুলির মধ্যে কিছুটা অন্তর্দৃষ্টি দেয়।
পিটার

41

লিনিয়ার রিগ্রেশন অবশ্যই একটি অ্যালগরিদম যা মেশিন লার্নিংয়ে ব্যবহার করা যেতে পারে। তবে, হ্রাসকারী বিজ্ঞাপনটি : এক্সেলের অনুলিপি সহ যে কেউ লিনিয়ার মডেলটি ফিট করতে পারেন।

এমনকি নিজেকে লিনিয়ার মডেলগুলিতে সীমাবদ্ধ রেখে, মেশিন লার্নিংয়ের বিষয়ে আলোচনা করার সময় আরও কয়েকটি বিষয় বিবেচনা করতে হবে:

  • ব্যবসায়ের সমস্যার বিষয়ে মেশিন লার্নিংয়ে আরও অনেক বেশি ডেটা জড়িত হতে পারে। " বিগ ডেটা ", আপনি যদি বুজওয়ার্ডটি ব্যবহার করতে চান তবে। তথ্য পরিষ্কার করা এবং প্রস্তুত করা প্রকৃত মডেলিংয়ের চেয়ে আরও বেশি কাজ নিতে পারে। এবং যখন ডেটাগুলির ভলিউম একটি একক মেশিনের প্রক্রিয়া করার ক্ষমতা ছাড়িয়ে যায় তখন ইঞ্জিনিয়ারিং চ্যালেঞ্জগুলি পরিসংখ্যানগত চ্যালেঞ্জগুলির মতো তাত্পর্যপূর্ণ। (থাম্বের বিধি: এটি যদি মূল স্মৃতিতে ফিট করে তবে এটি বড় ডেটা নয়)।
  • মেশিন লার্নিংয়ে প্রায়শই প্রচলিত পরিসংখ্যানের মডেলগুলির তুলনায় অনেক বেশি ব্যাখ্যামূলক ভেরিয়েবল (বৈশিষ্ট্য) জড়িত। সম্ভবত কয়েক ডজন, কখনও কখনও এমনকি শত শত, যার কয়েকটি বিভিন্ন স্তরের শ্রেণীবদ্ধ পরিবর্তনশীল হবে। এই বৈশিষ্ট্যগুলি যখন সম্ভাব্যভাবে ইন্টারঅ্যাক্ট করতে পারে (যেমন ক্রস ইফেক্ট মডেলগুলিতে) ফিট হতে পারে এমন সম্ভাব্য মডেলগুলির সংখ্যা দ্রুত বৃদ্ধি পায়।
  • মেশিন লার্নিং প্র্যাকটিশনার সাধারণত স্বতন্ত্র বৈশিষ্ট্যগুলির তাত্পর্য সম্পর্কে কম উদ্বিগ্ন এবং কোনও মডেলের বাইরে যতটা সম্ভব ভবিষ্যদ্বাণীী শক্তিকে গ্রাস করার বিষয়ে আরও বেশি উদ্বিগ্ন, বৈশিষ্ট্যের যে কোনও সংমিশ্রণ ব্যবহার করে তা করে। (পি-মানগুলি পূর্বাভাসের সাথে নয়, ব্যাখ্যা দিয়ে জড়িত))
  • বিপুল সংখ্যক বৈশিষ্ট্য এবং এই বৈশিষ্ট্যগুলির ইঞ্জিনিয়ারিংয়ের বিভিন্ন উপায়ে, হাতে মডেল নির্বাচন অকার্যকর হয়ে ওঠে। আমার মতে, মেশিন লার্নিংয়ের আসল চ্যালেঞ্জ হ'ল বৈশিষ্ট্যগুলির স্বয়ংক্রিয় নির্বাচন (ফিচার ইঞ্জিনিয়ারিং) এবং মডেল স্পেসিফিকেশনের অন্যান্য দিক। লিনিয়ার মডেল সহ এটি করার বিভিন্ন উপায় রয়েছে, সাধারণত ব্রুট ফোর্সের বিভিন্ন রূপ; স্টেপ-ওয়াস রিগ্রেশন, ব্যাক এলিমিনেশন ইত্যাদি সহ, যার মধ্যে আবারও উল্লেখযোগ্য কম্পিউটিং পাওয়ার প্রয়োজন। (থাম্বের দ্বিতীয় নিয়ম: আপনি যদি হাত দ্বারা বৈশিষ্ট্যগুলি বেছে নিচ্ছেন তবে আপনি পরিসংখ্যান করছেন, মেশিন লার্নিং নয়)।
  • আপনি যখন অনেকগুলি বৈশিষ্ট্য সহ স্বয়ংক্রিয়ভাবে অনেকগুলি মডেল ফিট করেন, ওভার-ফিটিং একটি গুরুতর সম্ভাব্য সমস্যা। এই সমস্যাটি মোকাবেলায় প্রায়শই কোনও না কোনও ক্রস বৈধকরণের জড়িত থাকে : অর্থাত্ আরও নিষ্ঠুর শক্তি গণনা!

সংক্ষিপ্ত উত্তরটি আমার দৃষ্টিকোণ থেকে, মেশিন লার্নিং যেখানে traditionalতিহ্যগত পরিসংখ্যানের মডেলিং থেকে বিচ্যুত হয় সেখানে জোর বল এবং মডেল নির্বাচনের সংখ্যাসূচক পদ্ধতির প্রয়োগ হয়, বিশেষত বিপুল পরিমাণে ডেটা এবং বিপুল সংখ্যক ব্যাখ্যামূলক ভেরিয়েবলের ডোমেনগুলিতে where , ভবিষ্যদ্বাণীপূর্ণ শক্তির উপর ফোকাস সহ, মডেল বৈধতার জন্য আরও নিষ্ঠুর শক্তি অনুসরণ করে।


2
আমি সাধারণভাবে এই পার্থক্য পছন্দ করি। তবে, ক্রস-বৈধতা কি কখনও "স্ট্যাটিস্টিকাল" মডেলগুলিতে ব্যবহৃত হয় বা সাধারণত হাতে হাতে করা হওয়ায় এটি খুব কমই প্রয়োজন হয়? ফিচার ইঞ্জিনিয়ারিং কি তখন হাতে হাতে পরিসংখ্যান হিসাবে বিবেচিত হয়?
জোশ

3
@ জোশ, হ্যাঁ, এটি হতে পারে। তবে যদি আপনি ক্রস বৈধকরণ ট্যাগটি দেখেন তবে প্রায় সমস্ত প্রশ্নই ভবিষ্যদ্বাণীপূর্ণ মডেলিং সম্পর্কে।
ডেভিড 25272

@ ডেভিড 25272 আপনি কীভাবে বুটস্ট্র্যাপ, .632+ বুটস্ট্র্যাপ, এবং ক্রমশক্তি পরীক্ষা সম্পর্কে ভাবেন সে সম্পর্কে আমি কৌতূহল বোধ করছিলাম - তারা সবসময় কীভাবে হয় সে কারণে আমি "মেশিন লার্নিং" এর চেয়ে বেশি "প্রয়োগিত পরিসংখ্যান" হিসাবে ভেবেছি উত্সাহিত, কিন্তু তারা একইভাবে কে-ভাঁজ বা ছেড়ে-কে-আউট ক্রস-বৈধকরণ থেকে "ব্রুট-ফোর্স"। আমি মনে করি, এল 1 নিয়মিতকরণ কোনও পরিসংখ্যান কাঠামোর মধ্যে বৈশিষ্ট্য নির্বাচনের এক ধরণের হিসাবেও ভাবা যেতে পারে ...
প্যাট্রিক বি।

মডেল বৈধতার জন্য বুটস্ট্যাপিংয়ের ব্যবহারগুলি আমি যেভাবে দিতে পারি তার চেয়ে @ পেট্রিক স্ট্যাটস.স্ট্যাকেক্সেঞ্জার / সেকশনস / 18348 একটি ভাল উত্তর answer
ডেভিড 25272

@ ডেভিড ২৫২72২ আহ, দুঃখিত, আমার প্রশ্নটি আপনি আরও "মেশিন লার্নিং" কৌশল বা "প্রয়োগকৃত পরিসংখ্যান" কৌশল হিসাবে বিবেচনা করছেন কিনা, কারণ তারা পরিসংখ্যানগত দিক থেকে প্ররোচিত কিন্তু "নিষ্ঠুর শক্তি"। আমি মডেল বৈধতার জন্য পক্ষপাত সংশোধন বুটস্ট্র্যাপ ব্যবহারের সাথে পরিচিত।
প্যাট্রিক বি।

14

আমি মনে করি মিচেলের সংজ্ঞাটি মেশিন লার্নিংয়ের আলোচনার ভিত্তিতে একটি সহায়ক উপায় সরবরাহ করে, এটি প্রথম ধরণের নীতি। উইকিপিডিয়াতে পুনরুত্পাদন হিসাবে :

একটি কম্পিউটার প্রোগ্রামকে E এর কিছু অংশের কাজের জন্য T এবং পারফরম্যান্স পরিমাপের অভিজ্ঞতা থেকে শিখতে বলা হয়, যদি টি দ্বারা কাজকর্মের পারফরম্যান্স, পি দ্বারা পরিমাপ করা হয়, অভিজ্ঞতা E এর সাথে উন্নতি করে if

এটি কয়েকটি উপায়ে সহায়ক। প্রথমে আপনার তাত্ক্ষণিক প্রশ্নের জন্য: রিগ্রেশন হ'ল মেশিন লার্নিং যখন তার কাজটি কোনও অ্যাপ্লিকেশনটিতে ভবিষ্যদ্বাণীপূর্ণ বৈশিষ্ট্যগুলি থেকে একটি আনুমানিক মান সরবরাহ করা হয়। এর স্কোয়ারিং (বা নিখুঁত ইত্যাদি) দ্বারা পরিমাপ করা তত্ক্ষেত্রে ত্রুটি থেকে রক্ষা পাওয়ার সাথে সাথে এর কর্মক্ষমতাটি উন্নত করা উচিত, কারণ এতে আরও ডেটা পাওয়া যায়।

দ্বিতীয়ত, এটি সম্পর্কিত পদগুলি থেকে মেশিন লার্নিং এবং বিপণনের বুজওয়ার্ড হিসাবে এর ব্যবহারকে সহায়তা করে। উপরের কাজটিকে একটি মানক, অনুমানমূলক প্রতিরোধের সাথে বৈষম্য করুন, যেখানে বিশ্লেষক উল্লেখযোগ্য সম্পর্কের জন্য সহগের ব্যাখ্যা করে। এখানে প্রোগ্রামটি একটি সংক্ষিপ্তসার দেয়: সহগ, পি-মান ইত্যাদি The প্রোগ্রামটি অভিজ্ঞতার সাথে এই পারফরম্যান্সটি উন্নত করার কথা বলা যায় না; কাজটি বিস্তৃত গণনা।

অবশেষে, এটি মেশিন লার্নিং সাব ফিল্ডগুলিকে একীভূত করতে সহায়তা করে, সাধারণত উভয়ই সংযুক্তি শেখার বা ঘনত্বের অনুমানের মতো অন্যদের সাথে পরিচিতি প্রদর্শন (তদারকি, নিরীক্ষণ) ব্যবহার করা হয়। (প্রত্যেকের একটি কার্য, কর্মক্ষমতা পরিমাপ এবং অভিজ্ঞতার ধারণা রয়েছে, যদি আপনি সেগুলি সম্পর্কে যথেষ্ট চিন্তা করেন)) এটি আমি মনে করি, একটি সমৃদ্ধ সংজ্ঞা প্রদান করে যা দুটি ক্ষেত্রকে অহেতুক হ্রাস না করে চিত্রিত করতে সহায়তা করে। উদাহরণ হিসাবে, "এমএল পূর্বাভাসের জন্য, পরিসংখ্যানের পরিসংখ্যান" তদারকি করা শিক্ষার বাইরে মেশিন লার্নিং কৌশল এবং ভবিষ্যদ্বাণীকে কেন্দ্র করে এমন পরিসংখ্যান কৌশল উভয়ই উপেক্ষা করে।


12

এমন কোনও আইন নেই যা বলছে যে মন্ত্রিপরিষদ নির্মাতা ব্যারেল তৈরির করাত ব্যবহার করতে পারবেন না।

মেশিন লার্নিং এবং পরিসংখ্যানগুলি অস্পষ্ট লেবেল, তবে যদি সংজ্ঞায়িত হয় তবে পরিসংখ্যান এবং মেশিন লার্নিংয়ের মধ্যে প্রচুর ওভারল্যাপ থাকে। এবং এটি এই দুটি ক্ষেত্রের পদ্ধতির পাশাপাশি (এবং পৃথকভাবে) এই দুটি ক্ষেত্রের সাথে নিজেকে লেবেলযুক্ত লোকদের জন্যও যায়। তবে যতদূর গণিত যায়, মেশিন লার্নিং পুরোপুরি পরিসংখ্যানের ক্ষেত্রের মধ্যে।

লিনিয়ার রিগ্রেশন একটি খুব ভাল সংজ্ঞায়িত গাণিতিক পদ্ধতি। আমি এটিকে পরিসংখ্যানের ক্ষেত্রের সাথে এবং যারা নিজেকে 'পরিসংখ্যানবিদ' বলে অভিহিত করেন এবং যারা 'পরিসংখ্যান' এর মতো লেবেলের সাথে একাডেমিক প্রোগ্রাম থেকে বেরিয়ে আসেন তাদের সাথে এটি যুক্ত করি। এসভিএম (সাপোর্ট ভেক্টর মেশিনস) একইভাবে একটি খুব ভাল সংজ্ঞায়িত গাণিতিক পদ্ধতি যা কিছু কিছু অনুরূপ প্রতিটি ইনপুট এবং আউটপুট থাকে এবং অনুরূপ সমস্যার সমাধান করে। তবে আমি এটিকে মেশিন লার্নিংয়ের ক্ষেত্রের সাথে এবং যারা নিজেকে কম্পিউটার বিজ্ঞানী বা কৃত্রিম বুদ্ধিমত্তা বা মেশিন লার্নিংয়ে কাজ করে এমন লোকদের সাথে যুক্ত করেন যা কম্পিউটার শাখার একটি শাখা হিসাবে বিবেচনা করে।

তবে কিছু পরিসংখ্যানবিদরা এসভিএম এবং কিছু এআই লোকেরা লজিস্টিক রিগ্রেশন ব্যবহার করতে পারে। কেবল স্পষ্ট করে বলতে গেলে, সম্ভবত এটি সম্ভবত ব্যবহারিক ব্যবহারের চেয়ে কোনও পরিসংখ্যানবিদ বা এআই গবেষক কোনও পদ্ধতি বিকাশ করতে পারে।

আমি পরিসংখ্যানের ডোমেনের ভিতরে মেশিন লার্নিংয়ের সমস্ত পদ্ধতি বর্গক্ষেত্র রেখেছি। এমনকি ডিপ লার্নিং, আরএনএন, সিএনএন, এলএসটিএম, সিআরএফ এর মতো সাম্প্রতিক জিনিসগুলি। একজন প্রয়োগকৃত পরিসংখ্যানবিদ (বায়োস্টাটিস্টিশিয়ান, কৃষিবিদ) তাদের সাথে ভালভাবে পরিচিত নাও হতে পারেন। এগুলি হ'ল সমস্ত ভবিষ্যদ্বাণীপূর্ণ মডেলিং পদ্ধতি যা সাধারণত 'মেশিন লার্নিং' লেবেলযুক্ত এবং পরিসংখ্যানের সাথে খুব কমই যুক্ত। কিন্তু তারা হয় ভবিষ্যদ্বাণীপূর্ণ মডেল, ভাতা যে তারা পরিসংখ্যানগত পদ্ধতি ব্যবহার করে বিচার করা যায়।

শেষ পর্যন্ত, লজিস্টিক রিগ্রেশন অবশ্যই মেশিন লার্নিংয়ের অংশ হিসাবে বিবেচনা করা উচিত

তবে, হ্যাঁ, আমি এই শব্দগুলির অপব্যবহারের জন্য আপনার বিরক্তি দেখছি এবং প্রায়শই ভাগ করে নিই। লিনিয়ার রিগ্রেশন হ'ল পরিসংখ্যান নামে পরিচিত এমন জিনিসগুলির একটি মৌলিক অংশ যা এর ব্যবহারকে 'মেশিন লার্নিং' বলতে কল্পনা করতে খুব অদ্ভুত এবং বিভ্রান্তিমূলক বলে মনে করে

উদাহরণস্বরূপ, লজিস্টিক রিগ্রেশন একটি গাণিতিকভাবে ডিপ লার্নিং নেটওয়ার্কের সাথে গোপন নোড এবং একক আউটপুট নোডের অ্যাক্টিভেশন ফাংশন হিসাবে লজিস্টিক ফাংশন হিসাবে অভিন্ন। আমি লজিস্টিক রিগ্রেশনকে একটি মেশিন লার্নিং পদ্ধতি বলব না, তবে এটি অবশ্যই মেশিন লার্নিং প্রসঙ্গে ব্যবহৃত হয়।

এটি বেশিরভাগ প্রত্যাশার বিষয়

উত্তর: "আমি হার্ট সার্জারির পরে কোনও হাসপাতালে পাঠের পূর্বাভাস দেওয়ার জন্য মেশিন লার্নিং ব্যবহার করেছি।"

বি: "ওহ হ্যাঁ? ডিপ লার্নিং? এলোমেলো বন? !!?"

উত্তর: "ওহ, না, এর মতো অভিনব কিছু নয়, কেবল লজিস্টিক রিগ্রেশন" "

বি: চূড়ান্ত হতাশ চেহারা

এটি বলার মতো, যখন আপনি কোয়ান্টাম রসায়ন ব্যবহার করছেন এমন জল দিয়ে একটি উইন্ডো ধোওয়ার সময়। হ্যাঁ হ্যাঁ এটি প্রযুক্তিগতভাবে ভুল নয় তবে আপনি যা প্রয়োজন তার চেয়ে অনেক বেশি বোঝাচ্ছেন।

কিন্তু সত্যিই, যে হয় ঠিক বনাম একটি পদার্থ পার্থক্য একটি সংস্কৃতি পার্থক্য। একটি শব্দের অর্থ এবং লোকের গোষ্ঠীর সাথে সংযুক্তি (এলআর সম্পূর্ণ এমএল নয়!) গণিত এবং অ্যাপ্লিকেশনগুলির (এলআর সম্পূর্ণ এমএল!)।


3
বাস্তবসম্মত এবং তাত্ত্বিকভাবে এসভিএমগুলিতে
প্যাট্রিক বি।

3

সাধারণ দৃষ্টিতে 4 টি অঞ্চল নিয়ে তৈরি মেশিন লার্নিং:

1) মাত্রা হ্রাস

2) ক্লাস্টারিং

3) শ্রেণিবিন্যাস

4) রিগ্রেশন

লিনিয়ার রিগ্রেশন একটি রিগ্রেশন। মডেলটি প্রশিক্ষিত হয়ে গেলে এটি যে কোনও অন্যের মতো ভবিষ্যদ্বাণীগুলির জন্যও ব্যবহার করা যেতে পারে, বলুন, র্যান্ডম ফরেস্ট রিগ্রেশন।


আসলে একটি পার্থক্য রয়েছে, যদিও লিনিয়ার রিগ্রেশন মেশিন লার্নিং ব্যবহার করে সমাধান করা যেতে পারে। একটি সাধারণ রিগ্রেশন লক্ষ্য হ'ল সাধারণ সর্বনিম্ন স্কোয়ার, যার অর্থ, আমাদের টার্গেট লস ফাংশন, যোগফলের স্কোয়ারের অবশিষ্টাংশগুলি হ্রাস করা উচিত। এখন, মেশিন লার্নিং কেবল সেই পদ্ধতিটির সাথে উল্লেখ করবে যার মাধ্যমে আমরা ক্ষতির ফাংশন হ্রাস করি।
কার্ল

এইভাবে ধারণাগতভাবে, গ্রেডিয়েন্ট বংশোদ্ভূত (লার্নিং) এর মাধ্যমে লিনিয়ার রিগ্রেশন আরও ভাল এবং আরও ভাল সংখ্যক স্কোয়ার অবশিষ্টাংশ (ক্ষতির ফাংশন) চয়ন করে ses মৌলিক ধারণাগুলি অনেক বেশি উন্নত শিক্ষার অ্যালগরিদমগুলির মতো, যেমন নিউরাল নেটওয়ার্কগুলির মতো। এই অ্যালগরিদম কেবল লিনিয়ার মডেলকে আরও জটিল মডেলের সাথে প্রতিস্থাপন করে - এবং, তাত্পর্যপূর্ণভাবে আরও অনেক জটিল ব্যয় ফাংশন।
কার্ল

1
সুতরাং ওপি প্রশ্নের উত্তর কখন লিনিয়ার রিগ্রেশন মেশিন লার্নিং হয়, কেবলমাত্র একটি সেরা-ফিট লাইন সন্ধানের বিপরীতে? গ্রেডিয়েন্ট বংশদ্ভুতের মতো মেশিন লার্নিংয়ের একটি নির্দিষ্ট উপাদান ব্যবহার করে যখন লিনিয়ার রিগ্রেশন সঞ্চালিত হয়, তখন এটি মেশিন লার্নিং ব্যবহার করে লিনিয়ার রিগ্রেশন হয়।
কার্ল

5
@ কার্ল, এখানে সমস্যাটি "মেশিন লার্নিং" সংজ্ঞায়িত হয়েছে। আমার কাছে যদি আমরা একটি পরিসংখ্যানগত মডেল ব্যবহার করতে পারি এবং সেই মডেলটিতে এটি মেশিন লার্নিংয়ের পূর্বাভাস দেওয়ার ক্ষমতা থাকবে। এবং মডেলের সহগ খুঁজে পেতে কোন পদ্ধতির ব্যবহার হয়েছিল তা বিবেচ্য নয়।
Akavall

1
আমি আকাওয়ালের উত্তরটি বেশ পরিষ্কার পেয়েছি। আমি বিশ্বাস করি আকাওয়ালের সমস্যা হ'ল আপনি যে সংজ্ঞাটি উপস্থাপন করেছেন তা বিজ্ঞপ্তিযুক্ত, কারণ এটি "প্রশ্ন: টেকনিক এক্স কখন 'মেশিন লার্নিং' হিসাবে গণ্য হয়? এ: যখন টেকনিক এক্স মেশিন লার্নিংয়ের একটি নির্দিষ্ট উপাদান ব্যবহার করে সম্পাদিত হয়।" (দুর্ভাগ্যক্রমে আপনি যে দ্বিতীয় পয়েন্টটি তৈরি করছেন তা আমি বুঝতে পারছি না যাতে আমি তার প্রতিক্রিয়া জানাতে পারি না))
প্যাট্রিক বি।

2

লিনিয়ার রিগ্রেশন একটি কৌশল, অন্যদিকে মেশিন লার্নিং একটি লক্ষ্য যা বিভিন্ন উপায়ে এবং কৌশলগুলির মাধ্যমে অর্জন করা যেতে পারে।

সুতরাং রিগ্রেশন পারফরম্যান্সটি এটি একটি প্রত্যাশিত লাইন / বক্ররেখার সাথে কতটা ফিট করে তা পরিমাপ করা হয়, অন্যদিকে যেকোন উপায় দ্বারা মেশিন লার্নিং একটি নির্দিষ্ট সমস্যা সমাধান করতে পারে তা কতটা ভাল তা দ্বারা পরিমাপ করা হয়।


2

আমি যুক্তি দেব যে মেশিন লার্নিং এবং পরিসংখ্যানগত অনুমানের মধ্যে পার্থক্য পরিষ্কার। সংক্ষেপে, মেশিন লার্নিং = ভবিষ্যতের পর্যবেক্ষণের পূর্বাভাস ; পরিসংখ্যান = ব্যাখ্যা।

আমার আগ্রহের ক্ষেত্রের (মেডিসিন) একটি উদাহরণ এখানে রয়েছে: ওষুধের বিকাশ করার সময় আমরা জিন (গুলি) অনুসন্ধান করি যা কোনও রোগের অবস্থাকে সর্বোত্তমভাবে ব্যাখ্যা করে, ড্রাগকে / তাদের সাথে লক্ষ্যবস্তুর লক্ষ্যে। আমরা এজন্য স্ট্যাটিস্টিস ব্যবহার করি। বিপরীতে, ডায়াগনস্টিক পরীক্ষাগুলি বিকাশ করার সময়, ড্রাগটি কোনও রোগীকে সহায়তা করবে কিনা তা পূর্বাভাস দেওয়ার জন্য, লক্ষ্যটি কঠোরভাবে ভবিষ্যতের ফলাফলের সেরা ভবিষ্যদ্বাণীকে সন্ধান করছে, যদিও এটি অনেকগুলি জিনের সমন্বয়ে গঠিত এবং বুঝতে খুব জটিল is আমরা এই উদ্দেশ্যে মেশিন লার্নিং ব্যবহার করি। একাধিক প্রকাশিত উদাহরণ রয়েছে [1], [2], [3], [4] দেখায় যে ড্রাগ ড্রাগের উপস্থিতি চিকিত্সার ফলাফলের ভাল ভবিষ্যদ্বাণীকারী নয়, তাই পার্থক্য।

এর উপর ভিত্তি করে, এটি বলার অপেক্ষা রাখে না যে যখন কেউ ভবিষ্যতে / পূর্বে অদেখা পর্যবেক্ষণগুলির ফলাফলের কঠোর ফলাফলের পূর্বাভাস দিচ্ছে তখন একজন মেশিন লার্নিং করছেন। লক্ষ্যটি যদি কোনও নির্দিষ্ট ঘটনা বোঝে, তবে তা পরিসংখ্যানগত অনুক্রম, মেশিন লার্নিং নয়। অন্যরা যেমন উল্লেখ করেছে, পদ্ধতিটি নির্বিশেষে এটি সত্য।

আপনার প্রশ্নের উত্তর দেওয়ার জন্য: আপনি যে নির্দিষ্ট গবেষণার বর্ণনা দিয়েছেন তাতে বিজ্ঞানীরা মডেলের নির্ভুলতার তুলনা না করে বিভিন্ন লিনিয়ার রিগ্রেশন মডেলগুলিতে ফ্যাক্টর রোলগুলি (ওজন) তুলনা করছিলেন। সুতরাং, তাদের অনুমানের মেশিন লার্নিং কল করা সঠিক নয়।

[1] মেসারস্মিথ ডাব্লুএ, অহেনেন ডিজে। কলোরেক্টাল ক্যান্সারে ইজিএফআরকে লক্ষ্য করে। নিউ ইংল্যান্ড জার্নাল অফ মেডিসিন; 2008; 359; 17।

[2] পোগ-জিলি কেএল এট আল। এনএসএবিপি ট্রায়াল বি -31-এ অ্যাডজভেন্ট ট্রাস্টুজুমাব থেকে সুবিধার ডিগ্রির পূর্বাভাস। জে নেটল ক্যান্সার ইনস্ট্যান্ট; 2013; 105: 1782-1788।

[3] ভেজুরাফেনিবের পক্ষে পাজদুর আর এফডিএ অনুমোদন। https://www.cancer.gov/about-cancer/treatment/drugs/fda-vemurafenib । জুলাই 3, 2013 আপডেট হয়েছে।

[৪] রায় টি। দুটি এএসসিও স্টাডিজ এনএসসিএলসি ড্রাগ ট্রায়ালগুলিতে ভবিষ্যদ্বাণীমূলক চিহ্নিতকারী হিসাবে এমইটি সিগন্যালিং ব্যবহার করার চ্যালেঞ্জ দেখায়। জেনোমেব, 11 ই জুন, 2014।


7
আমি সম্মত যে মেশিন লার্নিং গবেষণার প্যারামিটার অনুমানের চেয়ে পূর্বাভাসের উপর অনেক বেশি জোর দেওয়া হয়েছে। তবে এটি একটি স্পষ্ট বিভাজক রেখা নয়: পরিসংখ্যান গবেষণাটি ভবিষ্যদ্বাণীমূলক পদ্ধতিতে সমৃদ্ধ।
ক্লিফ এ বি

4
সুতরাং পরিসংখ্যানবিদরা কী করবেন যেগুলি কম্পিউটারগুলির অস্তিত্বের পূর্বে ভবিষ্যদ্বাণী করেছিল (বা ব্যাপকভাবে উপলব্ধ ছিল)? তারা কি পেপার-পেন্সিল মেশিন লার্নিং প্রয়োগ করছে ?!
টিম

1
@ টিম: খুব সূক্ষ্ম যুক্তি। আমি বিশ্বাস করি উত্তরটি হ্যাঁ যদি তারা ভবিষ্যতের পর্যবেক্ষণগুলিতে মনোনিবেশ করে তবে আমি তাদের (বিরল) ক্ষেত্রে স্বীকার করি যে নামটি পরিসংখ্যান শেখা আরও উপযুক্ত হবে। কম্পিউটারের আবির্ভাবের সাথে মেশিন লার্নিং শব্দটি আরও ফ্যাশনেবল হয়ে উঠল। পয়েন্টটি নাম নয়, কম্পিউটার ব্যবহারও নয়; এটি উদ্দেশ্য স্পষ্টতা। আমার দৃষ্টিতে, পূর্ববর্তী অদেখা পর্যবেক্ষণগুলির সঠিক ভবিষ্যদ্বাণী, এবং ঘটনাটি বোঝার জন্য উভয়ই সাফল্যের সাথে অপ্টিমাইজ করা প্রায় অসম্ভব । যথাযথভাবে ফোকাস করা ভাল।
ljubomir

4
সময় সিরিজের পূর্বাভাস (ভবিষ্যতের পর্যবেক্ষণের পূর্বাভাস) পরিসংখ্যানগুলিতে (এবং একনোমেট্রিক্স) দীর্ঘ সময়ের একটি জনপ্রিয় সমস্যা ছিল, সুতরাং এর ভিত্তিতে আমি কোনও স্পষ্ট পার্থক্যের সাথে একমত নই।
রিচার্ড হার্ডি

1
এই উত্তরটি বোগাস। ভবিষ্যদ্বাণী করা মেশিন লার্নিংয়ের একটি ছোট অংশ। পরিসংখ্যানবিদরাও ভবিষ্যদ্বাণী করেন। যদিও মেশিন লার্নিং এবং পরিসংখ্যানের মধ্যে চিত্রিত করা কঠিন, তবে এটি অবশ্যই সঠিক উপায় নয়।
রোবগুইনেস

2

লিনিয়ার রিগ্রেশন মেশিন লার্নিং কল করা দরকারী হতে পারে কারণ সাধারণত এটি করা আপনার সমস্যা সমাধানে আপনি কীভাবে চলেছেন সে সম্পর্কে কয়েকটি গুরুত্বপূর্ণ বিষয় বোঝায়:

  1. আপনি সিদ্ধান্ত নিয়েছেন যে আপনার ব্যাখ্যাযোগ্য ভেরিয়েবলের পিছনে কার্যকারণ অনুমান এবং পূর্ব তত্ত্বটি পরীক্ষা করা প্রয়োজন নয়। এটি ইঙ্গিত দেয় যে আপনার মডেলটি ব্যাখ্যা করার উদ্দেশ্যে নয়, ভবিষ্যদ্বাণী করা হয়েছিল। এটি অনেকগুলি সেটিংসে পুরোপুরি যুক্তিসঙ্গত, উদাহরণস্বরূপ, কীওয়ার্ডের ভিত্তিতে ইমেল স্প্যামের পূর্বাভাস। শব্দগুলি স্প্যামের পূর্বাভাস দেয় এমন সত্যিকারের সাহিত্যের অনেক কিছুই নেই এবং এমন অনেক শব্দের রয়েছে যা প্রতিটি শব্দের তাত্ত্বিক তাত্পর্যটি দিয়ে ভাবতে বোঝায় না
  2. আপনি পরিবর্তনশীল তাত্পর্য পরীক্ষা করেননি বা পি-মানগুলি ব্যবহার করেননি তবে পরিবর্তে নমুনা থেকে ভবিষ্যদ্বাণীপূর্ণ কার্যকারিতা নির্ধারণের জন্য হোল্ডআউট সেট বা ক্রস বৈধকরণের বিকল্পটি বেছে নিয়েছেন। এটি পুরোপুরি বৈধ হতে পারে যদি - ইমেলের স্প্যামের উদাহরণে ফিরে আসে - যদি আপনার যত্ন নেওয়া সমস্ত কিছু যদি এমন মডেল তৈরি করে যা কার্যকরভাবে স্প্যামের পূর্বাভাস দেয়, এমনকি যদি এটি পরিবর্তনশীলগুলি অন্তর্ভুক্ত করে ব্যয় করতে পারে যা traditionalতিহ্যগত তাত্পর্য পরীক্ষা করতে পারে না।

তবে, যদি আপনার মডেলটি পূর্বাভাস দেওয়ার চেয়ে ব্যাখ্যা করার চেয়ে বেশি উদ্দিষ্ট হয় এবং আপনি আপনার মডেলটির তাত্ত্বিক কার্যকারণ অনুমান ইত্যাদি কঠোরভাবে পরীক্ষা করে দেখেন তবে হ্যাঁ, এটি মেশিন লার্নিং বলা বোকা।


2

স্বীকার করা যায় যে, এই প্রশ্নের কোনও উত্তর উদ্দেশ্যগত সত্যের চেয়ে বেশি মতামত, তবে কেন আমি মনে করি যে উত্তরটি কখনই হয় না বলে আমি আমার যুক্তি প্রকাশ করার চেষ্টা করব । যে কোনও তথাকথিত মেশিন লার্নিং বিশেষজ্ঞ বা প্রশিক্ষক কেবল লিনিয়ার রিগ্রেশনকে প্রতিনিধিত্ব করে তাদের অজ্ঞতা প্রকাশ করেন।

একাডেমিক শাখার ডিলিনেশন পদ্ধতিগুলির চেয়ে সম্প্রদায়ের বর্ণা .ণের বিষয়ে বেশি। বৈজ্ঞানিক শাখাগুলি সমস্ত সময় শৃঙ্খলা জুড়ে পদ্ধতি ধার করে। এছাড়াও, উনিশ শতকে (যখন লিনিয়ার রিগ্রেশন বিকশিত হয়েছিল) এবং তার আগে, বৈজ্ঞানিক শাখাগুলি এতটা স্পষ্টভাবে বর্ণিত হয়নি যেমন তারা আজ রয়েছে। সুতরাং বিশেষত যখন উনিশ শতকে বা তার আগেও পদ্ধতিগুলি বিকশিত হয়েছিল, তখন আমাদের সেগুলি একটি নির্দিষ্ট শৃঙ্খলে অর্পণ করার ক্ষেত্রে যত্নবান হওয়া উচিত।

বলা হচ্ছে যে, একটি শৃঙ্খলার ইতিহাস দেখে এবং যুক্তিসঙ্গত উপসংহারে আসতে পারে যে নির্দিষ্ট পদ্ধতিগুলি একটি অনুচ্ছেদে বা অন্য কোনও বিষয়ের সাথে "সম্পর্কিত"। আজ কেউই বলবে না যে ক্যালকুলাস পদার্থবিজ্ঞানের ক্ষেত্রের অন্তর্গত, যদিও নিউটোন যিনি ক্যালকুলাসের অন্যতম আবিষ্কারক ছিলেন তিনি অবশ্যই পদার্থবিদ্যায় প্রয়োগ করার চেষ্টা করেছিলেন। ক্যালকুলাস স্পষ্টতই গণিতের অনুশাসনের সাথে সম্পর্কিত, পদার্থবিজ্ঞানের নয়। এটি কারণ ক্যালকুলাস একটি সাধারণ গাণিতিক পদ্ধতি যা একটি পদার্থবিজ্ঞানের প্রসঙ্গে সম্পূর্ণরূপে ব্যবহার করা যেতে পারে।

একই যুক্তি দ্বারা, লিনিয়ার রিগ্রেশন পরিসংখ্যানের অনুশাসনের অন্তর্গত, যদিও এটি সাধারণত মেশিন লার্নিংয়ের প্রসঙ্গে কোনও মডেলের কাছে ডেটা ফিটিংয়ের সাধারণ উদাহরণ হিসাবে ব্যবহৃত হয়। যেমন ক্যালকুলাস পদার্থবিজ্ঞানের প্রসঙ্গের বাইরে ব্যবহার করা যায় তেমনি মেশিন লার্নিংয়ের প্রেক্ষাপটের বাইরে লিনিয়ার রিগ্রেশন (এবং এটি) ব্যবহার করা যেতে পারে।

মেশিন লার্নিং ইন্সট্রাক্টররা এটি উল্লেখ করে বুদ্ধিমান হবেন যে মেশিন লার্নিংয়ের আধুনিক ধারণাটি প্রচলিত হওয়ার অনেক আগে থেকেই 19 শতকের শেষদিকে লিনিয়ার রিগ্রেশন ব্যবহৃত হয়ে আসছে । তাদের এও জোর দেওয়া উচিত যে মেশিন লার্নিং সম্ভাবনা এবং পরিসংখ্যান, পাশাপাশি অন্যান্য শাখাগুলি (যেমন তথ্য তত্ত্ব) থেকে অনেকগুলি ধারণা ব্যবহার করে। তবে, এই ধারণাগুলি নিজেরাই মেশিন লার্নিং বা মেশিন লার্নিংয়ের একটি "অ্যালগরিদম" উপস্থাপন করে না।


1

এটা মেশিন, বোকা!

আমি না কোনও পরিসংখ্যানবিদ বা বিগ ডেটা (টিএম) বিশেষজ্ঞ নই। তবে, আমি বলব যে প্রয়োজনীয় পার্থক্যটি হল "মেশিন লার্নিং" এর জন্য "একটি মেশিন" প্রয়োজন requires বিশেষত, এটি এজেন্সিকে বোঝায় । ফলাফল অবসর সময়ে কোনও মানুষ গ্রাস করবে না। বরং, ফলাফলটি একটি বন্ধ চক্রের ইনপুট হবে যার ফলে একটি স্বয়ংক্রিয় সিস্টেম তার কর্মক্ষমতা উন্নত করে।

বন্ধ সিস্টেম

এটি শন ইস্টার এর উত্তরের সাথে সামঞ্জস্যপূর্ণ, তবে আমি কেবল এটিই জোর দিতে চাই যে বাণিজ্যিক অ্যাপ্লিকেশনগুলিতে একটি মেশিন ফলাফলগুলি দেখছে এবং সেগুলিতে অভিনয় করছে । এর সর্বোত্তম উদাহরণ হ'ল সিনেমা ম্যাচ অ্যালগরিদম যা নেটফ্লিক্স পুরষ্কারের লক্ষ্য ছিল। একজন মানুষ সিনেমা ম্যাচের আউটপুটটি দেখতে এবং চলচ্চিত্র দর্শকদের সম্পর্কে আকর্ষণীয় বৈশিষ্ট্যগুলি জানতে পারে। তবে এর অস্তিত্বই নেই। সিনেমাম্যাচের উদ্দেশ্য হ'ল এমন একটি প্রক্রিয়া সরবরাহ করা যার মাধ্যমে নেটফ্লিক্স সার্ভারগুলি গ্রাহকদের কাছে চলচ্চিত্র উপস্থাপন করতে পারে যা তারা উপভোগ করবেন। পরিসংখ্যানের মডেলটির আউটপুট প্রস্তাবক পরিষেবায় যায় যা গ্রাহকদের রেট সিনেমা হিসাবে শেষ পর্যন্ত আরও ইনপুট তৈরি করে, যার মধ্যে কয়েকটি সিনেমা ম্যাচের পরামর্শে নির্বাচিত হয়েছিল।

মুক্ত ব্যবস্থা

অন্যদিকে, যদি কোনও গবেষক পরিসংখ্যানগত ফলাফল তৈরি করতে একটি অ্যালগরিদম ব্যবহার করেন যা অন্য মানুষের কাছে উপস্থাপনায় প্রদর্শিত হয়, তবে সেই গবেষক সবচেয়ে সিদ্ধান্ত নিয়ে মেশিন লার্নিংয়ে নিযুক্ত হন না । এটি আমার কাছে স্পষ্টতই মানবশিক্ষা । বিশ্লেষণটি একটি মেশিন দ্বারা সম্পাদিত হয়, তবে এটি কোনও মেশিন নয় যা শিখছে , এখন, এটি "মেশিন লার্নিং" এমনভাবে হয়েছে যে কোনও মানব মস্তিষ্ক সমস্ত নমুনা ইনপুট অনুভব করতে পারেনি এবং পরিসংখ্যানগত ফলাফলগুলি "জৈবিকভাবে" পান না। তবে আমি এটিকে "পরিসংখ্যান" বলব কারণ ক্ষেত্রটি আবিষ্কারের পর থেকেই পরিসংখ্যানবিদরা ঠিক এটাই করছেন।

উপসংহার

সুতরাং, আমি এই প্রশ্নের উত্তর দিয়ে বলব: "ফলাফলগুলি কে গ্রাস করে?" যদি উত্তরটি হয়: "মানুষ", তবে এটি "পরিসংখ্যান"। যদি উত্তরটি হয়: "সফ্টওয়্যার", তবে এটি "মেশিন লার্নিং"। এবং যখন আমরা বলি যে "সফ্টওয়্যার ফলাফলগুলি গ্রাস করে", তখন আমাদের অর্থ এই নয় যে এটি পরে পুনরুদ্ধারের জন্য এটি কোথাও সঞ্চয় করে। আমরা বলতে চাইছি এটি এমন আচরণ করে যা বন্ধ লুপের ফলাফল দ্বারা নির্ধারিত হয়


8
এটি একটি যুক্তিসঙ্গত বিষয়, তবে আমি মনে করি অনুশীলনে এমএল মডেলগুলি প্রায়শই লোকদের কাছে ব্যাখ্যা এবং কাজ করার জন্য তুলে দেওয়া হয়।
গাং

1
আমি এটি বলব কারণ এমএল একটি ক্ষেত্র হিসাবে পরিসংখ্যানবিদদের দ্বারা বিভিন্ন ধরণের দরকারী সরঞ্জাম উত্সাহিত করেছে , এমনকি যদি তারা নিজেরাই কল করতে চায় না, বিপণনের উদ্দেশ্যে। ;)
লনমাওয়ার ম্যান

আমি @ গুং এর সাথে দৃ strongly়ভাবে একমত; অন্যান্য উত্তরের অনুরূপ, আমি সম্মত হই যে এটি প্রায়শই এমন লোকদের অনুপ্রেরণা যারা নিজেকে "এমএল গবেষক" বলেছেন, এটি অবশ্যই একটি সংজ্ঞায়িত রেখা নয়। দুটি পাল্টা উদাহরণ: সুপারিশকারী সিস্টেমগুলিকে একটি এমএল গবেষণা অঞ্চল হিসাবে বিবেচনা করা হয়, তবে ফলাফলগুলি সরাসরি মানুষের কাছে খাওয়ানো হয়। কলম্যান ফিল্টারগুলি প্রায়শই অটো-পাইলটগুলির জন্য নেভিগেশনে ব্যবহৃত হয়, লুপে কোনও মানুষ না থাকলেও সাধারণত একটি পরিসংখ্যান পদ্ধতি হিসাবে বিবেচিত হয়।
ক্লিফ এবি

-1

আমার মতে, কোনও মেশিন কিছু ডেটা ব্যবহার করে কিছু মডেলের পরামিতিগুলি নির্ধারণ করার জন্য প্রোগ্রাম করা হলে মেশিন লার্নিংয়ের কথা বলতে পারে।

যদি কোনও লিনিয়ার রিগ্রেশন মেশিন দ্বারা করা হয়, তবে এটি যোগ্যতা অর্জন করে।

যদি হাত দিয়ে করা হয়, তবে তা হয় না।

যে কোনও সংজ্ঞা (এক্সেলের মতো) বা পুনরাবৃত্তিমূলক উন্নতি (উপরে শন ইস্টার পরামর্শ দেয়) এর বিস্তৃতকরণগুলি সংজ্ঞাগুলি কোনওভাবে এটিকে পরিসংখ্যান থেকে আলাদা করার চেষ্টা করছে বা ফলাফলগুলি কী করবে তার উপর নির্ভর করে আমার মতে এটি বেমানান প্রমাণিত হবে।


3
সুতরাং আপনি যদি রিগ্রেশন, বা কেএনএন, বা সিদ্ধান্ত গাছ গণনা করে কাগজ এবং পেন্সিল ব্যবহার করে এবং কম্পিউটারে গণনা করা একই ফলাফল পান তবে প্রথম ক্ষেত্রে এটি একটি মেশিন লার্নিং এবং দ্বিতীয় ক্ষেত্রে না ..? অন্যদিকে, আপনি যদি কোনও কম্পিউটারকে এলোমেলোভাবে আপনার মডেলটির "পরামিতি" হিসাবে কিছু মান নির্ধারণ করতে ব্যবহার করেন , তবে এটি কোনও মেশিন দ্বারা সম্পন্ন হওয়ার পরে আপনি কী এটিকে মেশিন লার্নিং হিসাবে যোগ্যতা অর্জন করবেন? এই সংজ্ঞাটি তেমন বুদ্ধিমান বলে মনে হচ্ছে না ...
টিম

আপনি যদি কোনও মেশিন ব্যবহার না করেন তবে আপনি এটিকে মেশিন লার্নিংয়ের কথা বলতে পারেন। এটি মেশিনই শিখেছে, সর্বোপরি। এবং আমি আসলে এমন মডেল মোতায়েন করেছি যা এলোমেলো (মন্টি কার্লো) প্রক্রিয়া দ্বারা তাদের পরামিতিগুলি "শিখেছে"। যাইহোক, আমি অবশ্যই স্বীকার করব যে পরে একটি বৈধতা পদক্ষেপ জড়িত ছিল।
Ytsen de Boer

2
সাপোর্ট ভেক্টর মত আলগোরিদিম মেশিন ঐতিহাসিক কারণে "মেশিন" হিসাবে বলা হয়, কারণ প্রথম দিন মানুষের প্রকৃত মেশিন / কম্পিউটার তাদের (চালানোর জন্য গড়ে তুলতে হবে stats.stackexchange.com/questions/261041/... ), এটা আছে কিছুই করতে "মেশিনে চালিত অ্যালগরিদম" দিয়ে করুন। অধিকন্তু, Arima মত সময়-সিরিজ মডেল আছে না মেশিন লার্নিং, কিন্তু পরিসংখ্যান সুযোগ, এবং তারা হয় কম্পিউটারে চালানো।
টিম
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.