মেশিন লার্নিংয়ের জন্য নীতিগত ও গাণিতিক তত্ত্বগুলি কেন এত গুরুত্বপূর্ণ?


25

আমি ভাবছিলাম, নীতিগত / তাত্ত্বিক মেশিন লার্নিং কেন এত গুরুত্বপূর্ণ? একজন মানুষ হিসাবে ব্যক্তিগত দৃষ্টিকোণ থেকে, আমি বুঝতে পারি যে মূলত মেশিন লার্নিং কেন গুরুত্বপূর্ণ হবে:

  • মানুষ তারা কী করছে তা বোঝার মতো, আমরা বোঝার জন্য সৌন্দর্য এবং সন্তুষ্টি পাই।
  • তত্ত্বের দৃষ্টিকোণ থেকে গণিত মজাদার
  • যখন এমন নীতি থাকে যা জিনিসগুলির নকশাকে গাইড করে, এলোমেলো অনুমান করা, অদ্ভুত পরীক্ষা এবং ত্রুটি করার জন্য কম সময় ব্যয় হয়। যদি আমরা বুঝতে পারি, বলুন, স্নায়বিক জালগুলি কীভাবে সত্যিই কাজ করে, আমরা এখনই এটির মধ্যে প্রচুর পরিমাণে পরীক্ষা এবং ত্রুটির চেয়ে আরও বেশি ভাল সময় ব্যয় করতে পারি।
  • অতি সম্প্রতি, যদি নীতিগুলি পরিষ্কার হয় এবং তত্ত্বটিও পরিষ্কার হয় তবে সিস্টেমে আরও আশাবাদী হওয়া উচিত (আশাবাদী)। এটি ভাল কারণ কারণ যদি আমরা বুঝতে পারি যে সিস্টেমটি কী কাজ করছে, তবে এআই ঝুঁকি নিয়েছে যে প্রচুর লোকেরা প্রায়শই হাইপাই করে তাৎক্ষণিকভাবে চলে যায়।
  • নীতিগুলি বিশ্বে যে গুরুত্বপূর্ণ কাঠামো থাকতে পারে এবং যখন অন্যটির পরিবর্তে কোনও সরঞ্জাম কখন ব্যবহার করা যায় তার সংক্ষিপ্ততর একটি উপায় বলে মনে হয়।

তবে, এই কারণগুলি কি মেশিন লার্নিংয়ের একটি তীব্র তাত্ত্বিক অধ্যয়নকে ন্যায়সঙ্গত করার পক্ষে যথেষ্ট শক্তিশালী? তত্ত্বের বৃহত্তম সমালোচনাগুলির মধ্যে একটি হ'ল এটি করা এত কঠোর হওয়ায় তারা সাধারণত কিছু খুব সীমাবদ্ধ কেস অধ্যয়ন করে বা অনুমিতিগুলি আনতে হয় যা মূলত ফলাফলকে অকেজো করে তোলে। আমার মনে হয় টরের স্রষ্টা এমআইটি-তে একটি আলাপে আমি এটি একবার শুনেছি। টরের তিনি যে সমালোচনা শুনেছেন তার মধ্যে কিছু তাত্ত্বিক যুক্তি কিন্তু মূলত, মানুষ কখনই বাস্তব জীবনের বাস্তব পরিস্থিতি সম্পর্কে জিনিস প্রমাণ করতে সক্ষম হয় না কারণ এগুলি এত জটিল।

এত নতুন কম্পিউটিং শক্তি এবং ডেটা সহ এই নতুন যুগে আমরা আমাদের মডেলগুলিকে বাস্তব ডেটা সেট এবং পরীক্ষা সেট দিয়ে পরীক্ষা করতে পারি। আমরা অভিজ্ঞতাবাদ ব্যবহার করে জিনিসগুলি কাজ করে কিনা তা দেখতে পারি। যদি আমরা পরিবর্তে এজিআই বা ইঞ্জিনিয়ারিং এবং অভিজ্ঞতাবাদ নিয়ে কাজ করে এমন সিস্টেমগুলি অর্জন করতে পারি তবে কী এখনও মেশিন লার্নিংয়ের জন্য নীতিগত এবং তাত্ত্বিক ন্যায়সঙ্গততা অনুসরণ করা মূল্যবান, বিশেষত যখন পরিমাণগত সীমাগুলি অর্জন করা খুব কঠিন, তবে অন্তর্দৃষ্টি এবং গুণগত উত্তরগুলি এত সহজ একটি ডেটা চালিত পদ্ধতির সাথে অর্জন? শাস্ত্রীয় পরিসংখ্যানগুলিতে এই পদ্ধতির উপলব্ধ ছিল না, এ কারণেই আমি মনে করি ততকালে তত্ত্বটি এত গুরুত্বপূর্ণ ছিল, কারণ গণিতই ছিল একমাত্র উপায় যে আমরা নিশ্চিত হতে পারি যে জিনিসগুলি সঠিক ছিল বা তারা যেভাবে আমাদের ধারণা করেছিল যেভাবে তারা কাজ করেছিল।

আমি ব্যক্তিগতভাবে সর্বদা ভালবাসি এবং তত্ত্বটি চিন্তা করেছি এবং একটি নীতিগত পদ্ধতির গুরুত্বপূর্ণ ছিল। তবে সত্যিকারের ডেটা এবং কম্পিউটারের শক্তি দিয়ে জিনিসগুলি চেষ্টা করে দেখার ক্ষমতাটি আমাকে অবাক করে দিয়েছে যে তাত্ত্বিক অনুসরণের উচ্চতর প্রচেষ্টা (এবং সম্ভাব্য কম পুরষ্কারগুলি) এখনও এটি মূল্যবান কিনা।

মেশিন লার্নিংয়ের তাত্ত্বিক এবং নীতিগত অনুসরণ কি সত্যিই গুরুত্বপূর্ণ?


"তত্ত্ব ব্যতীত, আপনি এই আশার উপর নির্ভর করছেন যে আপনি এমএল পদ্ধতি প্রয়োগ করবেন এমন কোনও নতুন ডেটাসেটের ক্ষেত্রে গবেষণামূলক ফলাফল প্রযোজ্য However তবে, আপনার অনুশীলনমূলক ফলাফলগুলি পর্যবেক্ষণ করার সময় ঘটেছিল এমন কিছু সম্পত্তি বা অনুমানগুলি সম্ভবত এগিয়ে যাওয়ার সম্ভাবনা নেই might নতুন ডেটাসেটে। "
চার্লি পার্কার

উত্তর:


17

এর সঠিক কোনও উত্তর নেই তবে, "মডারেশনে সমস্ত কিছু" maybe যদিও মেশিন লার্নিংয়ে সাম্প্রতিক অনেকগুলি উন্নতি হয়েছে, যেমন, ড্রপআউট, রেসিডুয়াল সংযোগ, ঘন সংযোগ, ব্যাচের সাধারণীকরণ বিশেষভাবে গভীর তত্ত্বের মধ্যে নিহিত নয় (বেশিরভাগ কয়েকটি অনুচ্ছেদে ন্যায্যতা পাওয়া যেতে পারে), আমি মনে করি অবশেষে ঠিক কতটির জন্য একটি বাধা রয়েছে think যেমন ফলাফল একটি বিশাল প্রভাব ফেলতে পারে। পরবর্তী সময়ে বড় লাফিয়ে উঠতে আপনাকে কিছু সময় বসে কিছু অতিরিক্ত তত্ত্ব নিয়ে কাজ করতে হবে। তত্ত্ব ততই অন্তর্দৃষ্টি নির্দেশ করতে পারে কারণ এটি কোনও মডেলের গুণগত মান বা সীমাবদ্ধতা যুক্তিসঙ্গত সন্দেহের মধ্যে প্রমাণ করতে পারে। এটি যদি বিশেষভাবে বোঝার জন্য গুরুত্বপূর্ণ হয় তবে কোনও বিশেষ সমস্যার জন্য এসজিডি গতিবেগের চেয়ে ভাল। এটি তত্ত্ব সম্পর্কে দুর্দান্ত জিনিস: এটি আপনি যে সমস্যার সমাধান করছেন তা বিমূর্ত করতে বাধ্য করে,

মনে আসে যে বড় উদাহরণ হ'ল সমর্থন ভেক্টর মেশিন। এগুলি মূলত 60 এর দশকের গোড়ার দিকে ভ্যাপনিক এবং চেরভোনেনকিসের দ্বারা তৈরি হয়েছিল তবে 90 এর দশকের গোড়ার দিকে ভ্যাপনিক এবং অন্যরা বুঝতে পেরেছিল যে আপনি কার্নেল ট্রিক ব্যবহার করে ননলাইনার এসভিএম করতে পারেন। ভ্যাপনিক এবং চেরভোনেনকিসও ভিসি মাত্রার পিছনে তত্ত্বটি তৈরি করেছিলেন, যা মেশিন লার্নিংয়ের জন্য জটিলতা পরিমাপের চেষ্টা করার চেষ্টা an আমি ভিসি মাত্রার কোনও ব্যবহারিক প্রয়োগের কথা ভাবতে পারি না, তবে আমি মনে করি এসভিএমগুলির ধারণাটি সম্ভবত এ সম্পর্কে তাদের কাজ দ্বারা প্রভাবিত হয়েছিল। কার্নেল ট্রিক নিজেই হিলবার্ট স্পেসগুলি সম্পর্কে বিমূর্ত-অজ্ঞান গণিত থেকে আসে। এটি একটি প্রসারিত কথা হতে পারে যে এসভিএমগুলি নিয়ে আসা এই বিমূর্ত বাজে কথাগুলি জানা দরকার, তবে, আমি মনে করি এটি সম্ভবত বেশ খানিকটা সাহায্য করেছে, বিশেষত কারণ এটি প্রচুর গণিতবিদ মেশিন লার্নিং সম্পর্কে উত্তেজিত হয়েছিলেন।

রেসনেট সম্পর্কিত বিষয়ে সম্প্রতি কিছুটা ঝরঝরে কাজ হয়েছে যা সুপারিশ করেছে যে রেসিডুয়াল আর্কিটেকচারগুলিকে সত্যিই 100s স্তর গভীর হতে হবে না। আসলে কিছু কাজের পরামর্শ দেয় যে অবশিষ্টাংশের সংযোগগুলি আরএনএনগুলির সাথে খুব মিল, উদাহরণস্বরূপ রেসিডুয়াল লার্নিং, রিকরেন্ট নিউরাল নেটওয়ার্কস এবং ভিজ্যুয়াল কর্টেক্সের মধ্যে গ্যাপগুলি ব্রিজ করা ", লিয়াও এট আল। আমি মনে করি এটি অবশ্যই এটি গভীরতর দিকে তাকাতে উপযুক্ত করে তোলে কারণ এটি প্রস্তাব দেয় যে তাত্ত্বিকভাবে, অনেক স্তর সহ রেসনেট আসলে অবিশ্বাস্যভাবে অক্ষম এবং ফুলে যায়।

আরএনএনগুলির জন্য গ্রেডিয়েন্ট ক্লিপিংয়ের ধারণাগুলি এখন বিখ্যাত কাগজে " পুনরাবৃত্ত নিউরাল নেটওয়ার্কগুলির প্রশিক্ষণের অসুবিধায়" - খুব ভালভাবে ন্যায়সঙ্গত ছিল - পাসকানু, ইত্যাদি। অল। আপনি সম্ভবত সমস্ত তত্ত্ব ছাড়াই গ্রেডিয়েন্ট ক্লিপিং নিয়ে আসতে পেরেছিলেন বলে আমি মনে করি যে আরএনএনগুলি কেন অভিনব কিছু না করে প্রশিক্ষণ দেওয়া এত কঠিন, বিশেষত গতিশীল সিস্টেমের মানচিত্রের উপমাগুলি আঁকিয়ে (যেমন উপরের কাগজটিতে আছে )।

এন্ট্রপি স্টোকাস্টিক গ্রেডিয়েন্ট বংশোদ্ভূত পদ্ধতি সম্পর্কে প্রচুর উত্তেজনা রয়েছে । এগুলি ল্যাঙ্গভিনের গতিবিদ্যা থেকে উদ্ভূত হয়েছিল এবং তাত্ত্বিক ফলাফলগুলির বেশিরভাগই ক্লাসিকাল তাত্ত্বিক পিডিই তত্ত্ব এবং পরিসংখ্যান পদার্থবিদ্যায় দৃ in়রূপে প্রতিষ্ঠিত। ফলাফলগুলি আশাব্যঞ্জক, কারণ তারা কীভাবে লোকসানের কার্যকারণের স্থানীয় ওঠানামাগুলিতে আটকা পড়ে এবং কীভাবে স্থানীয়ভাবে লোকসান ফাংশনটি এসজিডিকে আরও কার্যকর করা যায় সেই লক্ষ্যে লোকসান কার্যকারিতাটি মসৃণ করতে পারে তার পরিপ্রেক্ষিতে তারা একটি নতুন আলোকে এসজিডিটিকে castালাল। এসজিডি কখন কার্যকর হয় এবং কখন এটি খারাপ ব্যবহার করে না তা বোঝার দিকে অনেক এগিয়ে যায়। এটি বিভিন্ন ধরণের মডেলগুলিতে এসজিডি চেষ্টা করে আপনি অভিজ্ঞতা অর্জন করতে পারেন এমন নয়।

স্নায়বিক নেটওয়ার্কগুলির আকর্ষণীয় বৈশিষ্ট্যগুলিতে গবেষণাপত্রের সংক্ষিপ্ত বিবরণে লেখকরা সংক্ষিপ্ত বিবরণ দিয়েছেন যে নিউরাল নেটওয়ার্কগুলি স্তরগুলির মধ্যে উচ্চ লিপচিটজ ধ্রুবকগুলির কারণে বিপরীত উদাহরণগুলিতে সংশ্লেষিত (গণনা হিসাবে চিহ্নিত, একটি চিত্রের নাইট পার্টরব্যাবেশানগুলি) are এটি এখনও গবেষণার একটি সক্রিয় ক্ষেত্র এবং আরও তাত্ত্বিক উত্স থেকে কেবল আরও ভাল বোঝা যায়।

টপোলজিকাল ডেটা বিশ্লেষণের উদাহরণও রয়েছে , যার চারপাশে কমপক্ষে একটি সংস্থা ( আয়াসদী ) গঠিত হয়েছে has এটি একটি বিশেষ আকর্ষণীয় উদাহরণ কারণ এর জন্য ব্যবহৃত কৌশলগুলি এত সুনির্দিষ্ট এবং বিমূর্ত যা এই তত্ত্ব থেকে আসা ধারণাগুলি কোথায় শেষ হয়েছে তা এখনও দেখতে অনেক বেশি সময় লাগবে। আমার বোধগম্যতা হল যে জড়িত অ্যালগরিদমগুলির গণনাগত জটিলতা বেশ উচ্চতর থাকে (তবে তারপরে এটি আবার 20 বছর পূর্বে এমনকি নিউরাল নেটওয়ার্কগুলির জন্যও সমানভাবে বেশি ছিল)।


7

এই প্রশ্নের উত্তর আসলে খুব সহজ। মেশিন লার্নিং মডেলের পিছনে তাত্ত্বিক ন্যায়সঙ্গততার সাথে আমরা কমপক্ষে প্রমাণ করতে পারি যে যখন আরও কম বা কম বাস্তব পরিস্থিতি পূরণ করা হয়, সমাধানের জন্য অনুকূলতার কিছু গ্যারান্টি রয়েছে। এটি ছাড়া, আমাদের যা কিছু আছে তার কোনও গ্যারান্টি নেই। অবশ্যই, আপনি বলতে পারেন "আসুন কেবল কী কাজ করে তা পরীক্ষা করে দেখুন এবং নির্দিষ্ট সমস্যার জন্য এটি ব্যবহার করুন" তবে এটি সম্ভাব্য নয় কারণ আপনি যে কোনও মেশিন লার্নিং সমস্যার সমাধান করতে পারবেন এমন উপায়ের অসীম সংখ্যা রয়েছে।

বলুন যে আপনি কিছু প্রদান করে কিছু পূর্বাভাস দিতে চান । আপনি কীভাবে জানবেন যে এটি সমাধানের সর্বোত্তম উপায় নয়? সম্পর্কে কী ? অথবা, ? সম্ভবত আপনার পূর্বাভাস হিসাবে ফেরত ? অথবা যদি বিজোড় হয় তবে ব্যবহার করুন এবং অন্যথায় ফেরত দিন ? অবশ্যই, এই সমস্ত পরামর্শ অযৌক্তিক মনে হলেও আপনি কীভাবে নিশ্চিত হতে পারেন যে কোনও তত্ত্ব ব্যতীত সেগুলির একটি অনুকূল নয়? অসীম সংখ্যক সম্ভাব্য সমাধানের সাথে, এমনকি সহজতম সমস্যাটিও অবিশ্বাস্য হয়ে যায়। থিওরি কিছু শ্রেণীর সমস্যাগুলির জন্য সম্ভাব্য মডেলগুলির "অনুসন্ধানের স্থান" সীমাবদ্ধ করে (আপনি জানেন যে কোন মডেলগুলি বিবেচনার জন্য উপযুক্ত এবং কোনটি নয়)।ওয়াইএক্সএক্স+ +42এক্স+ +42.5এক্স-4242এক্সএক্স+ +420


2
আপনার প্রশিক্ষিত মডেলটি বৈধতা এবং পরীক্ষার সেটগুলিতে পর্যাপ্ত পরিমাণে কাজ করে না তা চেক করছে? তাত্ত্বিক সীমাগুলির কি গ্যারান্টি রয়েছে তার মতো যদি তাদের সীমাটি ব্যবহার না করা যায়?
চার্লি পার্কার

6
এক্স+ +(-,)

5

কেবলমাত্র প্রশ্নটি দেখছেন: মেশিন লার্নিংয়ের তাত্ত্বিক এবং নীতিগত অনুসরণ কি সত্যিই গুরুত্বপূর্ণ?

"গুরুত্বপূর্ণ" দ্বারা আপনি কী বোঝাতে চান তা নির্ধারণ করুন। দার্শনিক দৃষ্টিকোণ থেকে আসা যদি আপনি কিছু বর্ণনা করতে বা কিছু বুঝতে চান তবে এটি একটি মৌলিক পার্থক্য। কিছুটা অপরিষ্কার উত্তরে এটি বৈজ্ঞানিক বা অন্য কিছু হওয়ার মধ্যে পার্থক্য। এর ব্যবহারিক অংশটি অন্তর্নিহিত প্রশ্নের জন্য কোনও উদ্বেগের নয়। যদি কোনও কিছু প্রমাণ করা খুব কঠিন হয় বা নিজের মধ্যে এটি প্রমাণ করাও অসম্ভব তবে এটি একটি গুরুত্বপূর্ণ আবিষ্কার। (গোয়েদেল এট লিখুন।) তবে এর অর্থ এটি অপ্রাসঙ্গিক নয়। এটি কমপক্ষে বাস্তবের দৃষ্টিকোণ থেকে অপ্রাসঙ্গিক বলে মনে হতে পারে। তবে এটি অন্তত প্রধান গুরুত্ব এবং মান হিসাবে চিহ্নিত করা উচিত।

একটি উপমা বিবেচনা করুন: সামগ্রিকভাবে চিকিত্সা (এবং এর অতীত থেকে) বৈজ্ঞানিক নয়। নির্দিষ্ট উপায়ে এটি আসলে কখনই হতে পারে না। এটি সম্পূর্ণরূপে এর ফলাফল দ্বারা পরিচালিত একটি শৃঙ্খলা। বেশিরভাগ ক্ষেত্রে "সত্য" এর মতো কিছুই নেই। তবে দেখা যাচ্ছে যে কিছু অংশ আসলে বৈজ্ঞানিক হতে পারে - এবং এখানেই বেশিরভাগ পরিকল্পিত অগ্রগতি ঘটছে।

আর একটি অত্যন্ত সংক্ষিপ্ত বিবরণ হতে পারে: তত্ত্ব ব্যতীত আপনি প্রচুর অর্থোপার্জন করতে পারেন। যদি এটি "বৃহত্তর ভাল" জন্য সত্যিই কার্যকর হয় তবে আপনি এমনকি এটির জন্য নোবেল পুরষ্কার পেতে পারেন। তবে আপনি কখনই ফিল্ডস মেডেল পাবেন না।


1
+1 আমি এটি ওপি-র একটি আকর্ষণীয় উত্তর খুঁজে পাই, তবে আপনাকে চিকিত্সাবিহীন হিসাবে বৈজ্ঞানিক হিসাবে ব্যাখ্যা করতে বলব। রোগীকে কী অসুস্থ করছে তা নির্ধারণের প্রক্রিয়াটি কী নয়, এমন একটি প্রক্রিয়া যেখানে ডিফারেন্সিয়াল ডায়াগনোসিস (সন্দেহযুক্ত রোগের একটি তাত্ত্বিক ধারণা) ধারণা করা হয়, এবং কোন রোগটি সবচেয়ে বেশি সম্ভাব্য তা অনুমান করার জন্য ডেটা সংগ্রহ করা হয়? ...
আইডব্লিউএস

(নিয়মিত) ... সেখানে কি কোনও অগ্রগতি নেই, যেখানে চিকিত্সকরা উপলভ্য তথ্যের উপর ভিত্তি করে রোগের ভবিষ্যতের কোর্সটি অনুমান করার চেষ্টা করেন যা সাধারণত হতে পারে এবং অনুসরণীয় এবং অভিজ্ঞতা দ্বারা অনুসন্ধান করা হয়? এবং পরিশেষে, বিজ্ঞান কি কিছু উচ্চতর কিন্তু বিদ্যমান সত্যের সন্ধান, বা আমরা সত্যের একটি নির্মাণের অনুমান করি যা আমরা বিশ্বাস করি যে এটি বর্তমানে উপস্থিত রয়েছে?
আইডব্লিউএস

আসলে ওষুধের প্রশ্নটি আরও গভীর হয় runs বিজ্ঞান মূলত একটি পদ্ধতি বা একটি প্রক্রিয়া। বিজ্ঞানের "কাজ করতে" আপনাকে মিথ্যা বলার অন্তর্নিহিত সম্ভাবনার সাথে সমান স্থানে অনুমানের পরীক্ষা করার দক্ষতা থাকতে হবে। সংক্ষেপে: আপনি যদি কোনও তত্ত্বকে ভুল প্রমাণ করতে না পারেন তবে এটি বৈজ্ঞানিক। ওষুধের জন্য এটি অনেক অনেক নৈতিক প্রভাব ফেলেছে এবং যেহেতু আপনি একই বিকল্প সময়ে একই বিকল্পের সাথে বিভিন্ন বিকল্পের সাথে চিকিত্সা করতে পারবেন না অনুমানের পরীক্ষা করা সত্যিই কঠিন। [...]
চাঁদের কণা

দ্বিতীয় অংশ (সত্যের সন্ধান হিসাবে বিজ্ঞান) সম্পর্কিত - আবার, এটি কেবল একটি পদ্ধতি। এটি মানব জাতির সবচেয়ে সফল পদ্ধতি বলে মনে হচ্ছে। তবে এটি বিশ্বাসের ভিত্তিতে নয়, এটি তথ্যের উপর ভিত্তি করে। এবং কিছু উপায়ে এটি একটি বদ্ধ সিস্টেমও। সত্য এবং নির্মানের মধ্যে কোনও (বৈজ্ঞানিক) পার্থক্য নেই যা দেখতে একই রকম দেখা যায়। বিজ্ঞানীদের মধ্যে চুক্তি আপনাকে থাম্বের কিছু বিধি দিতে পারে (উদাঃ ওকামস রেজার), তবে বিজ্ঞান অ-বিজ্ঞানের সমুদ্রগুলিতে কোনও কম্পাস নয়।
চাঁদের কণা

5

মানুষ পদার্থবিজ্ঞানের আইন ছাড়াই বহু শতাব্দী ধরে জাহাজ, গাড়ি এবং ভবন নির্মাণ করতে সক্ষম হয়েছে। তবে আধুনিক বিজ্ঞান থেকে, আমরা সেই প্রযুক্তিগুলি পুরো নতুন স্তরে নিয়ে যেতে সক্ষম হয়েছি। একটি প্রমাণিত তত্ত্ব মূলত পদ্ধতিতে উন্নতি করতে দেয়। আমরা কখনই চাঁদে এটি তৈরি করতে পারতাম না বা ম্যাটারামিকিক এবং গণনার গাণিতিক তত্ত্ব ছাড়া কম্পিউটার থাকতাম না।

মেশিন লার্নিং অন্য যেহেতু বিজ্ঞান এবং প্রকৌশলের অন্য একটি ক্ষেত্র। মেশিন লার্নিংয়ের একটি নীতিগত পন্থা আমাদের কর্নেল মেশিন, কাঠামোগত শেখা, এবং নকশাকৃত পদ্ধতি (বুস্টিং, এলোমেলো বন) সরবরাহ করে।


5

এখানে আমার নিজের কাজ থেকে একটি সাধারণ উদাহরণ।

অবিচ্ছিন্ন ফলাফলের জন্য আমি অনেক স্নায়বিক জাল ফিট করি। এক ব্যাকপ্রসারণ দ্বারা ওজন নির্ধারণ করে। শেষ পর্যন্ত, এটি একত্রিত হবে।

(একজনটিএকজন)-1একজনটিY
একজনY

আমার নেট দ্রুত গতিতে রূপান্তরিত করে ।

ধন্যবাদ, তত্ত্ব।


3

অভিজ্ঞতাবাদ বনাম থিওরি

তুমি লিখেছিলে:

তত্ত্বের বৃহত্তম সমালোচনাগুলির মধ্যে একটি হ'ল এটি করা এত কঠোর হওয়ায় তারা সাধারণত কিছু খুব সীমাবদ্ধ কেস অধ্যয়ন করে বা অনুমিতিগুলি আনতে হয় যা মূলত ফলাফলকে অকেজো করে তোলে।

এই আমি মনে করি দুটি ভিউ যা আমরা কল করতে পারেন মধ্যে মূল ডিভাইড প্রমান গবেষণামূলক এবং তাত্ত্বিক

একটি অভিজ্ঞতাগত দৃষ্টিকোণ থেকে, আপনি যেমন বর্ণনা করেছেন তত্ত্বগুলি অকেজো কারণ তারা সত্যিকারের বিশ্বের মডেল করার পক্ষে কখনও জটিল নয়। তারা সরলীকৃত আদর্শ পরিস্থিতি সম্পর্কে কথা বলেন যা বাস্তব বিশ্বের কোথাও প্রযোজ্য না। তাই থিওরি করার বিষয়টি কী?

তাত্ত্বিক দৃষ্টিকোণ থেকে তবে বিপরীতটি সত্য। "আমি এই ডেটাসেটটিতে এই পদ্ধতিটি চালিয়েছি এবং এই একই ডেটাসেটে অন্য পদ্ধতিটি চালানোর চেয়ে এটি ভাল ছিল" এর বাইরেও কী অভিজ্ঞতা আমাদের শিক্ষা দিতে পারে? এটি একটি উদাহরণের জন্য দরকারী তবে সমস্যাটি সম্পর্কে খুব সামান্যই বলেছেন।

তত্ত্বটি যা করে তা কিছু গ্যারান্টি দেয়। এটি আমাদের সরলীকৃত পরিস্থিতিগুলিও ঠিকঠাক অধ্যয়ন করার অনুমতি দেয় যাতে আমরা কী চলছে তা বুঝতে শুরু করতে পারি।

উদাহরণ

একটি বাস্তব উদাহরণটি কল্পনা করুন: আপনি দেখতে চান কীভাবে ধারণা ড্রিফ্ট (যখন সময়ের সাথে সাথে ডেটা পরিবর্তন হয়) আপনার শেখার ক্ষমতাকে প্রভাবিত করে। একজন খাঁটি অভিজ্ঞতাবাদী কীভাবে এই প্রশ্নে যোগাযোগ করবেন? তিনি যা করতে পারেন তা হ'ল বিভিন্ন পদ্ধতি প্রয়োগ করা শুরু করা এবং তিনি কী করতে পারেন সেই কৌশল সম্পর্কে চিন্তাভাবনা করা। পুরো পদ্ধতিটি এর অনুরূপ হতে পারে:

  • গত 300 দিন সময় নিন এবং সেই পরিবর্তনশীলটির গড় পরিবর্তন হয়েছে কিনা তা সনাক্ত করার চেষ্টা করুন। ঠিক আছে কিছুটা কাজ করেছে।
  • আমরা যদি এর পরিবর্তে 200 দিন চেষ্টা করি?
  • ঠিক আছে আরও ভাল, একবার ড্রিফট দেখা দিলে অ্যালগরিদম পরিবর্তন করার চেষ্টা করি।
  • আরও ডেটাসেটগুলি পান এবং দেখুন এখন পর্যন্ত কোন পদ্ধতিটি বিকশিত হয়েছে তা সবচেয়ে ভাল কাজ করে।
  • ফলাফলগুলি চূড়ান্ত নয়, সম্ভবত অনুমান করুন যে একাধিক ধরণের কনসেপ্ট ড্রিফট চলছে?
  • সিমুলেশন চেষ্টা করুন। যদি আমরা কিছু ধারণা প্রবাহ অনুকরণ করি এবং তারপরে পরিবর্তন এসেছে কিনা তা সনাক্ত করতে বিভিন্ন দিন ব্যবহার করে বিভিন্ন পদ্ধতি প্রয়োগ করি।

আমাদের এখানে যা আছে তা কয়েকটি ডেটা সেটে বেশ সুনির্দিষ্ট ফলাফল। সম্ভবত ডেটা এমন ছিল যাতে ২০০ অতীত দিনের পর্যবেক্ষণের ভিত্তিতে শিক্ষার অ্যালগরিদম আপডেট করা সর্বোচ্চ নির্ভুলতা দেয় gave কিন্তু অন্যান্য ডেটার জন্য একই কাজ করবে? এই 200 দিনের অনুমানটি কতটা নির্ভরযোগ্য? সিমুলেশনগুলি সহায়তা করে - তবে তারা বাস্তব বিশ্বের প্রতিফলিত করে না - একই সমস্যা তত্ত্বটি ছিল।

এখন তাত্ত্বিক দিক থেকে একই ধারণা করুন:

  • দৃ scenario়তাটিকে একটি অযৌক্তিক স্তরে সরল করুন। সময়ের সাথে সাথে হঠাৎ পরিবর্তিত হতে পারে এমন একটি গড় সহ 2-ভেরিয়েটের স্বাভাবিক বিতরণ ব্যবহার করুন।
  • আপনার শর্তাদি পরিষ্কারভাবে চয়ন করুন - মডেলটি বেছে নিন যা সাধারণ ডেটাতে সর্বোত্তম। ধরুন আপনি জানেন যে ডেটা স্বাভাবিক। আপনি যখন জানেন না কেবল তখনই যখন শিফট ইন মানে হয়।
  • শিফটটি কখন ঘটেছে তা সনাক্ত করার জন্য একটি পদ্ধতি ডিভাইস করুন। আবার 200 অতীতের পর্যবেক্ষণ দিয়ে শুরু করতে পারেন।
  • এই সেটিংটির উপর ভিত্তি করে আমাদের শ্রেণিবদ্ধের জন্য গড় ত্রুটি গণনা করতে সক্ষম হওয়া উচিত, পরিবর্তন হয়েছে এবং আপডেট হয়েছে কিনা তা সনাক্ত করতে অ্যালগরিদমের জন্য গড় সময় লাগে। 95% সুযোগ স্তরের মধ্যে সবচেয়ে খারাপ পরিস্থিতি এবং গ্যারান্টি হতে পারে।

এখন এই পরিস্থিতি আরও স্পষ্ট - আমরা সমস্ত বিবরণ ঠিক করে সমস্যাটি আলাদা করতে সক্ষম হয়েছি। আমরা আমাদের শ্রেণিবদ্ধদের গড় ত্রুটি জানি। সম্ভবত পরিবর্তনটি ঘটেছিল তা সনাক্ত করতে কত দিন লাগবে তা অনুমান করতে পারে। এটি কী পরামিতিগুলির উপর নির্ভর করে তা হ্রাস করুন (পরিবর্তনের আকারের মতো)। এবং এখন কিছু উপর ভিত্তি করে একটি ব্যবহারিক সমাধান উত্পাদন। তবে সর্বাধিক গুরুত্বপূর্ণ: এই ফলাফলটি (যদি সঠিকভাবে গণনা করা হয়) অপরিবর্তনীয়। এটি এখানে চিরকাল এবং যে কেউ এ থেকে শিখতে পারে।

আধুনিক মেশিন লার্নিংয়ের অন্যতম পিতাদের মতো - জার্জেন শ্মিধুবার বলতে পছন্দ করেছেন:

হিউরিস্টিকস আসে এবং যায় - উপপাদাগুলি চিরকালীন।

অন্যান্য ক্ষেত্র থেকে পাঠ

এছাড়াও সংক্ষিপ্তভাবে পদার্থবিজ্ঞানের কিছু সমান্তরাল উল্লেখ করতে চেয়েছিলেন। আমার মনে হয় তাদেরও এই দ্বিধা ছিল। পদার্থবিজ্ঞানীরা অসীম জায়গার ভিতরে চলন্ত অসীম ভরগুলির ঘর্ষণহীন বস্তুগুলি অধ্যয়ন করছিলেন। প্রথম নজরে এটি বাস্তবতা সম্পর্কে কী বলতে পারে যেখানে আমরা জানতে চাই যে কীভাবে বাতাসে স্নোফ্লেকগুলি চলে। তবে এটি অনুভব করে যে মতবাদ তাদেরকে অনেক দীর্ঘ পথ বহন করেছিল।


2

আপনি কিছু কারণ উল্লেখ করেছেন, যার মধ্যে এমএল ফলাফলগুলি ব্যাখ্যা করার ক্ষমতা সবচেয়ে গুরুত্বপূর্ণ, আমার মতে। আসুন আমরা বলি যে এআই চালিত সম্পত্তি গার্ড প্রতিবেশীর কুকুরটিকে গুলি করার সিদ্ধান্ত নিয়েছে। এটি কেন এটি করেছে তা বোঝা গুরুত্বপূর্ণ হবে। যদি ভবিষ্যতে এটি না ঘটে, তবে কমপক্ষে কে দায়বদ্ধ এবং কে মালিকের ক্ষতিপূরণ প্রদান করবে তা বুঝতে হবে understand

তবে, আমার কাছে সবচেয়ে গুরুত্বপূর্ণ কারণ হ'ল যে নীতিগুলির ভিত্তিতে অ্যালগরিদম প্রতিষ্ঠিত হয়েছে তা বোঝার ফলে তার সীমাবদ্ধতাগুলি বোঝা যায় এবং এর কার্যকারিতা উন্নত হয়। এমএলিতে ইউক্লিডিয়ান দূরত্বের ব্যবহার বিবেচনা করুন। অনেকগুলি ক্লাস্টারিং অ্যালগরিদমে আপনি উদাহরণের মধ্যকার দূরত্বের সংজ্ঞা দিয়ে শুরু করেন, তারপরে উদাহরণস্বরূপ বৈশিষ্ট্যগুলির মধ্যে সীমানা সন্ধান করুন যা তাদের নৈকট্যকে গোষ্ঠী করে। একবার আপনি বৈশিষ্ট্যের সংখ্যা বাড়িয়ে দিলে, ইউক্লিডিয়ান দূরত্ব কোনও পর্যায়ে কাজ বন্ধ করে দেয়। আপনি এটিকে কাজ করার জন্য প্রচুর সময় ব্যয় করতে পারেন, বা - যদি আপনি জানেন যে নৈকট্য পরিমাপ হিসাবে ইউক্যালিডিয়ান দূরত্ব অসীম মাত্রিক সীমাতে কাজ করে না - কেবল ম্যানহাটনের মতো আরও কিছু দূরত্বের মেট্রিকে স্যুইচ করুন, তারপরে কাজ চালিয়ে যান বাস্তব সমস্যা। আপনি এটির মতো এক টন উদাহরণ খুঁজে পেতে পারেন,


2
আমি আগে এই কথন শুনেছেন, কিন্তু আমি মনে করি না আমি কোন নির্দিষ্ট উদাহরণ যে এই প্রকাশ করবে সচেতন am: কিছু তথ্য যা ইউক্লিডিয় দুরুত্ব সঙ্গে ভাল ক্লাস্টারিং নেই একটি উদাহরণ কিন্তু হয় ম্যানহাটন দূরত্বের সঙ্গে ভাল ক্লাস্টারিং?
অ্যামিবা

1
@ আমেবা এখানে সাধারণ রেফারেন্স, যদিও আমি এর আগে ভিন্ন প্রসঙ্গে এটিকে ছড়িয়ে দিয়েছি। আপনি যদি কোনও ইউনিট হাইপারকিউবের অভ্যন্তরে হাইপারস্পিয়ারের আয়তনের অনুপাতটি দেখেন তবে হাইপারকিউবের মাত্রিকতা অনন্তের দিকে চলে যাওয়ায় এটি শূন্যে সঙ্কুচিত হয়। মূলত উচ্চ মাত্রায় সমস্ত উত্তল দেহগুলি পয়েন্টে বিভক্ত হয় - আমার ব্যাখ্যা
আকাকাল

2

আমি মনে করি এটি দার্শনিক আলোচনা না হওয়া খুব কঠিন। আমার উত্তরটি ইতিমধ্যে এখানে উল্লিখিত ভাল পয়েন্টগুলির পুনরায় রেকর্ডিং (সবার জন্য +1); আমি কেবল অ্যান্ড্রু গেলম্যানের একটি উক্তিটির দিকে ইঙ্গিত করতে চাই যা সত্যই আমার সাথে একজন কম্পিউটার বিজ্ঞানী হিসাবে প্রশিক্ষিত ব্যক্তি হিসাবে কথা বলেছিল। আমার ধারণা আছে যে লোকেরা যাকে মেশিন লার্নিং বলে তারা কল করেও কম্পিউটার বিজ্ঞান থেকে আসে। গ্লোম্যান থিয়োরিটিক্যাল স্ট্যাটিস্টিক্স নামে পরিচিত নিউইয়র্ক আর কনফারেন্সে গ্যালম্যান যে বক্তৃতাটি দিয়েছিলেন তা হল প্রয়োগিত পরিসংখ্যানের থিয়োরি :

তত্ত্বটি স্কেলযোগ্য।

থিওরি আপনাকে জানায় যে কোন অর্থবোধ তৈরি করে এবং কোনটি নির্দিষ্ট শর্তে নয়। সত্যের ধারণা পেতে আমরা কী হাজার বা দশ-সহস্র বা লক্ষ লক্ষ সিমুলেশন করতে চাই? আমরা কি আরও বেশি সংখ্যক বেঞ্চমার্ক ডেটাসেটে অভিজ্ঞতা অভিজ্ঞতা তুলতে চাই? এটি একটি সময় নিতে যাচ্ছে, এবং আমাদের ফলাফল এখনও ভঙ্গুর হতে পারে। আরও, আমরা কীভাবে জানব যে তুলনাগুলি আমরা বুঝি? আমরা কীভাবে জানতে পারি যে 99.5% নির্ভুলতার সাথে আমাদের নতুন ডিপ লার্নারটি 99.1% নির্ভুলতার সাথে পুরানোটির চেয়ে সত্যিই ভাল? কিছু তত্ত্ব এখানে সাহায্য করবে।

আমি সিমুলেশনের একটি বড় অনুরাগী এবং আমি তাদের বিশ্বের উপলব্ধি করতে (বা এমনকি তত্ত্বটি বোঝার জন্য) প্রচুর ব্যবহার করি তবে তাত্ত্বিক মেশিন লার্নিং হ'ল প্রয়োগকৃত মেশিন শেখার তত্ত্ব theory

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.