প্রয়োগিত তথ্য বিজ্ঞানে তথ্য তত্ত্বের ব্যবহার


9

আজ আমি জেমস স্টোন রচিত "তথ্য তত্ত্ব: একটি টিউটোরিয়াল ভূমিকা" বইটি পেরিয়েছিলাম এবং প্রয়োগিত তথ্য বিজ্ঞানে তথ্য তত্ত্বের ব্যাপ্তি সম্পর্কে এক- দু'বারের জন্য ভেবেছিলাম (যদি আপনি এখনও এই কিছুটা অস্পষ্ট শব্দটির সাথে স্বাচ্ছন্দ্য বোধ করেন না, ডেটা বিশ্লেষণ ভাবেন , যা আইএমএইচও ডেটা বিজ্ঞান এর গৌরবময় সংস্করণ)। আমি উল্লেখযোগ্য ব্যবহারের ভাল সচেতন আছি তথ্য তত্ত্ব ভিত্তিক পন্থা , পদ্ধতি এবং পরিমাপ করে , বিশেষ করে এনট্রপি , ফণা অধীন বিভিন্ন পরিসংখ্যানগত কৌশল এবং তথ্য বিশ্লেষণ পদ্ধতি।

যাইহোক, আমি তত্ত্বের গাণিতিক উত্সের গভীরে গভীরভাবে ডাইভিং না করে কোনও প্রয়োগিত সামাজিক বিজ্ঞানীকে সেই ধারণাগুলি, ব্যবস্থা এবং সরঞ্জামগুলি সফলভাবে নির্বাচন করতে এবং প্রয়োগ করতে প্রয়োজনীয় জ্ঞানের মাত্রা / স্তর সম্পর্কে কৌতূহলী । আমি আপনার উত্তরগুলির অপেক্ষায় রয়েছি, যা উপরে বর্ণিত বইয়ের প্রসঙ্গে (বা অন্যান্য অনুরূপ বই - সুপারিশ করতে নির্দ্বিধায়) বা সাধারণভাবে আমার উদ্বেগের সমাধান করতে পারে।

প্রিন্ট বা অনলাইন উত্সগুলির জন্য আমি কিছু প্রস্তাবনারও প্রশংসা করব যা তথ্যের তত্ত্ব এবং এর ধারণাগুলি, পদ্ধতির পদ্ধতি এবং পদ্ধতিগুলির ( অন্যান্য তুলনায় ) অন্যান্য (আরও) statতিহ্যগত পরিসংখ্যানগত পদ্ধতির ( ঘন ঘনবাদী এবং বায়সিয়ান ) প্রসঙ্গে আলোচনা করে


2
গাছ তৈরির সময় এনট্রপি ব্যবহারের ক্ষেত্রে সম্ভবত সবচেয়ে পরিচিত এবং "প্রয়োগকৃত" ক্ষেত্রে একটি ঘটে। অ্যালগরিদম বিভাজন যখন সম্ভাবনার মধ্যে একটি হ'ল তথ্য লাভ মেট্রিক গ্রহণ করা, যা শীর্ষ স্তর এবং নীচের স্তরের মধ্যে এনট্রপির মধ্যে পার্থক্য। আপনি এখানে আরও তথ্য আছে en.wikipedia.org/wiki/Information_gain_in_decision_trees
D.Castro

@ ডি.কাস্ট্রো: আপনার মন্তব্যের জন্য আপনাকে ধন্যবাদ - আমি সেই কেস সম্পর্কে অবগত (এবং এমনকি এই সঠিক বিষয়ে একটি উত্তর ক্রস ভ্যালিডেটেড, বা ডেটা সায়েন্স এসই সাইটেও পোস্ট করেছি)। আমি বিষয়টির আরও ব্যাপক কভারেজ / আলোচনার জন্য আশা করছি।
আলেকসান্দ্র ব্লেক

1
আমার পক্ষে এবং বড় অংশে, এটি শৃঙ্খলা বা ক্ষেত্রের বিষয় যেখানে ভৌগলিক মহাদেশের পাশাপাশি একজনকে প্রশিক্ষণ দেওয়া হয়। আমার মতে, পদার্থবিজ্ঞানী, গণিতবিদ এবং খাঁটি মেশিন লার্নিংয়ের অনুশীলনকারীরা তথ্যের তাত্ত্বিক, অর্থনীতিবিদ বা পরিমাণগত আর্থিক বিশ্লেষকদের তুলনায় তথ্য তত্ত্বের গভীরভাবে এক্সপোজার পাওয়ার সম্ভাবনা অনেক বেশি। এছাড়াও, আমি ইউরোপ প্রশিক্ষিত লোকদের জন্য এটি দ্বিগুণ করব, অর্থাৎ, ইউরোপীয়রা আইটিটির সাথে পরিচিত হওয়ার সম্ভাবনা অনেক বেশি। তবে, পরিসংখ্যানগত শিক্ষার জন্য মডেলগুলির আগমন রাজ্যের তথ্য বিজ্ঞানীদের ক্ষেত্রে এটি পরিবর্তিত হচ্ছে।
মাইক হান্টার

@ ডি জনসন মিনিট পয়েন্টের মিনিটস্ট তবে ব্রিটেন এবং সম্ভবত অন্য কোথাও আইটি == তথ্য প্রযুক্তি। অন্যথায় আপনার ইমপ্রেশনগুলি আমার সাথে সাদৃশ্যপূর্ণ।
নিক কক্স

@ নিককক্স ধন্যবাদ, আপনার বক্তব্যটি যুক্তরাষ্ট্রের পক্ষেও রয়েছে। এটি একটি দীর্ঘ মন্তব্য ছিল এবং স্পেস অনুমতি দিলে আমি শব্দগুলি উচ্চারণ করতে পারতাম বা আরও ভাল, কোনও পূর্বের বিন্দুতে সংক্ষিপ্ত শব্দটির অর্থ চালু করতাম।
মাইক হান্টার

উত্তর:


4

সুতরাং প্রশ্নের প্রথম অংশ: তথ্য বিজ্ঞানীদের কি তথ্য তত্ত্ব জানা দরকার ? আমি ভেবেছিলাম উত্তরটি খুব সম্প্রতি হওয়া পর্যন্ত নেই। আমি যে কারণে আমার মন পরিবর্তন করেছি তা একটি গুরুত্বপূর্ণ উপাদান: গোলমাল noise

অনেক মেশিন লার্নিং মডেল (উভয় স্টোকাস্টিক বা না উভয়) তাদের এনকোডিং এবং ট্রান্সফর্মেশন প্রক্রিয়ার অংশ হিসাবে শব্দটি ব্যবহার করে এবং এই মডেলগুলির মধ্যে অনেকগুলি আপনাকে মডেলটির রূপান্তরিত আউটপুট ডিকোড করার পরে যে সম্ভাবনাটি শব্দটি প্রভাবিত করেছিল তা নির্ধারণ করতে হবে। আমি মনে করি এটি তথ্য তত্ত্বের একটি মূল অঙ্গ। শুধু তাই নয়, গভীর শিক্ষায়, কেএল ডাইভারজেন্স একটি অত্যন্ত গুরুত্বপূর্ণ পরিমাপ যা ব্যবহৃত হয় তথ্য তত্ত্ব থেকেও।

প্রশ্নের দ্বিতীয় অংশ: আমি মনে করি সেরা উত্স হ'ল ডেভিড ম্যাকের ইনফরমেশন থিওরি, ইনফারেন্স অ্যান্ড লার্নিং অ্যালগরিদম । তিনি ইনফরমেশন থিওরি দিয়ে শুরু করেন এবং এই ধারণাগুলি অনুমান এবং এমনকি নিউরাল নেটওয়ার্ক উভয় ক্ষেত্রে নিয়ে যান। ডেভের ওয়েবসাইটে পিডিএফ বিনামূল্যে এবং বক্তৃতাগুলি অনলাইনে রয়েছে যা দুর্দান্ত


3
এটি একটি দুর্দান্ত বই। আগ্রহী যে কোনও ব্যক্তিরও নজর দেওয়া উচিত en.wikedia.org/wiki/Didid_J._C._ ম্যাককে
নিক কক্স

আপনার উত্তরের জন্য ধন্যবাদ (+1 এবং সম্ভাব্য গ্রহণযোগ্যতা, যদি এরপরে আরও ব্যাপক উত্তর শীঘ্রই পপ আপ না হয়)। রেফারেন্সের জন্য বিশেষ প্রশংসা। আমি অবাক হয়েছি আপনি প্রায় ভুলে যাওয়া, তবে গুরুত্বপূর্ণ, আমার প্রশ্নটি পেরিয়ে এসেছেন। :-)
আলেকজান্ডার ব্লেখ

হ্যাঁ এটি আকর্ষণীয়। আপনার কখনই কোনও প্রশ্ন ছেড়ে দেওয়া উচিত নয়। আমি এনআইপিএস ২০১6 এ অংশ নেওয়ার পরে আমার কাছে এসেছি এবং আমি কেএল ডাইভারজেন্স এবং এনকোডারগুলিতে শব্দ প্রভাবের বিষয়ে এই সমস্ত আলোচনা দেখেছি।
আম্বোদি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.