প্রসঙ্গ: আমি ইউনি পাঠ্যক্রমের পরিসংখ্যানের কিছু (অর্ধ-ভুলে যাওয়া) অভিজ্ঞতার সাথে একজন প্রোগ্রামার। সম্প্রতি আমি http://akinator.com এ হোঁচট খেয়েছি এবং এটিকে ব্যর্থ করার চেষ্টা করে কিছু সময় ব্যয় করেছি। আর কে ছিল না? :)
আমি কীভাবে এটি কাজ করতে পারে তা খুঁজে বের করার সিদ্ধান্ত নিয়েছি। সম্পর্কিত ব্লগ পোস্টগুলি গুগল করা এবং পড়ার পরে এবং ফলাফলের মিশ্রণে আমার (সীমিত) কিছু জ্ঞান যুক্ত করার পরে আমি নীচের মডেলটি নিয়ে আসছি (আমি নিশ্চিত যে আমি ভুল স্বরলিপিটি ব্যবহার করব, দয়া করে এর জন্য আমাকে হত্যা করবেন না):
সাবজেক্ট (এস) এবং প্রশ্ন (প্রশ্ন) রয়েছে। ভবিষ্যদ্বাণীকারীর লক্ষ্য হ'ল সাবজেক্টটি নির্বাচন করা যা ব্যবহারকারী এতক্ষণে সংগৃহীত প্রশ্নাবলী এবং উত্তর দেওয়া হয়েছে এমন বিষয়ে সাবজেক্ট হওয়ার সম্ভাবনা সবচেয়ে বেশি।
খেলা জি একটি সেট হতে এর প্রশ্ন জিজ্ঞাসা ও উত্তর দেওয়া যাক: ।
তারপর predictor জন্য খুঁজছেন হয় ।
সাবজেক্টের আগে ( ) কেবলমাত্র খেলাগুলির সংখ্যার দ্বারা বিভাজনকে অনুমান করা হয়েছিল কতবার বিষয় হতে পারে।
এই ধারণাটি গ্রহণ করে যে সমস্ত উত্তর স্বাধীন, আমরা গেমকে এইভাবে সাবজেক্ট এস এর সম্ভাবনা গণনা করতে পারি:
আমরা গণনা করতে পারি যদি ব্যবহারকারীর প্রদত্ত বিষয়ের বিষয়ে কোন প্রশ্ন ও উত্তর দেওয়া হয়েছিল তা যদি আমরা পর্যবেক্ষণ করি:
এখন, বিষয়গুলির উপর একটি সম্ভাব্যতা বন্টনকে সংজ্ঞায়িত করে এবং যখন আমাদের পরবর্তী প্রশ্নটি নির্বাচন করা দরকার তখন আমাদের একটি নির্বাচন করতে হবে যার জন্য এই বিতরণের এনট্রপিতে প্রত্যাশিত পরিবর্তন সর্বাধিক:
আমি এটি বাস্তবায়নের চেষ্টা করেছি এবং এটি কার্যকর হয়। কিন্তু একথাও ঠিক যে, বিষয় সংখ্যা বেড়ে যায় হিসেবে পুনঃগণনা করার প্রয়োজনীয়তা কারণে কর্মক্ষমতা আয়ু কমতে প্রতিটি পদক্ষেপ পর এবং আপডেট বন্টন নিরূপণ জন্য প্রশ্ন নির্বাচন।
আমার সন্দেহ হয় যে আমি কেবল আমার জ্ঞানের সীমাবদ্ধতায় আবদ্ধ হয়ে ভুল মডেলটি বেছে নিয়েছি। অথবা, গণিতে কোনও ত্রুটি রয়েছে। দয়া করে আমাকে আলোকিত করুন: আমি কীসের সাথে নিজেকে পরিচিত করব বা কীভাবে ভবিষ্যদ্বাণীকে পরিবর্তন করব যাতে এটি লক্ষ লক্ষ বিষয় এবং হাজারো প্রশ্নের মোকাবেলা করতে পারে?