অস্পষ্ট প্রসঙ্গ-মুক্ত ব্যাকরণ (সিএফজি) এর অ্যাসিম্পটোটিক ঘনত্ব


9

সমস্ত সিএফজির ক্ষেত্রে অস্পষ্ট সিএফজির অনুপাত কত ?

যেহেতু উভয় সেট অগণিত অসীম অনুপাতটি সঠিকভাবে সংজ্ঞায়িত হয় না। তবে অ্যাসিপটোটিক ঘনত্ব সম্পর্কে কী :

limn# ambiguous CFG of size<n# CFG of size<n

যেখানে টার্মিনাল এবং অ-টার্মিনাল প্রতীকগুলি একটি নির্দিষ্ট গণনাযোগ্য সেট থেকে আসে।

ব্যাকরণের আকার ব্যাকরণগুলির জন্য আকারের কোনও যুক্তিসঙ্গত ধারণা, যেমন

  1. উত্পাদন নিয়মে ভেরিয়েবল এবং টার্মিনালের সংঘটনগুলির মোট সংখ্যা বা
  2. চলক সংঘটনগুলির মোট সংখ্যা, বা or
  3. উত্পাদনের বিধিগুলির মোট সংখ্যা বা
  4. স্বতন্ত্র ভেরিয়েবলের সংখ্যা।

(আমি ধরে নিচ্ছি আকারের সংজ্ঞা উত্তরকে প্রভাবিত করবে না।)


3
একদিকে যেমন, সিএফজি আকারের নিম্নলিখিত ধারণাগুলি সাহিত্যে বিবেচনা করা হয়েছে: ব্যাকরণ আকারের ধারণা হিসাবে, সাহিত্যে নিম্নলিখিতগুলি প্রকাশিত হয়েছে। (1) ব্যাকরণ সমস্ত প্রযোজনার উভয় পক্ষের ভেরিয়েবল এবং টার্মিনাল সংঘটন মোট সংখ্যা। (২) ব্যাকরণে সমস্ত উত্পাদনের উভয় পক্ষেই পরিবর্তনশীল সংখ্যার সংখ্যা। (3) ব্যাকরণে উত্পাদন সংখ্যা। (4) ব্যাকরণে স্বতন্ত্র ভেরিয়েবলের সংখ্যা।
মার্টিন বার্গার

1
উদাহরণস্বরূপ দেখুন: এস জিন্সবার্গ, এন। লিঞ্চ, প্রসঙ্গমুক্ত ব্যাকরণ ফর্মগুলিতে আকারের জটিলতা। জে গ্রুস্কা, প্রসঙ্গমুক্ত ব্যাকরণের আকারে। জে গ্রুস্কা, প্রবন্ধমুক্ত ব্যাকরণ এবং ভাষাগুলির জটিলতা এবং উদ্বিগ্নতা। উ: কেলেনোভা, সাধারণ ফর্ম ব্যাকরণগুলির জটিলতা।
মার্টিন বার্গার

1
@ মার্টিন, যদি কেউ সতর্ক না হন তবে নির্দিষ্ট আকারের অনেকগুলি সিন্ট্যাকটিক্যালি বিভিন্ন ব্যাকরণ থাকতে পারে এবং অনুপাতটি কোনও অর্থবোধ করে না। নিরাপদ উপায় হল ব্যাকরণগুলির কিছু নির্দিষ্ট এনকোডিংয়ের বিট দৈর্ঘ্য গণনা করা।
কাভেঃ

1
উভয় পরিমাণই তাত্পর্যপূর্ণ, সম্ভবত বিভিন্ন ঘাঁটিযুক্ত হিসাবে, আপনি সম্ভবত সংশ্লিষ্ট পরিমাণের লগারিদমের অনুপাত হিসাবে অ্যাসেম্পোটিক ঘনত্বকে সংজ্ঞায়িত করতে চান।
মোবিয়াস

1
@ মার্টিনবার্গার ধরে নিচ্ছি আমরা একই জিনিসটির বিষয়ে কথা বলছি, অর্থাৎ সংজ্ঞায়িত করে যা স্পষ্টতই ঘনত্বকে প্রভাবিত করবে। ধরুন যে দ্ব্যর্থহীন সিএফজির সংখ্যা এবং সিএফজির সংখ্যা , তবে লগ-ঘনত্বটি যখন ঘনত্ব 0 হয় I'm আমি যথেষ্ট নিশ্চিত যে অ্যাসিম্পটিক ঘনত্ব হবে 0 বা 1 হয় তবে অ্যাসিম্পটোটিক লগ-ঘনত্ব একটি আকর্ষণীয় সংখ্যা হতে পারে। logdensity=log(#unambiguousCFGs)/log(#CFGs)1.5n2nlog1.52
মোবিয়াস

উত্তর:


4

প্রশ্নটি সঠিক এনকোডিংয়ের উপর নির্ভর করে। যাইহোক, এটি মনে হয় যে অনেক যুক্তিসঙ্গত এনকোডিংগুলিতে দৈর্ঘ্য অসীমের দিকে ঝুঁকির সাথে সাথে, উত্পাদনের নিয়ম সংখ্যা (প্রারম্ভিক প্রতীক এবং টার্মিনাল এর যথাযথ ব্যাখ্যার জন্য ) উচ্চ সম্ভাবনা সহ একাধিক হবে; এখানে আমি আক্ষরিক অর্থে একই টার্মিনালটি । যদি আমরা এটিকে অস্পষ্টতা হিসাবে বিবেচনা করি, তবে আমি আশা করি "বেশিরভাগ" ব্যাকরণ অস্পষ্ট হবে। আমরা অন্তত একবার উপস্থিত হওয়া প্রত্যেকের এবং rules নিয়মের মতো অনুরূপ পরিস্থিতিগুলিও সংহত করতে পারি ।SaSaaSSSa

এই সাধারণ অনুমানটি ধরে নিলে, দৈর্ঘ্য অসীমের দিকে ঝোঁক হওয়ার সাথে সাথে প্রতিটি (স্থির) অনুমানযোগ্য নিয়ম উচ্চ সম্ভাবনার সাথে উপস্থিত হওয়া উচিত, আমরা দেখতে পাই যে "বেশিরভাগ" ব্যাকরণগুলি একটি দ্ব্যর্থক পদ্ধতিতে " " উত্পন্ন করে।Σ

উদাহরণস্বরূপ, ওভার ব্যাকরণ জন্য নিম্নলিখিত এনকোডিং বিবেচনা । ব্যাকরণ বর্ণমালা প্রতীক নিয়ে গঠিত । নন-টার্মিনালগুলি কমপক্ষে 2 দৈর্ঘ্যের বাইনারি স্ট্রিং দ্বারা সূচিত হয় R বিধিগুলি সম্পূর্ণ স্টপগুলি দ্বারা পৃথক করা হয়। প্রতিটি নিয়ম হল সেমিকোলন দ্বারা পৃথক করা বাইনারি স্ট্রিংগুলির ক্রম। প্রথম বাইনারি স্ট্রিংটি বাম-হাতের নন-টার্মিনাল এবং বাকী (যদি থাকে) ডান-হাতের অংশটি গঠন করে; যদি প্রথম বাইনারি স্ট্রিংটি একটি নন-টার্মিনাল নয় (যেমন, এটি , 0,1), তবে আরম্ভকারী অ টার্মিনালটি ধরে নেওয়া হয়। প্রারম্ভিক অ টার্মিনাল সর্বদা 00 থাকে।Σ={0,1}{0,1,;,.}ϵ

এই এনকোডিংয়ের অধীনে, প্রতিটি স্ট্রিং কিছু ব্যাকরণ বর্ণনা করে। উচ্চ সম্ভাবনার সাথে একটি এলোমেলো ব্যাকরণে এর অনেকগুলি অনুলিপি থাকবেএবং, এবং বিশেষত অস্পষ্ট হবে।{0,1,;,.}.00;00..00;0.


হ্যাঁ, আমি ব্যাকরণে এবং (একাধিকবার প্রদর্শিত হতে) বৈধ হিসাবে বিবেচনা করি। প্রকৃতপক্ষে, এটি একটি ব্যাকরণেরকে তুচ্ছভাবে অস্পষ্ট করে তোলে। চিয়ার্স। SSSa
ব্যবহারকারী18064

তবে এটিও নয় যে আকার (সিএফজি) বৃদ্ধি পাওয়ার সাথে সাথে সাধারণত টার্মিনাল এবং নন-টার্মিনালের সংখ্যা বৃদ্ধি পায়, তাই তাদের প্রতিনিধিত্ব করার জন্য আমাদের আরও বিট প্রয়োজন, তাই স্বতন্ত্র নিয়মের প্রতিনিধিত্ব করার জন্য আমাদের আরও বিট প্রয়োজন। সুতরাং তুচ্ছ কারণে সিএফজির সংখ্যার তুলনায় দ্ব্যর্থহীন (যেমন শুধুমাত্র একটি নিয়ম আকারের সাথে মানানসই))
মার্টিন বার্গার

@ মার্টিন এটি এনকোডিংয়ের উপর নির্ভর করে। সম্ভবত আপনি নিজের দাবিকে সমর্থন করে এমন একটি এনকোডিং নিয়ে আসতে পারেন, উদাহরণস্বরূপ যদি বর্ণমালার আকার ব্যাকরণের আকারের সাথে বৃদ্ধি পায়। আমার এনকোডিং একটি ধ্রুবক বর্ণমালা আকার ব্যবহার করে, তাই এই প্রভাবটি ঘটে না।
যুবাল ফিল্মাস

@ মার্টিনবার্গার এটি টার্মিনাল এবং নন-টার্মিনাল প্রতীকগুলির সংখ্যা বাড়ানোর বিষয়ে একটি বৈধ পয়েন্ট যা আমরা ব্যাকরণের আকার বাড়িয়ে তুলি। প্রোগ্রামিং ল্যাঙ্গুয়েজের মতো ব্যবহারের ক্ষেত্রে এটি উপলব্ধিযোগ্য।
ব্যবহারকারী18064

@ ব্যবহারকারী18064 প্রোগ্রামিং ভাষা সাধারণত ধ্রুব আকারের বর্ণমালা ব্যবহার করে, বেশিরভাগ ক্ষেত্রে ASCII এর একটি উপসেট। আমি সীমাহীন বর্ণমালা আকারের কোনও ব্যবহারিক ভাষা সম্পর্কে অবগত নই, যদিও কেউ এগুলি সহজেই সংজ্ঞায়িত করতে পারে।
যুবাল ফিল্মাস
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.