একটি ভাষা দেওয়া হয়েছে, L : L S ( L ) = { | শব্দের দৈর্ঘ্যের সেট হিসাবে এর দৈর্ঘ্যের সেটটিকে সংজ্ঞায়িত করুন { u | | তোমার দর্শন লগ করা ∈ এল }
কোন পূর্ণসংখ্যার সেটগুলি কোনও নিয়মিত ভাষার দৈর্ঘ্য সেট হতে পারে?
একটি ভাষা দেওয়া হয়েছে, L : L S ( L ) = { | শব্দের দৈর্ঘ্যের সেট হিসাবে এর দৈর্ঘ্যের সেটটিকে সংজ্ঞায়িত করুন { u | | তোমার দর্শন লগ করা ∈ এল }
কোন পূর্ণসংখ্যার সেটগুলি কোনও নিয়মিত ভাষার দৈর্ঘ্য সেট হতে পারে?
উত্তর:
প্রথমত, একটি পর্যবেক্ষণ যা গুরুত্বপূর্ণ নয় তবে সুবিধাজনক: খালি বর্ণমালা A তে কিছু নিয়মিত ভাষা L এর জন্য L S ( L ) সমষ্টিগুলির সেট বর্ণমালার পছন্দের উপর নির্ভর করে না। এটি দেখতে, একটি সসীম অটোমেটন বিবেচনা করুন যা এলকে স্বীকৃতি দেয় ; থাকা শব্দের দৈর্ঘ্য হ'ল অটোমেটনে পাথগুলির দৈর্ঘ্য হ'ল শুরুর অবস্থা থেকে শুরু করে যে কোনও গ্রহণযোগ্য রাষ্ট্রের শিরোনামহীন গ্রাফ হিসাবে। বিশেষ করে, আপনার কাছে প্রত্যেকটি তীর relabel করতে এবং বর্ণমালা একই দৈর্ঘ্য সেট দিয়ে একটি নিয়মিত ভাষা পেতে । বিপরীতে, যদি একটি এক-উপাদান বর্ণমালার উপর নিয়মিত ভাষা, এটি তুচ্ছভাবে বৃহত্তর বর্ণমালায় ইনজেকশন দেওয়া যেতে পারে এবং ফলাফলটি এখনও একটি নিয়মিত ভাষা।
সুতরাং আমরা একটি একক বর্ণমালার উপর শব্দগুলির জন্য সম্ভাব্য দৈর্ঘ্যের সেটগুলি সন্ধান করছি। একটি একক বর্ণমালায়, ভাষাটি দৈর্ঘ্য সেটটি আনারিতে লেখা হয়: । এ জাতীয় ভাষাগুলিকে অ্যানারি ভাষা বলা হয়।
যাক একটি নিয়মিত ভাষা হতে, এবং একটি নির্ণায়ক সসীম যন্ত্রমানব (DFA তে) যে স্বীকার করে বিবেচনা । এর শব্দের দৈর্ঘ্যের সেট হ'ল ডিএফএ-তে একটি দৈর্ঘ্যের পাথের সেট যা নির্দেশিত গ্রাফ হিসাবে দেখা যায় যা শুরু হওয়া অবস্থায় শুরু হয় এবং গ্রহণযোগ্য অবস্থার একটিতে শেষ হয়। এক-উপাদান বর্ণমালার একটি ডিএফএ হ'ল সুন্দর (এনএফএগুলি ওয়াইল্ডার হবে): এটি হয় সীমাবদ্ধ তালিকা বা একটি বিজ্ঞপ্তি তালিকা। তালিকাটি সীমাবদ্ধ থাকলে তালিকার অর্ডার অনুসরণ করে থেকে পর্যন্ত রাজ্যগুলির সংখ্যা নির্ধারণ করুন ; এটা বৃত্তাকার, নম্বর থেকে রাজ্যের যদি থেকে তালিকার মাথা, এবং নিম্নলিখিত করার লুপ করেন।
যাক পর্যন্ত রাজ্যের গ্রহণ সূচকের সেট হতে , এবং থেকে রাজ্যের গ্রহণ সূচকের সেট হতে করার । তারপর
বিপরীতে, এবং দুটি পূর্ণসংখ্যা এবং এবং দুটি পূর্ণসংখ্যার সমষ্টি হতে পারে যেমন এবং । তারপরে সেটএকটি নিয়মিত ভাষা: এটি DFA তে কর্তৃক স্বীকৃত ভাষা উপরে বর্ণনা করা হয়েছে। একটি নিয়মিত প্রকাশ যা এই ভাষাকে বর্ণনা করে এটি একটি F is∣ ।
ইংরাজীতে সংক্ষিপ্তসার হিসাবে, নিয়মিত ভাষার দৈর্ঘ্য সেটগুলি নির্দিষ্ট মানের উপরে পর্যায়ক্রমিক পূর্ণসংখ্যার সেট হয় ।
¹ একটি উপর স্তব্ধ সুপ্রতিষ্ঠিত ধারণা , পর্যাবৃত্ত মানে সেট চারিত্রিক ফাংশন (যা একটি ফাংশন যা আমরা একটি ফাংশন করতে লিফ্ট ) পর্যায়ক্রমিক। নির্দিষ্ট মানের উপরে পর্যায়ক্রমিক অর্থ হ'ল কার্য পর্যায়ক্রমিক ক্রিয়ায় দীর্ঘায়িত হতে পারে।
কোন সসীম উপসেট নিয়মিত ভাষার দৈর্ঘ্য-সেট করা যেতে পারে এল , যেহেতু আপনি একটি ইউনারী বর্ণমালা গ্রহণ করতে পারেন { 0 } এবং সংজ্ঞায়িত এল যেমন { 0 ℓ 1 , ... , 0 ℓ এন } (এর মধ্যে খালি ভাষা এবং { ε } অন্তর্ভুক্ত )।
এখন অসীম সেটের জন্য। আমি একটি সংক্ষিপ্ত বিশ্লেষণ দেব, যদিও চূড়ান্ত উত্তরটি যথেষ্ট পরিমাণে সুস্পষ্ট নাও হতে পারে। আপনি আমাকে জিজ্ঞাসা না করা পর্যন্ত আমি বিস্তারিত জানাবো না, কারণ আমি মনে করি এটি স্বজ্ঞাত এবং আমার এখন বেশি সময় নেই বলে।
যাক নিয়মিত উৎপাদিত ভাষায় এক্সপ্রেশন হতে এল 1 ও এল, respectively. It is (sort of) easy to see that
Thus, the possible sets of integers that can be the length-set of a regular language are the ones that are finite subsets of or that can be built by taking finite subsets of and using the previous formulas a finite number of times.
Here, we are using that regular languages are built, by definition, by applying the rules for constructing a regular expression a finite number of times. Note that we can start with any finite subset of , even though in regular expressions we start with words of length 0 and 1 only as the base case. This is easily justified by the fact that all (finite) words are (finite) concatenations of the symbols of the alphabet.
This gives us one test for sets: a set cannot be the length set of a regular language unless all its elements can be expressed as some arbitrary set of integers no greater than a fixed , plus some multiple of an undetermined value (the length of ), plus some arbitrary finite value.
EDIT: A little more discussion. Certainly all finite sets of integers are length sets. Also, the union of two length sets must also be a length set, as must be the complement of any length set (hence intersection, hence difference). The reason for this is that the regular languages are closed under these operations. Therefore, the answer I give above is (possibly) incomplete; in reality, any union of such sets is also the length set of some regular language (note that I have abandoned requiring intersection, complement, difference, etc., since these are covered by the fact that regular languages are closed under these properties, as discussed in EDIT3; I think that only union is actually necessary, even if the others are right, which might not be the case).
EDIT2: Even more discussion. The answer I give is basically where you'd end up if you took Janoma's answer a little further; the part comes from the Kleene star, the comes from concatenation, and the discussion of union, intersection, difference and complement come from the + of regular expressions (as well as other closure properties of regular languages) provable starting from automata).
EDIT3: In light of Janoma's comment, let's forget closure properties of language length sets that I discuss in the first EDIT. Since the regular languages have these closure properties, and since every regular language has a DFA, it follows that the pumping lemma for regular languages applies to all unions, intersections, complements, and differences of regular languages, and we'll leave it at that; no need to even consider any of these, except union, which I still think might be necessary to make my original (modified, thanks to input from Gilles) correct. So, my final answer is this: what I say in the original version, plus the closure of language length sets with respect to set union.