নিয়মিত ভাষায় শব্দের দৈর্ঘ্যের সম্ভাব্য সেটগুলি কী কী?


15

একটি ভাষা দেওয়া হয়েছে, L : L S ( L ) = { | শব্দের Lদৈর্ঘ্যের সেট হিসাবে এর দৈর্ঘ্যের সেটটিকে সংজ্ঞায়িত করুন { u | | তোমার দর্শন লগ করা এল }LL

LS(L)={|u|uL}

কোন পূর্ণসংখ্যার সেটগুলি কোনও নিয়মিত ভাষার দৈর্ঘ্য সেট হতে পারে?

উত্তর:


14

প্রথমত, একটি পর্যবেক্ষণ যা গুরুত্বপূর্ণ নয় তবে সুবিধাজনক: খালি বর্ণমালা A তে কিছু নিয়মিত ভাষা L এর জন্য L S ( L ) সমষ্টিগুলির সেট S বর্ণমালার পছন্দের উপর নির্ভর করে না। এটি দেখতে, একটি সসীম অটোমেটন বিবেচনা করুন যা এলকে স্বীকৃতি দেয়LS(L)LAL ; L থাকা শব্দের দৈর্ঘ্য হ'ল অটোমেটনে পাথগুলির দৈর্ঘ্য হ'ল শুরুর অবস্থা থেকে শুরু করে যে কোনও গ্রহণযোগ্য রাষ্ট্রের শিরোনামহীন গ্রাফ হিসাবে। বিশেষ করে, আপনার কাছে প্রত্যেকটি তীর relabel করতে a এবং বর্ণমালা একই দৈর্ঘ্য সেট দিয়ে একটি নিয়মিত ভাষা পেতে {a} । বিপরীতে, যদিL একটি এক-উপাদান বর্ণমালার উপর নিয়মিত ভাষা, এটি তুচ্ছভাবে বৃহত্তর বর্ণমালায় ইনজেকশন দেওয়া যেতে পারে এবং ফলাফলটি এখনও একটি নিয়মিত ভাষা।

সুতরাং আমরা একটি একক বর্ণমালার উপর শব্দগুলির জন্য সম্ভাব্য দৈর্ঘ্যের সেটগুলি সন্ধান করছি। একটি একক বর্ণমালায়, ভাষাটি দৈর্ঘ্য সেটটি আনারিতে লেখা হয়: LS(L)={nNanL} । এ জাতীয় ভাষাগুলিকে অ্যানারি ভাষা বলা হয়।

যাক L একটি নিয়মিত ভাষা হতে, এবং একটি নির্ণায়ক সসীম যন্ত্রমানব (DFA তে) যে স্বীকার করে বিবেচনা LL এর শব্দের দৈর্ঘ্যের সেট হ'ল ডিএফএ-তে একটি দৈর্ঘ্যের পাথের সেট যা নির্দেশিত গ্রাফ হিসাবে দেখা যায় যা শুরু হওয়া অবস্থায় শুরু হয় এবং গ্রহণযোগ্য অবস্থার একটিতে শেষ হয়। এক-উপাদান বর্ণমালার একটি ডিএফএ হ'ল সুন্দর (এনএফএগুলি ওয়াইল্ডার হবে): এটি হয় সীমাবদ্ধ তালিকা বা একটি বিজ্ঞপ্তি তালিকা। তালিকাটি সীমাবদ্ধ থাকলে তালিকার অর্ডার অনুসরণ করে 0 থেকে h পর্যন্ত রাজ্যগুলির সংখ্যা নির্ধারণ করুন ; এটা বৃত্তাকার, নম্বর থেকে রাজ্যের যদি 0 থেকে h তালিকার মাথা, এবং নিম্নলিখিত h করার h+r লুপ করেন।

তালিকা আকারের অটোমেটা

যাক F পর্যন্ত রাজ্যের গ্রহণ সূচকের সেট হতে h , এবং G থেকে রাজ্যের গ্রহণ সূচকের সেট হতে h করার h+r । তারপর

LS(L)=F{kr+xxG,kN}

বিপরীতে, h এবং r দুটি পূর্ণসংখ্যা এবং F এবং জি দুটি পূর্ণসংখ্যার সমষ্টি হতে পারে যেমন xF,এক্স এবং xG,hxh+r । তারপরে সেটLF,G,r={akr+xxG,kN}একটি নিয়মিত ভাষা: এটি DFA তে কর্তৃক স্বীকৃত ভাষা উপরে বর্ণনা করা হয়েছে। একটি নিয়মিত প্রকাশ যা এই ভাষাকে বর্ণনা করে এটি একটি F isaFaG(ar)

ইংরাজীতে সংক্ষিপ্তসার হিসাবে, নিয়মিত ভাষার দৈর্ঘ্য সেটগুলি নির্দিষ্ট মানের উপরে পর্যায়ক্রমিক পূর্ণসংখ্যার সেট হয়

¹ একটি উপর স্তব্ধ সুপ্রতিষ্ঠিত ধারণা , পর্যাবৃত্ত মানে সেট চারিত্রিক ফাংশন (যা একটি ফাংশন N{false,true} যা আমরা একটি ফাংশন করতে লিফ্ট Z{false,true} ) পর্যায়ক্রমিক। নির্দিষ্ট মানের উপরে পর্যায়ক্রমিক অর্থ হ'ল কার্য[h,+[ পর্যায়ক্রমিক ক্রিয়ায় দীর্ঘায়িত হতে পারে।


বর্ণমালার অপ্রাসঙ্গিকতা সম্পর্কে আপনার পর্যবেক্ষণ থেকে বোঝা যায় যে পরীখের উপপাদ্য প্রয়োগ করা যেতে পারে। বিশেষত, আপনি দেখান যে এলএস (এল) = এলএস (এল ') যেখানে এল' এ সমস্ত অক্ষর একক বর্ণমালায় সঙ্কুচিত হয়। তবে এলএস (এল) হ'ল এল ভাষাটির পরিক ম্যাপিং যা কোনও নিয়মিত ভাষার জন্য সেলিমিয়ার হিসাবে পরিচিত।
সুরেশ

চমৎকার পন্থা! 1) আমি মনে করি যে প্রথম অনুচ্ছেদটি স্ট্রিং হোমোমর্ফিজমের বিরুদ্ধে নিয়মিত ভাষা বন্ধ রয়েছে তা উল্লেখ করে প্রতিস্থাপন করা যেতে পারে। 2) স্বচ্ছতা, যদি আপনি দ্বিতীয় ভাগে দান বিবেচনা করা উচিত হিসাবে { + + + + ( এক্স - ) | ... } , বন্ধ-বাই-ওয়ান ত্রুটি modulo। 3) একটি "পর্যায়ক্রমিক" পূর্ণসংখ্যা সেট কি? LS(L){h+kr+(xh)}
রাফায়েল

1
@ সুরেশ, রাফেল (১): আমি প্রমাণটিকে প্রাথমিক উপায়ে বলতে পছন্দ করি, আমার সিএস ১০২ শ্রেণিতে হোমোর্ফিজম বা পরিক ম্যাপিংয়ের কথা বলা হয়নি।
গিলস 'সো-অশুভ হওয়া বন্ধ করুন'

@ রাফেল (২) আপনি সূচির সূচনা যেখানে শুরু করেন তাতে কিছু আসে যায় না, আমি এইচ জি শর্তটি সরিয়ে ফেলতে পারি , যেহেতু এফ আমরা যতগুলি ছোট উপাদান শুষে নিতে পারি। (3) একটি নির্দিষ্ট মানের উপরে পর্যায়ক্রমিক এমন একটি সেট যা উপরে প্রদর্শিত ফর্মটিতে রাখা যেতে পারে। GhGF
গিলস 'তাই মন্দ হওয়া বন্ধ করুন'

5

কোন সসীম উপসেট নিয়মিত ভাষার দৈর্ঘ্য-সেট করা যেতে পারে এল , যেহেতু আপনি একটি ইউনারী বর্ণমালা গ্রহণ করতে পারেন { 0 } এবং সংজ্ঞায়িত এল যেমন { 0 1 , ... , 0 এন } (এর মধ্যে খালি ভাষা এবং { ε } অন্তর্ভুক্ত )।{1,,n}NL{0}L{01,,0n}{ε}

এখন অসীম সেটের জন্য। আমি একটি সংক্ষিপ্ত বিশ্লেষণ দেব, যদিও চূড়ান্ত উত্তরটি যথেষ্ট পরিমাণে সুস্পষ্ট নাও হতে পারে। আপনি আমাকে জিজ্ঞাসা না করা পর্যন্ত আমি বিস্তারিত জানাবো না, কারণ আমি মনে করি এটি স্বজ্ঞাত এবং আমার এখন বেশি সময় নেই বলে।

যাক নিয়মিত উৎপাদিত ভাষায় এক্সপ্রেশন হতে এল 1এলr1,r2L1L2, respectively. It is (sort of) easy to see that

  • LS(L(r1+r2))=LS(L1L2)=LS(L1)LS(L2).
  • LS(L(r1r2))=LS(L1L2)={1+2:1LS(L1),2LS(L2)}. This is denoted LS(L1)+LS(L2).
  • LS(L(r1))={0}n1{i=1ni:(1,,n)(LS(L1))n}.

Thus, the possible sets of integers that can be the length-set of a regular language are the ones that are finite subsets of N or that can be built by taking finite subsets S1,S2 of N and using the previous formulas a finite number of times.

Here, we are using that regular languages are built, by definition, by applying the rules for constructing a regular expression a finite number of times. Note that we can start with any finite subset of N, even though in regular expressions we start with words of length 0 and 1 only as the base case. This is easily justified by the fact that all (finite) words are (finite) concatenations of the symbols of the alphabet.


I don't see any final answer. (Were you intending to finish your answer later?) I was hoping for a simple description of the possible sets, and a connection with automata.
Gilles 'SO- stop being evil'

The final answer is there: "Thus, the possible sets of integers...". That is indeed a simple description, though connected with regular expressions, not automata.
Janoma

There's a simpler description that doesn't involve taking a fixpoint. Maybe this question isn't as elementary as I thought!
Gilles 'SO- stop being evil'

I don't think you can avoid the last rule, since it is the star operator the one which can produce infinite length-sets, just as it produces infinite languages.
Janoma

@Gilles So you want a closed form of the smallest fixpoint of the inductive solution Janoma provides?
Raphael

2

এনএক্সএন

x=uvw
Where the following three conditions hold:
|uv|<n
|v|>0
uvkwL

This gives us one test for sets: a set cannot be the length set of a regular language unless all its elements can be expressed as some arbitrary set of integers no greater than a fixed n, plus some multiple of an undetermined value m (the length of v), plus some arbitrary finite value.

{a+bn|nN}S
a,bNSN).

EDIT: A little more discussion. Certainly all finite sets of integers are length sets. Also, the union of two length sets must also be a length set, as must be the complement of any length set (hence intersection, hence difference). The reason for this is that the regular languages are closed under these operations. Therefore, the answer I give above is (possibly) incomplete; in reality, any union of such sets is also the length set of some regular language (note that I have abandoned requiring intersection, complement, difference, etc., since these are covered by the fact that regular languages are closed under these properties, as discussed in EDIT3; I think that only union is actually necessary, even if the others are right, which might not be the case).

EDIT2: Even more discussion. The answer I give is basically where you'd end up if you took Janoma's answer a little further; the bn part comes from the Kleene star, the a comes from concatenation, and the discussion of union, intersection, difference and complement come from the + of regular expressions (as well as other closure properties of regular languages) provable starting from automata).

EDIT3: In light of Janoma's comment, let's forget closure properties of language length sets that I discuss in the first EDIT. Since the regular languages have these closure properties, and since every regular language has a DFA, it follows that the pumping lemma for regular languages applies to all unions, intersections, complements, and differences of regular languages, and we'll leave it at that; no need to even consider any of these, except union, which I still think might be necessary to make my original (modified, thanks to input from Gilles) correct. So, my final answer is this: what I say in the original version, plus the closure of language length sets with respect to set union.


1
{a+bna,b,nN}S is on the right track, but you got a quantifier wrong somewhere, you're generating N.
Gilles 'SO- stop being evil'

1
The analysis for the complement of a length set may be a bit delicate. If L=L(a) over the alphabet Σ={a,b}, then the length set of L is N and the length set of L¯ is N+, and these are not complement of each other.
Janoma

@Gilles But the set of all natural numbers is a valid length set, right? I'm not generating all subsets of natural numbers, right? I agree that would be problematic. Edit: oh wait, I see what you're saying. Yes, you're right. Will fix when back at computer.
Patrick87

@Janoma Excellent point, will need to consider how that might change the set of things I'm defining...
Patrick87
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.