রেজেক্স গল্ফ এনপি-সম্পূর্ণ?


27

দেখা হিসাবে এই সাম্প্রতিক xkcd ফালা এবং এই সাম্প্রতিক ব্লগ পোস্টপিটার নরভিগের (এবং একটি স্ল্যাশডট গল্প যার মধ্যে রয়েছে), "রেজেক্স গল্ফ" (যাকে আরও ভালভাবে নিয়মিত এক্সপ্রেশন বিচ্ছেদ সমস্যা বলা যেতে পারে) হ'ল সংক্ষিপ্ততম নিয়মিত অভিব্যক্তি সংজ্ঞায়নের ধাঁধা যা সেট এ এর ​​প্রতিটি শব্দকে গ্রহণ করে এবং এতে কোনও শব্দ নেই বি বি। নরভিগের পোস্টে যুক্তিসঙ্গতভাবে সংক্ষিপ্ত প্রার্থী তৈরি করার জন্য একটি অ্যালগরিদম অন্তর্ভুক্ত রয়েছে এবং তিনি নোট করেছেন যে তার পদ্ধতির মধ্যে এনপি-সম্পূর্ণ সেট কভার সমস্যা সমাধান করা জড়িত, তবে তিনি এও উল্লেখ করতে সতর্ক হন যে তার পদ্ধতির প্রতিটি নিয়মিত অভিব্যক্তি বিবেচনা করা হয় না, এবং অবশ্যই তাঁর অগত্যা একমাত্র অ্যালগরিদম নয়, তাই তার সমাধানগুলি অনুকূল হওয়ার গ্যারান্টিযুক্ত নয়, এবং এটিও সম্ভব যে কিছু অন্যান্য নিশ্চিতভাবে বহুপদী-সময়ের অ্যালগোরিদম সমতুল্য বা আরও ভাল সমাধান খুঁজে পেতে পারে।

সংক্ষিপ্ততার জন্য এবং অপ্টিমাইজেশন প্রশ্নটি সমাধান করতে না এড়াতে, আমি মনে করি নিয়মিত এক্সপ্রেশন বিভাজনের সবচেয়ে প্রাকৃতিক সূত্রটি হ'ল:

প্রদত্ত দুটি (সসীম) সেট করে এবং বি কিছু বর্ণমালা ধরে স্ট্রিং Σ সেখানে দৈর্ঘ্যের একটি রেগুলার এক্সপ্রেশন হয় এতে প্রত্যেক স্ট্রিং গ্রহণ একটি এবং প্রতিটি স্ট্রিং প্রত্যাখ্যান বি ?ABΣkAB

এই বিশেষ বিচ্ছেদ সমস্যার জটিলতা সম্পর্কে কিছু জানা যায় কি? (নোট করুন যেহেতু আমি এবং B কে স্ট্রিংয়ের সসীম সেট হিসাবে নির্দিষ্ট করেছি তাই সমস্যার আকারের স্বাভাবিক ধারণা হ'ল A এবং B এর সমস্ত স্ট্রিংয়ের মোট দৈর্ঘ্য ; এটি কে থেকে কোনও অবদানকে সরিয়ে দেয় )। এটা অত্যন্ত সম্ভবত আমার এটা মনে হচ্ছে যে হয় দ্বারা NP-সম্পূর্ণ (এবং আসলে, আমি হ্রাস কভার সমস্যা কিছু বাছাই হতে আশা) কিন্তু কয়েক অনুসন্ধানসমূহ বিশেষভাবে উপকারী কিছু পরিণত আপ করেন নি।ABABk


4
এটি কি এনপি-তেও আছে? একটি নিয়মিত অভিব্যক্তি দেওয়া, আপনি কীভাবে পরীক্ষা করতে পারেন যে কোনও শব্দ বহুবর্ষীয় সময়ে বর্ণিত ভাষায় আছে কিনা? মানক পদ্ধতির - এনএফএ-তে রূপান্তর করুন, তারপরে ডিএফএ এবং চেক - (?) এ তাত্পর্যপূর্ণ সময় নেয় । k
রাফেল

1
PSPACE- সম্পূর্ণ হওয়া উচিত; ggramlich.github.io/Publications/approximationSTACS05Pres.pdf এবং citeseerx.ist.psu.edu/viewdoc/… (পিএস: আমি এটিকে একটি মন্তব্য হিসাবে পোস্ট করছি , দেখুন) (গ্রামলিচ, শনিটগার, এনএমএ এবং মিনিমাইজিং এনএফএ এবং নিয়মিত প্রকাশ, ২০০৫) কারণ একটি উত্তরের কারণটি ব্যাখ্যা করা উচিত, তবে এই মুহূর্তে আমার কাছে সময় দেওয়ার মতো সময় নেই; সম্ভবত অন্য কেউ রেফারেন্সটি ব্যবহার করতে পারেন এবং এটি কীভাবে কাজ করে তা ব্যাখ্যা করতে পারে)
rgrig

1
টিসিএসে বোঝা হিসাবে নিয়মিত প্রকাশের জন্য, সমস্যাটি এনপি-তে রয়েছে (বহুবর্ষের আকারের একটি শংসাপত্র এবং বহুপদী সময় যাচাইযোগ্য নিজেই নিয়মিত অভিব্যক্তি হবে)। এটি (সম্ভবত) এনপি-তে নেই যদি আমরা নিয়মিত এক্সপ্রেশনগুলির জন্য যেমন পিসিআরই ব্যবহার করি, কেননা এমনকি সদস্যপদ পরীক্ষা করাও এনপি-হার্ড ( পার্ল.প্ল্লোভার / এনপিসি / এনপিসি ৩- এসএইচটিএমএল )।
মাইক বি।

1
@ মাইকেবি: এবং আপনি বহুপক্ষীয় সময়ে ঠিক কীভাবে পরীক্ষা করবেন? আপনি @ রাফেলের মন্তব্যটি দেখেছেন?
আরজিরিগ

5
(1) আপনি এনএফএ-এর সদস্যতার পরীক্ষা করতে পি-তে একটি ডিস্ট্রিমোনটিক অ্যালগরিদম চালাতে পারেন (শুরুর-রাজ্যে শুরু করুন, এবং শব্দের প্রতীক গ্রহণের পরে আপনি যে সমস্ত রাজ্যে থাকতে পারেন তা মনে রাখবেন R একটি চূড়ান্ত অবস্থা।) (২) এটি "নিয়মিত অভিব্যক্তি" এর সংজ্ঞা উপর নির্ভর করে - আমরা কি কম্পিউটার বিজ্ঞানী বা প্রোগ্রামারগুলির মধ্যে একটি ব্যবহার করি? আমরা কি কেবল নিয়মিত ভাষাগুলি, বা (একটি উপসেট) প্রসঙ্গে সংবেদনশীল ভাষাগুলি (তাই পিসিআরই) অনুমতি দিই?
মাইক বি।

উত্তর:


15

টিজিএস-বৈকল্পিকটিকে রেজেজের ধরে নিলে, সমস্যাটি আসলে এনপি-সম্পূর্ণ।

আমরা ধরে নিই যে আমাদের রেইগেক্সগুলিতে রয়েছে

  • থেকে বর্ণগুলি , নিজের সাথে মিলছে,Σ
  • , ইউনিট বোঝানো,+
  • , বোঝানো সংক্ষেপণ,
  • , ক্লিন-স্টারকে বোঝানো হচ্ছে,
  • , খালি স্ট্রিংয়ের সাথে মিলছেλ

এবং আর কিছুনা. একটি Regex দৈর্ঘ্য থেকে অক্ষরের সংখ্যা হিসেবে সংজ্ঞায়িত করা হয় । কমিক স্ট্রিপের মতো, আমরা কোনও শব্দের সাথে মেলে একটি রেজেক্সকে বিবেচনা করি, যদি এটি শব্দের একটি স্ট্রিংয়ের সাথে মেলে। (এই অনুমানগুলির কোনও পরিবর্তন করা কেবল নীচের নির্মাণের জটিলতায় প্রভাব ফেলবে, তবে সাধারণ ফলাফল নয় not)Σ

AB

এনপি-কঠোরতা দেখানোর জন্য, আমরা সেট কভারটি হ্রাস করি:

UCUCCkSCS=U

আমরা রেগেক্স গল্ফের জন্য সেট কভারের জন্য একটি ইনপুটটি অনুবাদ করি:

  • প্রতিটি উপসেট জন্য এক অক্ষর আছে সি এবং এক অতিরিক্ত অক্ষর (প্রকাশ এক্স নিম্নলিখিত মধ্যে)।ΣCx
  • প্রতিটি উপাদানের জন্য এক শব্দ ধারণ করে এর ইউ । শব্দটি হ'ল সিতে সাবটেক্টগুলি উপস্থাপন করে এমন অক্ষরগুলি নিয়ে গঠিতযা (স্বেচ্ছাসেবী ক্রমে)ধারণ করে।AeUCe
  • একক শব্দ রয়েছে এক্সBx
  • কেবল বহন করা হয়।k

এই হ্রাস স্পষ্টতই পি তে এবং সমতাও দেখতে খুব সহজ:

  • c1,,ckc1++ck
  • xAkΣAC

1
ABO(n)a1+a2+...,aiAO(n)k

2
AB
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.