(আমাকে এই আলোচনা সম্পর্কে সচেতন করার জন্য গিলাদ বারকানকে (גלעד ברקן) অনেক ধন্যবাদ।)
আমাকে এই সমস্যাটি সম্পর্কে আমার ধারণাগুলি একটি বিশুদ্ধ তাত্ত্বিক দৃষ্টিকোণ থেকে ভাগ করতে দিন (নোট করুন যে আমি "সাবওয়ার্ড" এর পরিবর্তে "ফ্যাক্টর "ও ব্যবহার করি)।
আমি মনে করি যে এখানে বিবেচনা করা সমস্যা (বা সমস্যা) এর পর্যাপ্ত আনুষ্ঠানিক সংজ্ঞাটি নিম্নলিখিত:
একটি ডাব্লু দেওয়া হয়েছে, শব্দগুলি u_1, u_2, ..., u_k সন্ধান করুন
- u_i! = u_j প্রতি i এর জন্য, 1 <= i <j <= k এবং এর সাথে জে
- u_1 u_2 ... u_k = w
ম্যাক্সিমাইজেশন বৈকল্পিক (আমরা অনেকগুলি u_i চাই): সর্বাধিক কে
মিনিমাইজেশন বৈকল্পিক (আমরা সংক্ষিপ্ত u_i চাই): সর্বনিম্ন সর্বোচ্চ {| u_i | : 1 <= i <= কে}
এই সমস্যাগুলি অতিরিক্ত বাউন্ডুলি বি দিয়ে সিদ্ধান্ত গ্রহণের সমস্যা হয়ে দাঁড়ায়, যা আমরা "বহু-কারণ" -ভারেন্ট বা "সংক্ষিপ্ত কারণগুলি" -বিভারেন্টের কথা বলছি কিনা তার অনুসারে, কে এর উপর একটি নিম্ন আবদ্ধ (আমরা কমপক্ষে বি চাই) গুণক), বা সর্বোচ্চ bound | u_i | উপরের আবদ্ধ : যথাক্রমে 1 <= i <= k} (আমরা সর্বাধিক বি দৈর্ঘ্যের গুণক চাই)। এনপি-কঠোরতা সম্পর্কে কথা বলার জন্য, আমাদের সিদ্ধান্তের সমস্যাগুলি সম্পর্কে কথা বলা উচিত।
আসুন "সংক্ষিপ্ত কারণগুলি" -বিভাজন এবং "অনেকগুলি কারণ" -ভেরিয়েন্টের জন্য এমএফ পদটি ব্যবহার করি। বিশেষত, এবং এটি একটি সত্যই গুরুত্বপূর্ণ বিষয়, সমস্যাগুলি এমনভাবে সংজ্ঞায়িত করা হয় যে আমরা কিছু বর্ণমালার উপরে একটি শব্দ পাই যা কোনওভাবেই সীমাবদ্ধ নয়। সমস্যার সংস্করণটি ছিল আমরা কী এমন একটি প্রাইমারী জানি যে আমরা কেবল ইনপুট শব্দগুলি পেয়ে থাকি, বলি, বর্ণমালা {এ, বি, সি, ডি a একটি আলাদা সমস্যা! দ্বারা NP-কঠোরতা নেই না স্বয়ংক্রিয়ভাবে উপর "অবাধ" থেকে "সংশোধন করা হয়েছে বর্ণমালা" বৈকল্পিক (আধুনিক সহজ হতে পারে) এর বহন।
এসএফ এবং এমএফ উভয়ই এনপি-সম্পূর্ণ সমস্যা। এটি যথাক্রমে [1, 1b] এবং [2] এ প্রদর্শিত হয়েছে (যেমন গিলাদ ইতিমধ্যে উল্লেখ করেছেন)। এই আলোচনার শুরুতে যদি আমি এখানে (সম্ভবত খুব) অনানুষ্ঠানিক সমস্যার সংজ্ঞাটি সঠিকভাবে বুঝতে পারি তবে এই আলোচনার সমস্যাটি হ'ল সমস্যা এমএফ। প্রাথমিকভাবে উল্লেখ করা হয়নি যে শব্দগুলি কিছু নির্দিষ্ট বর্ণমালা থেকে সীমাবদ্ধ ছিল, পরে বলা হয় যে আমরা অনুমান করতে পারি যে কেবলমাত্র ছোট-বড় অক্ষর ব্যবহৃত হয়। যদি এর অর্থ হ'ল আমরা কেবলমাত্র নির্দিষ্ট বর্ণমালা- a, b, c, ..., z over এর উপরের শব্দগুলি বিবেচনা করি, তবে এটি আসলে এনপি-কঠোরতার ক্ষেত্রে অনেকটা পরিবর্তিত হবে।
নিবিড় দৃষ্টিভঙ্গি এসএফ এবং এমএফের জটিলতার কিছু পার্থক্য প্রকাশ করে:
- কাগজ [১, ১ বি] দেখায় যে এসএফ এনপি-সম্পূর্ণ রয়ে গেছে যদি আমরা বর্ণমালাকে একটি বাইনারি হিসাবে স্থির করি (আরও সুনির্দিষ্টভাবে: একটি এবং বি এবং একটি আবদ্ধ বি বর্ণের উপরে একটি শব্দ পাওয়া, আমরা এটির দৈর্ঘ্যের স্বতন্ত্র কারণগুলিতে গুণক করতে পারি) সর্বাধিক বি?)।
- কাগজ [1, 1 বি] দেখায় যে এসএফ এনপি-সম্পূর্ণ রয়ে গেছে যদি আমরা বাউন্ড বি = 2 ঠিক করি (আরও সুনির্দিষ্টভাবে: একটি শব্দ ডাবল পাওয়া, আমরা কি এটির দৈর্ঘ্যের স্বতন্ত্র কারণগুলিতে সর্বোচ্চ 2?) তৈরি করতে পারি?)
- কাগজ [3] দেখায় যে যদি বর্ণমালা এবং আবদ্ধ বি উভয়ই স্থির করা হয়, তবে এসএফ বহু-কালীন সময়ে সমাধান করা যেতে পারে।
- কাগজ [২] দেখায় যে এমএফ এনপি-সম্পূর্ণ, তবে কেবলমাত্র বর্ণমালা সীমাবদ্ধ না থাকলে বা কোনও পূর্বনির্ধারিত স্থির করা হয় না ! বিশেষত, যদি সমস্যাটি এনপি-সম্পূর্ণ হয় তবে এটি প্রশ্নের উত্তর দেয় না যদি আমরা কেবলমাত্র কিছু নির্দিষ্ট বর্ণমালায় (যেমন ব্যবহারিক সেটিংসে যেমন হয় তেমন ক্ষেত্রে) শব্দগুলি বিবেচনা করি।
- কাগজ [3] দেখায় যে এমএফ বহুবর্ষীয় সময়ে সমাধান করা যেতে পারে যদি ইনপুট বাউন্ডস বি কিছুটা ধ্রুবক দ্বারা আবার উপরের সীমানা হয়, অর্থাৎ সমস্যা ইনপুটটি একটি শব্দ এবং একটি bound 1, 2, ..., কে K , যেখানে কে কিছু স্থির ধ্রুবক।
এই ফলাফল সম্পর্কে কিছু মন্তব্য: রাইট (1) এবং (2), এটি স্বজ্ঞাতভাবে পরিষ্কার যে বর্ণমালা যদি বাইনারি হয় তবে সমস্যাটি এসএফকে কঠিন করার জন্য, আবদ্ধ বিটিও ঠিক করা যাবে না। বিপরীতে, বি = 2 ঠিক করার অর্থ হ'ল কঠিন দৃষ্টান্ত তৈরি করতে বর্ণমালার আকারটি আরও বড় হওয়া উচিত। ফলস্বরূপ, (3) বরং তুচ্ছ (আসলে, [3] কিছুটা আরও বলেছে: আমরা তখন চলমান সময়টিকে কেবল বহুপক্ষীয় নয়, তবে | ডাব্লু | a 2 বারের চেয়ে বেশি কারণ হিসাবে চিহ্নিত করতে পারি যা কেবল বর্ণমালার আকারের উপর নির্ভর করে এবং আবদ্ধ বি)। (5) পাশাপাশি কঠিন নয়: বি এর তুলনায় আমাদের শব্দটি দীর্ঘ হয়, তবে আমরা বিভিন্ন দৈর্ঘ্যের কারণগুলিতে কেবল বিচ্ছিন্ন হয়ে কাঙ্ক্ষিত গুণনীয়করণ পেতে পারি। যদি তা না হয়, তবে আমরা সমস্ত সম্ভাবনার উপর চাপ প্রয়োগ করতে পারি, এটি কেবল বিতে ঘনিষ্ঠ, যা এই ক্ষেত্রে স্থির হিসাবে ধরে নেওয়া হয়।
সুতরাং আমাদের কাছে থাকা চিত্রটি নিম্নরূপ: এসএফ আরও কঠিন বলে মনে হচ্ছে, কারণ আমাদের এমনকি নির্দিষ্ট বর্ণমালা বা একটি নির্দিষ্ট বাউন্ড বিয়ের জন্যও কঠোরতা রয়েছে অন্যদিকে এমএফ সমস্যাটি সীমাবদ্ধ থাকলে পলি-টাইম দ্রবণযোগ্য হয় (মধ্যে এই বিষয়ে এটি এসএফের চেয়ে সহজ), তবে বর্ণমালার আকারটি সম্পর্কিত প্রশ্নটি খোলা থাকে। সুতরাং এমএফ এসএফের তুলনায় কিছুটা কম জটিল, এমনকি যদি দেখা যায় যে স্থির বর্ণমালার জন্য এমএফও এনপি-সম্পূর্ণ। তবে, যদি এটি দেখানো যায় যে পল-টাইমে স্থির বর্ণমালাগুলির জন্য এমএফ সমাধান করা যায়, তবে এমএফকে এসএফের চেয়ে অনেক বেশি সহজ দেখানো হয় ... কারণ এটির জন্য এটি শক্ত একটি ক্ষেত্রে কিছুটা কৃত্রিম (আনবাউন্ড বর্ণমালা!) ।
আবদ্ধ বর্ণমালা দ্বারা এমএফের কেস সমাধান করার চেষ্টা করার জন্য আমি কিছুটা চেষ্টা করেছিলাম, তবে আমি এটি নিষ্পত্তি করতে সক্ষম হইনি এবং তখন থেকেই এটিতে কাজ করা বন্ধ করে দিয়েছি। আমি বিশ্বাস করি না যে অন্যান্য গবেষকরা এটি সমাধানের জন্য খুব কঠোর প্রচেষ্টা করেছেন (তাই এটি খুব কঠিন ওপেন সমস্যাগুলির মধ্যে একটি নয়, অনেক লোক ইতিমধ্যে চেষ্টা করেছে এবং ব্যর্থ হয়েছে; আমি এটাকে কোনওভাবেই অক্ষম মনে করি)। আমার অনুমানটি হ'ল এটি স্থির বর্ণমালার জন্যও এনপি-হার্ড, তবে সম্ভবত হ্রাসটি এত জটিল যে আপনি "এমএফ 35 বা তার চেয়ে বড় আকারের বর্ণমালার জন্য শক্ত" বা এমন কিছু পাবেন যা খুব ভাল লাগবে না either ।
আরও সাহিত্যের বিষয়ে, আমি কাগজটি জানি [4], যা ডাব্লু শব্দেরকে পৃথক ফ্যাক্টরগুলিতে বিভক্ত করার সমস্যা বিবেচনা করে u_1, u_2, ..., u_k যা সমস্ত প্যালিনড্রোম, যা এনপি-সম্পূর্ণও।
আমি কাগজে একটি তাত্ক্ষণিকভাবে নজর রেখেছি [5], গিলাদ নির্দেশ করেছেন। যদিও এটি অন্যরকম সেটিং বিবেচনা করে। এই গবেষণাপত্রে, লেখকগণ একটি নির্দিষ্ট শব্দের মধ্যে কতগুলি স্বতন্ত্র উপসর্গ বা সাব-ওয়ার্ড অন্তর্ভুক্ত থাকতে পারে তার সম্মিলিত প্রশ্নে আগ্রহী, তবে এগুলি ওভারল্যাপ করতে পারে। উদাহরণস্বরূপ, আয়াবাব 20 টি পৃথক সাবওয়ার্ড এ, বি, আ, আব, বা, বিবি, আআআব, আব, আব, বা, আব, আব, আব, আব, আবা, আবাবা, আবাব, আবাবা, আবাবা (সম্ভবত আমি) ভুল হিসাববিহীন, তবে আপনি ধারণাটি পাবেন)। তাদের কারও কারও একটি মাত্র ঘটনা রয়েছে, যেমন বা'এর মতো, কিছু আবার আ'র মতো। যাইহোক, প্রশ্নটি নয় যে আমরা কীভাবে অনেকগুলি পৃথক কারণ পেতে শব্দটি বিভক্ত করতে পারি, কারণ এর অর্থ প্রতিটি পৃথক প্রতীক হ'ল একটি কারণকে অবদান রাখে।
এই ধরণের সমস্যার ব্যবহারিক সমাধান সম্পর্কে (মনে রাখবেন যে আমি একজন তাত্ত্বিক, তাই নুনের দানার সাথে এটি নিন):
আমার জ্ঞানের মতে, এমন কোনও তাত্ত্বিক নিম্ন সীমানা নেই (যেমন এনপি-হার্ডনেস) যা বহুগুণে এমএফ সমাধান করার জন্য এটি বাতিল করে দেয় যদি আমরা একটি নির্দিষ্ট বর্ণমালায় কেবল ইনপুট শব্দ বিবেচনা করি। একটি সতর্কতা রয়েছে, যদিও: আপনি যদি পলি-টাইম অ্যালগরিদম পান, তবে এটি নির্দিষ্ট বর্ণমালা (বা এর কোনও ফাংশনে ক্ষতিকারক) থেকে চিহ্নগুলির সংখ্যায় তাত্পর্যপূর্ণভাবে চালানো উচিত! অন্যথায় আনবাউন্ডেড বর্ণমালার ক্ষেত্রে এটি বহুবর্ষীয় সময়ের অ্যালগরিদম হতে পারে। সুতরাং, একজন তাত্ত্বিক হওয়ার কারণে, আমি আলগোরিদিমিক কাজগুলি সন্ধান করব যা কেবল সময়ের সূচক হিসাবে গণনা করা যায় কেবলমাত্র চিহ্নগুলির সংখ্যা এবং যা এমএফের জন্য কোনওভাবে অ্যালগরিদম তৈরি করতে সহায়তা করে। অন্যদিকে, সম্ভবত এই জাতীয় অ্যালগরিদমের অস্তিত্ব নেই এবং এমএফ স্থির-বর্ণমালা ক্ষেত্রে এনপি-হার্ডও রয়েছে।
আপনি যদি প্রাকটিক্যাল সমাধানগুলিতে আগ্রহী হন তবে সমাধানটি আনুমানিকভাবে সহায়ক হতে পারে। সুতরাং সবচেয়ে খারাপ ক্ষেত্রে সর্বোত্তম হিসাবে অর্ধেক বড় হওয়ার গ্যারান্টিযুক্ত ফ্যাক্টরিজেশন পাওয়া খুব খারাপ হবে না।
হিউরিস্টিক্স যা একটি প্রবণতাযোগ্য আনুমানিক অনুপাত দেয় না, তবে একটি ব্যবহারিক সেটিংয়ে ভাল কাজ করাও আকর্ষণীয় হবে, আমার ধারণা।
সমস্যার উদাহরণগুলি স্যাট বা আইএলপি-দৃষ্টান্তে রূপান্তর করা খুব কঠিন হওয়া উচিত নয় এবং তারপরে আপনি সর্বোত্তম সমাধান পেতে এমনকি একটি স্যাট বা আইএলপি-সলভার চালাতে পারেন।
আমার ব্যক্তিগত মতামতটি এমএফ-এর স্থির-বর্ণমালা ক্ষেত্রে এনপি-হার্ড কিনা তা জানা না গেলেও পর্যাপ্ত তাত্ত্বিক অন্তর্দৃষ্টি রয়েছে যা বোঝায় যে সমস্যাটি যথেষ্ট কঠিন তাই এটি বৌদ্ধিক সমাধানগুলি অনুসন্ধান করার পক্ষে যুক্তিযুক্ত কিনা ইত্যাদি that একটি ব্যবহারিক সেটিং ভাল কাজ।
বিবলিওগ্রাফি:
[১] অ্যান কন্ডন, জান মানুচ, ক্রিস থাচুক: স্ট্রিং বিভাজনের জটিলতা। জে ডিস্রিপ্ট অ্যালগরিদম 32: 24-43 (2015)
[১ বি] অ্যান কন্ডন, জান মানুচ, ক্রিস থাচুক: জিন সংশ্লেষের জন্য অলিগো ডিজাইনের সাথে সংঘাত-সচেতন স্ট্রিং পার্টিশন সমস্যা এবং এর সম্পর্ক lation কুকুন ২০০৮: 265-275 75
[২] হেনিং ফার্নাউ, ফ্লোরিন ম্যানিয়া, রবার্ট মারকাস, মার্কাস এল শ্মিড: পরিবর্তনশীলদের সাথে প্যাটার্ন ম্যাচিং: ফাস্ট অ্যালগোরিদম এবং নতুন কঠোরতার ফলাফল। স্ট্যাকস 2015: 302-315
[3] মার্কাস এল। শ্মিড: সাম্য-মুক্ত এবং পুনরাবৃত্তিমূলক স্ট্রিং ফ্যাক্টরিফিকেশনগুলি গণনা করা হচ্ছে। Theor। Comput। সী। 618: 42-51 (2016)
[৪] হিদেও বাননাই, ট্র্যাভিস গাগি, শুনসুক ইনেনাগা, জুহা কার্ক্কেসিনেন, ডোমিনিক কেম্পা, মার্সিন পাইটকোস্কি, শিহো সুগিমোটো: বিবিধ প্যালিনড্রমিক ফ্যাক্টরাইজেশন হ'ল এনপি-কমপ্লিট। আইএনটি। জে। Comput। সী। 29 (2): 143-164 (2018)
[৫] আব্রাহাম ফ্ল্যাক্সম্যান, আরম ওয়েটারথ হ্যারো, গ্রেগরি বি। সারকিন: সর্বাধিক অনেকগুলি পৃথক সাবসেক্সেন্স এবং সাবস্ট্রিং সহ স্ট্রিংস। Electr। জে ঝুঁটি 11 (1) (2004)
aab|a|b|aaএখনও বিভক্ত হতে পারে যা এখনও 4