সীমাবদ্ধ সীমাবদ্ধতার একটি সীমাবদ্ধ সেট প্রদান করে ব্যাকরণ তৈরির জন্য কি কোনও পরিচিত পদ্ধতি রয়েছে?


10

আমার পড়া থেকে মনে হয় বেশিরভাগ ব্যাকরণকারী অসীম সংখ্যক স্ট্রিং তৈরির সাথে সম্পর্কিত। আপনি যদি অন্যভাবে কাজ করে থাকেন তবে কি হবে?

যদি দৈর্ঘ্যের এন স্ট্রিং দেওয়া থাকে তবে একটি ব্যাকরণ তৈরি করা সম্ভব যা এই স্ট্রিংগুলি তৈরি করতে পারে এবং কেবল সেই স্ট্রিং তৈরি করতে পারে।

এটি করার জন্য একটি জ্ঞাত পদ্ধতি আছে? আদর্শভাবে একটি কৌশল নাম যা আমি গবেষণা করতে পারি। বিকল্পভাবে, আমি কীভাবে এমন একটি পদ্ধতি খুঁজে পেতে সাহিত্য অনুসন্ধান করতে যাব?


5
তুচ্ছ: স্ট্রিংগুলির বিএনএফ টেবিল তৈরি করুন।
জোশুয়া

স্ট্রিংস সংজ্ঞা অনুসারে সীমাবদ্ধ। এবং আপনার কোনও সীমাবদ্ধ বর্ণনা না থাকলে আপনি একটি "অসীম" সেটটি পেতে পারবেন না।
ভনব্র্যান্ড

উত্তর:


11

এটি "ব্যাকরণ অন্তর্ভুক্তি" এর সাধারণ বিষয়ের মধ্যে পড়ে; এই শব্দগুচ্ছটি অনুসন্ধান করা সাহিত্যের টন পরিণত করবে। দেখুন, উদাহরণস্বরূপ, প্রসঙ্গমুক্ত ব্যাকরণ প্রেরণা , https://en.wikedia.org/wiki/Grammar_induction , https://cstheory.stackexchange.com/q/27347/5038

নিয়মিত ভাষার জন্য (প্রসঙ্গমুক্ত ভাষাগুলির চেয়ে) আরও দেখুন, রেজেক্স গল্ফ কি এনপি-সম্পূর্ণ? , সবচেয়ে ছোট ডিএফএ যা প্রদত্ত স্ট্রিংগুলিকে গ্রহণ করে এবং অন্যান্য প্রদত্ত স্ট্রিংগুলি প্রত্যাখ্যান করে , নিয়মিত সেটগুলি শেখার জন্য ডানা অ্যাংলুইনের অ্যালগরিদম এবং https://cstheory.stackexchange.com/q/1854/5038 এ উন্নতি হয়েছে ?


সম্ভবত অসীম নিয়মিত ভাষার জন্য ব্যাকরণকে প্ররোচিত করা এই সমস্যা থেকে বেশ শক্ত এবং বেশ আলাদা।
পুনরায় পোস্টার

আমি এই প্রশ্নটিকে সঠিক হিসাবে চিহ্নিত করছি, যদিও যদিও এটি সরাসরি প্রশ্নের উত্তর দেয় না (যা প্রমাণিত হয় তুচ্ছ হিসাবে সমাধানযোগ্য) তবে এটি আমাকে আরও গবেষণা করার মতো ধরণের পরিভাষা সরবরাহ করে।
গুস্তাভ বার্ট্রাম

8

স্ট্রিংয়ের সংখ্যা যদি সীমাবদ্ধ থাকে তবে সেটটি বলুন এস={গুলি1,গুলি2গুলিমি} আপনি সর্বদা প্রাসঙ্গিক মুক্ত ব্যাকরণ নিয়ে আসতে পারেন যা এই সমস্ত স্ট্রিং উত্পন্ন করে, আসুন একজন নন টার্মিনাল হতে হবে তবে নিয়ম হতে পারে একজনগুলি1|গুলি2|গুলিএন। একটি সীমাবদ্ধ সংক্ষিপ্ত সেটের জন্য আপনি এমনকি সীমাবদ্ধ রাষ্ট্র অটোমেটা নিয়ে আসতে পারেন যা কেবলমাত্র সেই স্ট্রিং গ্রহণ করে। সুতরাং স্ট্রিংস এর সীমাবদ্ধ সেট কেস সত্যিই তুচ্ছ।


আমার মনে হয় আমার পার্সিং পাঠ্যপুস্তকটি আমার পর্যালোচনা করা উচিত। পূর্ববর্তী ক্ষেত্রে এই উত্তরটি সুস্পষ্ট বলে মনে হচ্ছে। ধন্যবাদ!
গুস্তাভ বার্ট্রাম

3

প্রচুর উপায় রয়েছে, সুতরাং আপনাকে ফলাফলের মানের উপর অতিরিক্ত মানদণ্ড চাপিয়ে দেওয়া দরকার।

  1. তালিকা: প্রতিটি স্ট্রিং জন্য W ভাষায়, একটি নিয়ম আছে এসW। দিনএসশুরুর অবিরাম হতে। সম্পন্ন.
  2. উপসর্গ গাছ: প্রতিটি উপসর্গের জন্য W ভাষার একটি স্ট্রিং এর, অবিচ্ছিন্ন থাকে এক্সW। প্রতিটি স্ট্রিং জন্যW1এক্সW2 ভাষা, যেখানে এক্স একটি প্রতীক, নিয়ম আছে এক্সW1এক্সএক্সW2। প্রতিটি স্ট্রিং জন্যW ভাষা, নিয়ম আছে এক্সWε। দিনএক্সεশুরুর অবিরাম হতে। সম্পন্ন.
  3. প্রত্যয় গাছ: একই, বিপরীত।
  4. ন্যূনতম সংখ্যার সাথে ন্যূনতম আকারের ব্যাকরণ তৈরির গ্যারান্টিযুক্ত একটি অ্যালগরিদম প্রয়োগ করা। আমি জানি না এটি কতটা কঠিন।

হ্যাঁ, প্রথম উত্তরের পরে এটি স্পষ্ট ছিল যে আমার অতিরিক্ত মানদণ্ড চাপানো উচিত ছিল, তবে প্রথম উত্তরের পরে প্রশ্নটি পরিবর্তন করা অনুচিত বলে মনে হয়েছিল।
গুস্তাভ বার্ট্রাম

তবুও, আমি একটি নির্দিষ্ট সীমাবদ্ধ স্ট্রিং সেটের জন্য ন্যূনতম ব্যাকরণের সন্ধানের সময়ের জটিলতা জানতে আগ্রহী ... আসুন আমরা বলি, স্ট্রিংগুলির মোট দৈর্ঘ্য বা ফলাফলের মোট দৈর্ঘ্যে।
পুনরায় পোস্টার

3

আপনি যা জিজ্ঞাসা করছেন তা অনুসন্ধান সূচকের অনুরূপ। প্রকৃতপক্ষে ফাইনাইট স্টেট ট্রান্সডুসারগুলি তাদের দেওয়া টেক্সটকে তৈরি করতে এবং ব্যবহার করতে পারে। এক্সামপেটের জন্য, লুসিন এই অ্যালগরিদমটি ব্যবহার করেছেন: http://citeseerx.ist.psu.edu/viewdoc/summary?doi=10.1.1.24.3698

ব্যবহারিক ব্যবহারের জন্য, অ্যান্ড্রু গ্যালান্টের এই ব্লগ পোস্টটি দেখুন: অটোমাতা এবং মরিচা সহ 1,600,000,000 কীগুলি সূচক

পোস্টে তিনি এফএসএ তৈরির একটি পদ্ধতি বর্ণনা করেছেন যাতে পাঠ্যের একটি কর্পাস দেওয়া হয় যাতে এটি সমস্ত শব্দকেই স্বীকৃতি দেয়। শেষ ফলাফলটি লিনিয়ার সময় এবং ধ্রুবক স্মৃতিতে প্রাক-সাজানো কীগুলি থেকে প্রায় ন্যূনতম এফএসটি নির্মাণ করা const

এফএসএ উপস্থাপনা এবং প্রত্যয় ভাগ করে নিচ্ছে

বাস্তবায়ন তার fstলাইব্রেরিতে পাওয়া যায় : https://github.com/BurntSushi/fst


1

রিইনারপোস্ট দ্বারা উত্থিত প্রশ্নের উত্তর যা মূল প্রশ্নেরও উত্তর দেয়:

আমরা অভিধানটি অটোমেটনটি নিম্নলিখিতভাবে তৈরি করি:

  1. একটি অটোমেটন তৈরি করুন যা প্রথম স্ট্রিংটি পড়ে এবং গ্রহণ করে reads
  2. পরবর্তী স্ট্রিংয়ের জন্য, অটোমেটনের সাথে এটি পড়া শুরু করুন যতক্ষণ না কোনও চিঠির কোনও পরিবর্তন হয় না। স্ট্রিংয়ের বাকি অংশগুলির জন্য একটি নতুন শাখা শুরু করুন। সমস্ত স্ট্রিং প্রক্রিয়া না করা পর্যন্ত পুনরাবৃত্তি করুন

অটোমেটনের সর্বাধিক আকার হ'ল ইনপুট স্ট্রিংগুলির মোট দৈর্ঘ্য। ধরে নিই যে আপনি ট্রানজিশনগুলি অনুকরণ করতে পারেন এবং ধ্রুব সময়ে নতুন তৈরি করতে পারেন, রানটাইম হ'ল ইনপুট স্ট্রিংগুলির মোট দৈর্ঘ্য। কোনও সেরা বা খারাপ পরিস্থিতি নেই।

এই অটোমেটনটি ন্যূনতম। যেহেতু নিয়মিত ক্ষেত্রে অটোমাতা এবং ব্যাকরণগুলি একে অপরের সাথে মিলিত হয়, তাই ব্যাকরণের ক্ষেত্রেও এটি একই সত্য, অবশ্যই এন সময়ের চেয়ে কম আকারের আকারের কিছু তৈরি করা অসম্ভব।


ধন্যবাদ। যতদূর এই প্রশ্নের উত্তর দেওয়া যায়: রিনিয়ারপোস্টের ক্ষেত্রে এটি কী অবদান রাখে তা আমি দেখতে পাই না। এছাড়াও, আমরা এমন উত্তর চাই না যা প্রতিক্রিয়া জানায় বা অন্য উত্তরে মন্তব্য করেছে: এটি কোনও আলোচনার ফোরাম নয়। এটি করার উপায়টি হ'ল একটি নতুন প্রশ্ন পোস্ট করা এবং তারপরে আপনি নিজেই উত্তর দিন। আমি বুঝতে পারি যে এটি সুস্পষ্ট নাও হতে পারে। [এটি বলেছিল, আপনার উত্তর কীভাবে সমস্যার পুনরায় পোস্টের বিষয়ে কৌতূহল ছিল উত্তর দেয় না। রিইনারপোস্টের উত্তর শেষে সমস্যাটি ছিল ন্যূনতম সংখ্যার সাথে ব্যাকরণ সন্ধান করা। আপনার উত্তরটি দেখায় যে কীভাবে ন্যূনতম সংখ্যক রাজ্যের সাথে ডিএফএ তৈরি করা যায়। (অবিরত)
DW

1
অবশ্যই আমরা সেই ডিএফএকে একটি নিয়মিত ব্যাকরণে রূপান্তর করতে পারি, তবে ব্যাকরণে নিয়মের সংখ্যার দিক থেকে এটি কী ন্যূনতম হবে বলে আপনি মনে করেন? মনে হচ্ছে এর প্রমাণ দরকার]]
ডিডাব্লু

আমার উত্তরটি রানটাইমটি যা অবদান রাখবে তা আমি ভাবি। আপনি ঠিক বলেছেন, বেশ কয়েকটি জিনিস যা আমি বলি তার কিছু প্রমাণ প্রয়োজন। তবে ফিনাইট অটোমেটা ট্রানজিশন এবং নিয়মিত ব্যাকরণের নিয়মের মধ্যে যোগাযোগ আমার পক্ষে খুব স্পষ্ট (যদি পরবর্তীকরা কেবলমাত্র বেশিরভাগ সংজ্ঞা অনুসারে নিয়ম অনুযায়ী একটি টার্মিনাল তৈরি করতে পারে); তারপরে আমার চেয়ে ছোট যেকোন ব্যাকরন ন্যূনতমের চেয়ে ছোট একটি অটোমেটন দেবে। সুতরাং আমি মনে করি ন্যূনতম অটোমেটনের ব্যাকরণ (আমি প্রমাণ করি না যে খনি ন্যূনতম) আমিও ন্যূনতম হবে be - আমি উত্তরগুলি সম্পর্কিত আপনার পরামর্শটি মনে রাখব, ধন্যবাদ
পিটার লিউপল্ড

ডিএফএ'র জন্য সংক্ষিপ্ততার ধারণাটি রাজ্যের সংখ্যার সাথে সম্পর্কিত । এটি কি ডিএফএতে সংক্রমণের সংখ্যার সাথে সংখ্যার সংকেত বা ফলাফল ব্যাকরণে নিয়মের সংখ্যার ন্যূনতমতার পরিচয় দেয়? আমি মনে করি আপনার মেট্রিকটি কী তা আমাদের ট্র্যাক করে রাখতে হবে, অন্যথায় আমি উদ্বিগ্ন যে আমরা কমলাগুলির সাথে আপেলের তুলনা করব।
DW

সঠিক, ব্যাকরণটি নন-টার্মিনালগুলিতে ন্যূনতম হবে। নিয়মের জন্য, এটি পরিষ্কার নয়।
পিটার লিওপল্ড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.