চমস্কি-শ্রেণিবিন্যাস কি পুরানো?


45

চমস্কি (üSchützenberger) শ্রেণিবদ্ধতা তাত্ত্বিক কম্পিউটার বিজ্ঞানের পাঠ্যপুস্তকগুলিতে ব্যবহৃত হয়, তবে এটি সম্পূর্ণ জটিলতা চিড়িয়াখানার চিত্রের তুলনায় প্রথাগত ভাষার (আরইজি, সিএফএল, সিএসএল, আরই) খুব সামান্য অংশকেই আবৃত করে । শ্রেণিবিন্যাস কি বর্তমান গবেষণায় কোনও ভূমিকা পালন করে? আমি এখানে চেমস্কির খুব কম রেফারেন্স পেয়েছি cstheory.stackexchange এ এবং কমপ্লেক্সি চিড়িয়াখানায় চমস্কি এবং স্কটজেনবার্গারের নাম মোটেও উল্লেখ করা হয়নি।

বর্তমান গবেষণা কি বর্ণনার অন্যান্য উপায়ে ফর্মাল ব্যাকরণের চেয়ে বেশি কেন্দ্রীভূত? আমি বিভিন্ন অভিব্যক্তি সহ প্রথাগত ভাষাগুলির বর্ণনা দেওয়ার জন্য ব্যবহারিক পদ্ধতিগুলির সন্ধান করছিলাম এবং ক্রমবর্ধমান প্রসঙ্গে সংবেদনশীল ভাষা (জিসিএসএল) এবং দৃশ্যমান পুশডাউন ল্যাঙ্গুয়েজ (ভিপিএল), যা উভয়ই ক্লাসিক চমস্কি ভাষার মধ্যে অবস্থিত upon চমস্কি শ্রেণিবিন্যাসগুলিকে অন্তর্ভুক্ত করার জন্য কী আপডেট করা উচিত নয়? বা জটিলতা ক্লাসের সম্পূর্ণ সেট থেকে নির্দিষ্ট শ্রেণিবদ্ধতা নির্বাচনের কোনও ব্যবহার নেই? আমি কেবল সেগুলিকেই বেছে নেওয়ার চেষ্টা করেছি যেগুলি চমস্কি শ্রেণিবিন্যাসের ফাঁকে উপযুক্ত হতে পারে, যতদূর আমি বুঝতে পারি:

আরইজি (= চমস্কি ৩) ⊊ ভিপিএল ⊊ ডিসিএফএল ⊊ সিএফএল (= চমস্কি ২) ⊊ জিসিএসএল ⊊ সিএসএল (= চমস্কি ১) ⊊ আর ⊊ আরই

প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের জন্য ব্যবহারিক প্রাসঙ্গিকতা বলে মনে হলেও ("সিএফএল এবং সিএসএল-এর মধ্যে কোথাও)" "হালকা প্রসঙ্গে সংবেদনশীল ভাষা" এবং "সূচীকৃত ভাষাগুলি" যেখানে খাপ খায় আমি এখনও পাই না (তবে ব্যবহারিক প্রাসঙ্গিকতার কোনও কিছু কম আকর্ষণীয় নয়) তাত্ত্বিক গবেষণায় ;-)। P এবং NP এর বিখ্যাত ক্লাসগুলির সম্পর্ক দেখানোর জন্য আপনি GCSL ⊊ P ⊂ NP ⊂ PSPACE এবং CSL ⊊ PSPACE ⊊ R উল্লেখ করতে পারেন।

আমি জিসিএসএল এবং ভিপিএলে পেয়েছি:

  • রবার্ট ম্যাকনফটন: চমস্কি হায়ারার্কির মধ্যে একটি সন্নিবেশ ?. ইন: জুয়েলস চিরদিনের জন্য, আর্টো সালোমার সম্মানে তাত্ত্বিক কম্পিউটার বিজ্ঞানের জন্য অবদান। এস 204-212, 1999
  • http://en.wikedia.org/wiki/Nected_word#References (VPL)

আপনি যদি আনুষ্ঠানিক ব্যাকরণ সম্পর্কে আরও সাম্প্রতিক পাঠ্যপুস্তকটি জানেন যা ভিপিএল, ডিসিএলএফ, জিসিএসএল এবং সূচকযুক্ত ব্যাকরণগুলির সাথে ব্যবহার করে তবে ব্যবহারিক অ্যাপ্লিকেশনগুলিতে পয়েন্টারের চেয়ে পছন্দসই I'd


7
একটি ছোট্ট বিষয়: কমপ্লেক্সিটি চিড়িয়াখানায় চমস্কি এবং স্কটজেনবার্গারের নামের অনুপস্থিতি আমি এই প্রমাণ হিসাবে দেখি না যে, "চমস্কি শ্রেণিবদ্ধতা পুরানো।" চমস্কি শ্রেণিবিন্যাস আনুষ্ঠানিক ভাষা তত্ত্বের একটি ধারণা। জটিলতা চিড়িয়াখানাটি মূলত জটিলতা তত্ত্ব সম্পর্কিত একটি ওয়েবসাইট, যদিও এটি প্রাসঙ্গিক ভাষা হিসাবে প্রথাগত ভাষা তত্ত্বের কিছু ধারণা ধারণ করে। এগুলি সম্পর্কিত তবে স্বতন্ত্র ক্ষেত্র। আনুষ্ঠানিক ভাষা তত্ত্বের পাঠ্যপুস্তকে যদি এটি উল্লেখ না করা হয় তবে এটি পুরানো হবে, তবে আমি জানি না যে এটি ঘটনাটি কিনা।
Tsuyoshi Ito

7
শুভ পয়েন্ট, স্যুওশি। সত্যই, আমি একটি ভাল তাত্ত্বিক গ্রাউন্ডিং (গবেষণাপত্রের রেফারেন্স!) তবে ব্যবহারিক সংস্থান সহ একটি "সাধারণ ভাষা চিড়িয়াখানা" দেখতে চাই। উদাহরণস্বরূপ, ব্যাকাস-নওর-ফর্মের কয়েক ডজন সিনট্যাক্স ভেরিয়েন্ট এবং নিয়মিত এক্সপ্রেশনগুলির বিভিন্ন রূপ রয়েছে (এর মধ্যে কয়েকটি নিয়মিত নয়)। সরল চমস্কি-শ্রেণিবিন্যাসের পাশাপাশি আমি আনুষ্ঠানিক ভাষাগুলিতে গবেষণার বর্তমান অবস্থার সুস্পষ্ট চিত্র পাওয়া কঠিন বলে মনে করি।
Jakob

আপনি নিয়মিত ভাষার নীচে স্টার-মুক্ত ভাষাও যুক্ত করতে পারেন। তারা নিয়মিত মত, তবে ক্লিন তারকা ছাড়া। সুপরিচিত। ভাল আচরণ করেছে।
wren রোমানো

বেশ কয়েকটি উত্তর আমাকে দেখায় যে, আনুষ্ঠানিক ব্যাকরণ Ch লা চমস্কি আনুষ্ঠানিক ভাষাগুলির বর্ণনা দেওয়ার জন্য একটি historicতিহাসিক পদ্ধতি, এটি তার সীমাতে পৌঁছেছে। আমি এখনও আনুষ্ঠানিক ব্যাকরণের একটি ভাল ওভারভিউ খুঁজছি, যে জটিলতা তত্ত্ব উপর দৃষ্টি নিবদ্ধ করা হয় না, তবে পরবর্তী সমস্ত রেফারেন্সের জন্য ধন্যবাদ! আমি ম্যাগলের উত্তরটি গ্রহণ করব কারণ তার এখন পর্যন্ত কম খ্যাতি রয়েছে।
Jakob

2
কম্পিউটার সায়েন্সে কম্পিউটার ল্যাঙ্গুয়েজ ডিজাইন, সফটওয়্যার ডিজাইন এবং প্রোগ্রামিং, প্রসঙ্গমুক্ত ব্যাকরণ এবং ভাষা এবং নিয়মিত প্রকাশ এবং ভাষা হল বুনিয়াদি কাজের সরঞ্জাম এবং যথারীতি গুরুত্বপূর্ণ। কিন্তু অন্যদিকে নির্বিচারে ব্যাকরণ, এলবিএ এবং প্রসঙ্গ-সংবেদনশীল ভাষার জন্য, আমি খুব কম অ্যাপ্লিকেশন দেখেছি বা কিছুই দেখিনি।
পুনরায় পোস্টার

উত্তর:


20

প্রাকৃতিক ভাষা প্রসেসিং সম্প্রদায়ের যা আমি দেখেছি তা থেকে আনুষ্ঠানিক ব্যাকরণ à লা চমস্কি আর তেমন ব্যবহার হয় না। তারা (খুব) মনে করে যে চমস্কি হায়ারার্কি মডেল ভাষার সাথে পুরানো।

যার স্থানটি নিয়েছিল তা হ'ল রি-লিটিং রুল (লার্স অ্যালগরিদম), নির্ভরতা মডেল (ড্যান ক্লিন), ট্রি সাবস্টিটিউশন ব্যাকরণ (ডিওপি মডেল), বাইনারি ফিচার ব্যাকরণ (অ্যালেক্স ক্লার্ক) stuff


আমার উত্তরটি পুনরায় পড়া, আমি এটি খুব শব্দ চেয়েছিলাম চেয়ে বেশি নেতিবাচক শোনায়। আরএল এবং সিএফএল কখনও প্রাকৃতিক ভাষার বাস্তবের মডেল হওয়ার কথা ছিল না এবং বেশিরভাগ "নতুন" মডেল তাদের মধ্যে অনুপ্রাণিত হয়।
mugle

আমি ভেবেছিলাম যে আরএল এমনকি প্রাকৃতিক ভাষার মডেল হিসাবে ডিজাইন করা হয়নি, তবে কিছু সিস্টেম আচরণের একটি মডেল হিসাবে। [ক্লিনির মূল
পাঠ্যটিও

26

সংক্ষেপে: হ্যাঁ

আরও বিশেষত: ভাষা, ব্যাকরণ এবং অটোমেটা সম্পর্কিত হায়ারার্কিকে আনুষ্ঠানিকভাবে প্রথাগত করার জন্য চমস্কি অন্যতম। এই অন্তর্দৃষ্টি এখনও খুব প্রাসঙ্গিক এবং অটোমাতা তত্ত্বের সমস্ত ইন্ট্রো কোর্সে শেখানো হয়। তবে, নির্দিষ্ট শ্রেণিবিন্যাস চমস্কি নিয়ে এসেছিল এবং শ্রেণিবিন্যাসের উপাদানগুলির নামগুলি আসলেই তাত্পর্যপূর্ণ নয়। এর পর থেকে আমরা প্রচুর আনুষ্ঠানিকতা আবিষ্কার করেছি যা চমস্কির শ্রেণিবিন্যাসের স্তরগুলির, এর ওপরে বা এর নীচে পড়ে between এবং চমস্কি ব্যবহার করা নামগুলি বিশেষ আকর্ষণীয় নয়, অর্থাত্‍ এগুলি জটিলতা বা কোনও কিছুর আকর্ষণীয় পরিমাপের উপর ভিত্তি করে নয়, তারা কেবল সংখ্যা। মৃদু প্রসঙ্গে সংবেদনশীল ভাষাগুলি টাইপ -১.৫ বা টাইপ -১.7 বা টাইপ -১.৩ হওয়া উচিত? কে পাত্তা দেয়। "মৃদু প্রসঙ্গে সংবেদনশীল" অনেক বেশি তথ্যবহুল নাম।

জটিলতা চিড়িয়াখানাটি কিছুটা আলাদা কারণ এটি শর্তাধীন সমতা এবং এর মতো সমস্ত ধরণের পূর্ণ। অটোমাতা তত্ত্বের জন্য আরও আধুনিক শ্রেণিবিন্যাস রৈখিক হবে না (উদাহরণস্বরূপ, সিএফজি বনাম পিইজি তুলনা করুন) তবে এটির এখনও একটি সুপরিচিত টপোলজি থাকবে। আধুনিক অটোমেটা তত্ত্বের উপর দৃষ্টিভঙ্গি পাওয়ার জন্য আপনাকে পার্সার কম্বিনেটর লাইব্রেরি এবং একীকরণ এবং টাইপ তত্ত্বের কিছু স্টাফের দিকে নজর দেওয়া উচিত (যদিও উভয় শাখা প্রশস্তভাবে বাইরে রয়েছে)।


4
হ্যাঁ, আমরা আরও ভাল নাম পেয়েছি। এর অর্থ এই নয় যে ফলাফলগুলি পুরানো।
রাফেল

4
@ রাফেল: পুরানোতা নামগুলির কারণে নয়, প্রতি সেচ, কারণ চমস্কির দ্বারা প্রবর্তিত নির্দিষ্ট শ্রেণিবদ্ধতা আর ব্যবহার করা হয়নি। চমস্কি শ্রেণিবিন্যাস দ্বারা বর্ণিত অন্তর্ভুক্তিগুলি (ক) এখনও সঠিক, এবং (খ) যে কোনও আধুনিক শ্রেণিবিন্যাসের অন্তর্ভুক্তির মধ্যে রয়েছে; কিন্তু চমস্কি অনুক্রমের যেমন , ভয়ঙ্কর প্রাসঙ্গিক ব্যতিরেকে এটি সুপরিচিত উচ্চ পয়েন্ট কিছু আঘাত ঘটবে নয়। লোকেরা আর চমস্কি হায়ারার্কি নিয়ে গবেষণা করে না, তারা অন্য কোথাও গবেষণা করে। এটি বহুপদী টাওয়ারের মতো নয় যার নাম / কাঠামোর কারণ রয়েছে।
wren রোমানো

26

যদি কিছু TCS এ পুরানো হয়, এটি জটিলতা ক্লাস অতি ক্ষুদ্র উপসেট যে 1956 সালে পরিচিতি লাভ / বিবেচিত আকর্ষণীয় ঘটেছে এই অন্তর্ভুক্তি অনুক্রমের আছে।

শান্তিতে বিশ্রাম করুন, চমস্কি হায়ারার্কি, এবং আপনি আর আন্ডারগ্র্যাড তত্ত্বের পাঠ্যক্রমকে আরও ঘৃণা করতে পারেন।


12
জুরিস হার্টম্যানিস একবার চিৎকার করে বলেছিল: "চমস্কি ক্লাসগুলি কী? ?? চমস্কি শ্রেণি একটি ঘৃণা !!"
রায়ান উইলিয়ামস

1
রায়ান: আমারও মনে আছে জুরিস সিএইচকে একটি "ঘৃণা" বলে অভিহিত করেছেন! আমি আমার উত্তরটি লেখার সাথে সাথে আমি বিতর্ক করছিলাম যে সে তার মন্তব্যটি সর্বজনীন করতে চায় কিনা। তবে আপনি তাকে আমার চেয়ে আরও ভাল জানেন ... :
স্কট অ্যারনসন

এই মতামতটি কিছু তাত্ত্বিক কম্পিউটার বিজ্ঞান এবং গণিতবিদদের ভাষাতত্ত্ব এবং অন্যান্য "দুর্বল" বিজ্ঞানের প্রতি যুক্তিযুক্ত দৃষ্টিভঙ্গির দ্বারাও প্ররোচিত হতে পারে: xkcd.com/435 । তবে নিশ্চিত যে চমস্কি শ্রেণিবিন্যাস আজ আধুনিক জটিলতা তত্ত্বের দৃষ্টিভঙ্গিটিকে অস্পষ্ট করে, তাই এটি আমার প্রশ্নের উত্তর দেয়। তবুও আন্ডারগ্র্যাড তত্ত্বের পাঠ্যক্রমটি শুরু করার জন্য কিছু আপডেট প্রতিস্থাপনের জন্য ভাল লাগবে, বিশেষত যদি আপনি ব্যবহারিক প্রয়োগের জন্য আনুষ্ঠানিক ভাষা এবং ব্যাকরণে আরও আগ্রহী হন।
Jakob

1
চমস্কি হায়ারার্কি বর্ণনার জটিলতার দ্বারা আদেশীকৃত ভাষা শ্রেণীর তালিকাবদ্ধ করে, গণনার জটিলতা নয় যা আপনি যখন "জটিলতা তত্ত্ব" শব্দটি ব্যবহার করেন তখন সাধারণত বোঝানো হয়। তারা সম্পর্কিত, স্পষ্টতই। যাইহোক, আমি এখনও দেখতে ব্যর্থ হয়েছি যে কোনও (রুক্ষ) হাইরাচি কীভাবে আরও পরিশ্রুত ক্লাসগুলিকে অস্পষ্ট করতে পারে যেগুলি চমস্কি হায়ারার্কি থেকে না এসে বোঝা যায় না। তারা প্রবেশ দ্বার!
রাফেল

20

আপনি যদি "আধুনিক" নামগুলি (যেমন আরইজি, লিন, সিএফএল, সিএসএল, আরই রেফারেন্স। ডিএফএ / এনএফএ, পিডিএ, এলবিএ, টিএম) দিয়ে চমস্কির হায়ারার্কিকে বিবেচনা করেন, আমি বলি: না, এটি পুরানো নয়!

কারণ 0 : এটি এখনও এই অর্থে সঠিক যে এর সংজ্ঞা এবং ফলাফলগুলি নতুন জ্ঞানের সাথে বিরোধী নয়।

কারণ 1 : এই ক্লাসগুলি / গণনার মডেলগুলি এখনও আপনি শেখাচ্ছেন - কারণ এগুলি সহজ এবং ভাল পড়াশোনা করা। প্রথমে ডিএফএ / ডিপিডিএ না withoutেকে কোনও আন্ডারগ্রাডে এলআর অটোমেটন শেখানোর চেষ্টা করুন।

কারণ ২ : নতুন উদ্ভাবনের জন্য ক্লাসগুলি এখনও প্রথম / প্রধান মানদণ্ড (আমি বহু-সিএফজির বিষয়ে একটি কাগজ ছিটিয়েছি যা অবশ্যই বলেছেন: সিএফজির চেয়ে বেশি, সিএসজির চেয়ে কম)) যা আংশিক হতে পারে, কারণ তারা প্রথম শেখানো হয়, কিন্তু কারণ তারা হয় সহজ এবং ভালভাবে পড়াশোনা করেন।

বিরোধী কারণ 3 : ফলাফলগুলি পুরানো হয় না কারণ কেবল নতুন ক্লাস / মডেল পাওয়া গেছে। সক্রিয়ভাবে গবেষণা সীমান্তে ব্যবহার না করা সত্ত্বেও তারা তাদের ক্ষেত্রের মূল বিষয়গুলি হিসাবে রাখে।


10
"গণিত পুরানো হয় না , এটি ক্লাসিক হয়ে যায় ।" (দুর্ভাগ্যক্রমে এই উক্তিটি কার জন্য দায়ী তা আমি জানি না))
হেইনিরিচ অ্যাপফেল্মাস

আপনি কি "ডিপিডিএ" এর পরিবর্তে "এনপিডিএ" বলতে চাইছেন না? কিছু প্রসঙ্গ-মুক্ত ভাষাগুলি কেবল ননডেটেরিনিস্টেমিক পুশ-ডাউন অটোমেটা দ্বারা স্বীকৃত।
Zsbán আমব্রস

@ জেসবানআম্ব্রস বেশ ডানদিকে; আমার শুধু "পিডিএ" লেখা উচিত ছিল। ধন্যবাদ!
রাফেল

শেষ কারণটি মোটেও বিশ্বাসযোগ্য নয় (আমার ধারণা এটি কেন এটি বিরোধী কারণ?)। প্রচুর ফলাফল পুরানো হয়ে যায় কারণ এগুলি সাবজেক্ট করা হয় বা কখনও কখনও বিষয়টিতে ভিন্ন পদ্ধতির মাধ্যমে তুচ্ছ হয়। আমি এখানে এই কেসটি বলছি না, কেবল যেমনটি বলা হয়েছে তেমনটি বলে না। এছাড়াও, ব্যাকরণগত নাইটপিক: "আউটডেট" কোনও ক্রিয়া নয়।
সাশো নিকোলভ 17

11

আমি মনে করি এটি গণনার মডেলের উপর নির্ভর করে। আপনি যদি সসীম / পুশডাউন / ইত্যাদি বিবেচনা করেন। গণনার মডেল হিসাবে অটোমেটা, তারপরে চমস্কি শ্রেণিবিন্যাস গুরুত্বপূর্ণ হয়ে ওঠে (উদাহরণস্বরূপ সিপসারের বইটি দেখুন)। অন্যদিকে, এটি গণনার টুরিং মডেলটিতে খুব কম ভূমিকা পালন করে।

নিম্নলিখিত চিত্রটি সহায়ক হতে পারে:

সম্পাদনা: কম্পিউটার ভাষা (যেমন জাভা) এবং সংকলকগুলির পাশাপাশি প্রাকৃতিক-ভাষা প্রক্রিয়াকরণে (এনএলপি) নকশায় আনুষ্ঠানিক ভাষা গুরুত্বপূর্ণ ভূমিকা পালন করে।


দুঃখিত আন্দ্রেস, আমি আপনার মন্তব্য বুঝতে পারি না। ওপিকে জিজ্ঞাসা করা হয়েছিল যে চমস্কি শ্রেণিবিন্যাস পুরানো কিনা। তার যুক্তিটি হ'ল তিনি এটিকে জটিলতা চিড়িয়াখানা ইত্যাদিতে দেখেন নি I আমি উত্তর দিয়েছিলাম যে সে যদি অটোম্যাটাকে কম্পিউটিংয়ের মডেল হিসাবে বিবেচনা করে তবে চমস্কি শ্রেণিবিন্যাস প্রাসঙ্গিক হয়ে ওঠে। তদতিরিক্ত, আমি উল্লেখ করেছি যে এই শ্রেণিবিন্যাসের ক্লাসগুলি ডিজাইন এবং এনএলপি অ্যালগরিদমগুলি সংকলনের জন্য গুরুত্বপূর্ণ। আইএমএইচও, এটি পুরোপুরি প্রশ্নের সাথে সম্পর্কিত।
এমএস দৌস্তি

2
অবশ্যই চমস্কি শ্রেণিবিন্যাস সত্যিকার অর্থে পুরানো নয়, এটি তাত্ত্বিক কম্পিউটার বিজ্ঞানের বেশিরভাগ সূচনা, আনুষ্ঠানিক ভাষা, সংকলক নকশা ইত্যাদির মধ্যে পাওয়া যায় তবে এর পাশে, নতুন করে বলার মতো কিছুই মনে হয় না। আমি মনে করি আরইজি এবং সিএফএল এবং সিএফএল এর মধ্যে ভাষাগুলিও গুরুত্বপূর্ণ হতে পারে। এই গবেষণার জন্য চমস্কি শ্রেণিবিন্যাসের "সেকেলে" গন্ধ আছে বলে এই ভাষাগুলির সাথে শ্রেণিবিন্যাস বাড়ানো কি কেবল খারাপ ধারণা?
Jakob

আমি এটি একটি খারাপ ধারণা বলে মনে করি না, যদিও অবশ্যই এমন একটি অ্যাপ্লিকেশন খুঁজে পাওয়া উচিত যার জন্য নতুন এক্সটেনশনটি ফিট করে।
এমএস দৌস্তি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.