একটি আর্লি পার্সার থেকে পার্স অরণ্য পুনরুদ্ধার করছেন?


25

আমি সম্প্রতি আর্লি পার্সারটি পড়ছিলাম এবং মনে করি এটি আজ পর্যন্ত দেখা সবচেয়ে মার্জিত আলগোরিদিমগুলির মধ্যে একটি। তবে, চিরাচরিত অর্থে অ্যালগরিদম একটি সনাক্তকারী এবং কোনও পার্সার নয়, যার অর্থ এটি স্ট্রিং নির্দিষ্ট সিএফজির সাথে মেলে কিনা তবে এটির জন্য একটি পার্স গাছ তৈরি করতে পারে না তা সনাক্ত করতে পারে। আমার প্রশ্নটি কীভাবে কোনও পার্স গাছটি পুনরুদ্ধার করবেন না , বরং প্রদত্ত ইনপুট স্ট্রিংয়ের সমস্ত সম্ভাব্য পার্সের পার্স অরণ্য

গ্রুন এবং জ্যাকব "পার্সিং টেকনিকস: একটি প্রাকটিক্যাল গাইড" এ তারা একটি অ্যালগরিদম চিত্রিত করেছেন যা আর্লি শনাক্তকারীর ফলাফল থেকে একটি পার্স বন পুনরুদ্ধার করতে ব্যবহার করা যেতে পারে তবে এটি উঙ্গারের পার্সিং পদ্ধতির উপর ভিত্তি করে, যার রানটাইম ও (এন কে +) 1 ), যেখানে ব্যাকরণে দীর্ঘতম উত্পাদনের দৈর্ঘ্য। এর অর্থ রানারটাইম ব্যাকরণের আকারে বহুপদী নয়। তদুপরি, অ্যাললি অ্যালগরিদমের মূল কাগজ, যা পার্স অরণ্য পুনরুদ্ধারের জন্য একটি অ্যালগরিদমের পরামর্শ দেয়, এটি ভুল (উদাহরণস্বরূপ, টোমিটার এই নিবন্ধের পৃষ্ঠা 762 পৃষ্ঠা ) দেখুন, যদিও অনেক উত্স এখনও এটিকে পার্স বন পুনরুদ্ধারের উপযুক্ত উপায় হিসাবে উল্লেখ করেছেন ।

আমার প্রশ্নটি কোনও প্রদত্ত ইনপুট স্ট্রিংয়ের জন্য একটি পার্স অরণ্য পুনরুদ্ধার করা বহুবচনের সময়ে সম্ভব কিনা তা। আমি এখানে একটি কাগজ পেয়েছি যা পিডিএর সিমুলেশন ব্যবহার করে কোনও পার্সের জন্য কিউবিক-আকারের পার্স ফরেস্টের উপস্থাপনা তৈরি করার জন্য একটি অ্যালগরিদম সরবরাহ করে, সুতরাং এটি সম্ভবত হওয়া উচিত বলে মনে হয় তবে এটি করার কোনও উপায় এখনও আমার কাছে পাওয়া যায়নি। আদর্শভাবে, আমি ইনপুট ব্যাকরণটি সিএনএফ-এ রূপান্তর না করেই এটি করতে চাই (যা প্রকৃতপক্ষে সমস্যার সমাধান করবে), ফলে প্রাপ্ত পার্স বনটি বেশ অগোছালো হয়ে উঠবে।

আপনি যে কোনও সহায়তা দিতে পারেন তার জন্য ধন্যবাদ!


এটি কী আর্লি পার্সিংয়ের উপর ভিত্তি করে একটি অ্যালগরিদম হতে হবে, বা আপনি কোনও অন্য সাধারণ সিএফজি পার্সার ব্যবহার করতে আপত্তি করবেন না?
অ্যালেক্স দশ ব্রিংক

1
আমি আর্লি পার্সারের উপর ভিত্তি করে একটি অ্যালগরিদম পছন্দ করব। আমি একটি সংকলক কোর্স শিখিয়েছি এবং এই প্রশ্নের উত্তর সন্ধান করার জন্য কয়েক দিন ব্যয় করেছি এবং এটি সত্যিই আমাকে বগড করছে।
টেম্পলেটটিফাইফ

ক্ষণস্থায়ী রানটাইমগুলি অবাক করার মতো নয় কারণ শব্দগুলিতে খুব বেশি পার্স গাছ থাকতে পারে। বাস্তবে, আপনি যদি স্বেচ্ছাসেবী সিএফজিকে অনুমতি দেন তবে তাদের অনেকগুলিও অসীম হতে পারে।
রাফেল

3
@ রাফেল পার্স অরণ্যের ভূমিকা অবশ্যই ভাগ করে নেওয়ার ব্যবস্থা রয়েছে যা সমস্ত গাছকে এমনকি সীমিত কাঠামোর সাথে ছোট গাছের জটিলতার সাথে সমস্ত গাছের প্রতিনিধিত্ব করতে পারে। অবশ্যই, এটি লম্বারজ্যাকগুলির জন্য কিছু কাজ ছেড়ে যেতে পারে।
বাবু

আপনি মারপা দেখতে চাইবেন । এটি একটি পার্ল মডিউল এবং সি লাইব্রেরি যা একটি আর্লি পার্সার প্রয়োগ করে এবং পূর্ণ পার্স ফরেস্ট সমর্থন করে।
হিপ্পিটেরাইল

উত্তর:


14

এটি করা অবশ্যই "প্যাকড ফরেস্ট" এর জন্য সঠিক প্রতিনিধিত্বের উপর নির্ভর করে যা প্রদত্ত বাক্যটির জন্য সমস্ত পার্স গাছের প্রতিনিধিত্ব করে।

আমার মনে হয় আপনি যে জায়গাটির সন্ধান শুরু করতে চান তা হলেন জোশুয়া গুডম্যানের থিসিস (ভিতরে পার্সিং, হার্ভার্ড, 1999)। মূলত, ধারণাটি হল যে আপনি একটি নির্দিষ্ট সেমিরিংয়ের অধীনে পার্সিং অ্যালগরিদমকে সংজ্ঞায়িত করতে পারেন। সেমিরিংয়ের উপর নির্ভর করে আপনি খালি পার্স গাছের পরিবর্তে (সনাক্তকারী হিসাবে বা পার্সার হিসাবে) সমস্ত ধরণের পরিমাণ এবং কাঠামো গণনা করতে সক্ষম হবেন। একটি সেমিরিং যা আপনি নির্ধারণ করতে পারেন (যা গুডম্যান তাঁর থিসিসে করেন) একটি সেমিরিং যেখানে মানগুলি পার্সের সেট হয়। আপনি যখন অবশেষে একটি বাক্য বিশ্লেষণ শেষ করেন, আপনি প্রধান পার্স নোডে সমস্ত পার্স গাছ পাবেন।

আবার, আপনাকে সঠিক উপস্থাপনের মাধ্যমে এটি সম্ভব করার বিষয়ে যত্নবান হতে হবে।


রেফারেন্সের জন্য ধন্যবাদ! এটি দুর্দান্ত উত্স হিসাবে দেখায় এবং আমি এটির জন্য কিছুটা সময় ব্যয় করব।
টেম্পলেট

8

একটি কাগজ রয়েছে যাতে এটি কীভাবে করা যায় তা বর্ণনা করে:

এলিজাবেথ স্কট দ্বারা আর্লি রিকগনিজারদের কাছ থেকে এসপিপিএফ-স্টাইলের পার্সিং

এটি বর্ণনা করে কীভাবে ঘনকালে বাইনারিযুক্ত পার্স বন তৈরি করা যায়।


2
সেই লিঙ্কটি এখন ভেঙে গেছে বলে মনে হচ্ছে। আপনার কি কোনও রেফারেন্স রয়েছে (কাগজের শিরোনাম, যেখানে প্রকাশিত হয়েছে, লেখকদের তালিকা আছে) এবং / অথবা একটি আপডেট লিংক?
ডিডাব্লু

1
দেখুন web.archive.org/web/20130508170633/http://thor.info.uaic.ro/... "SPPF-স্টাইল পার্সিং Earley Recognisers থেকে" এলিজাবেথ স্কট। আরেকটি লিঙ্ক: dinhe.net/~aredridel/.notnot//DDFs/…
a3nm

এটি "একটি আর্লি সনাক্তকারী থেকে পার্স অরণ্য কীভাবে পাবেন" এই প্রশ্নের সঠিক উত্তর।
tjvr


এই প্রসঙ্গে বাইনারিযুক্ত বলতে কী বোঝায়?
ব্রুস অ্যাডামস

6

আপনার কখনই সিএনএফ লাগবে না। এর ব্যাকরণ কাঠামো পরিবর্তনের অপূর্ণতা রয়েছে। তবে আপনাকে মধ্যবর্তী অ-টার্মিনালগুলি প্রবর্তন করতে হবে যাতে কোনও ডান দিকের দিকটি 2 (2-ফর্ম) এর চেয়ে দীর্ঘ না হয় কারণ আরএইচএস দৈর্ঘ্য জটিলতা নির্ধারণ করে। অন্তর্নিহিতভাবে ব্যাখ্যা করার সর্বোত্তম প্রয়াস হ'ল, স্মৃতি যদি পরিবেশন করে তবে বিউ শিলের একটি গবেষণাপত্র, "নিরীক্ষণ ফ্রি পার্সিং সম্পর্কিত পর্যবেক্ষণ", ১৯ 1976 সালে একটি গণনীয় ভাষাগত সম্মেলনে প্রকাশিত। আর্লির অ্যালগরিদম সুস্পষ্টভাবে 2-ফর্ম ব্যবহার করে। এটি কেবল অ্যালগোরিদমে লুকিয়ে রয়েছে। পার্স ফরেস্টের পুনরুদ্ধার এবং পরিচালনা সম্পর্কে আপনার ওয়েবে "পার্সিং চৌরাস্তা বন" -এ দেখা উচিত। এটা আসলে খুব সোজা। অনেকগুলি কাগজপত্র ওয়েবে থাকে, যদি আপনি সরাসরি (শিরোনাম বা সামগ্রীর টেবিল থেকে) শিরোনাম বা লেখক তাদের সরাসরি অনুসন্ধান করার জন্য পান।

প্রকৃতপক্ষে, আপনি সিএফ এর চেয়ে অনেক বেশি কিছু করতে পারেন এবং এখনও বহুবর্ষের সময় পার্স-অরণ্য পেতে পারেন। কখনও কখনও প্রশ্নটি হয়: আপনি একবার এটি পেলে এটি দিয়ে কী করতে পারেন?

আপনার উল্লেখ করা শেষ নিবন্ধটির একটি উদ্দেশ্য হ'ল জটিল অ্যালগরিদমগুলি (যেমন জিএলআর) অগত্যা সময় বা স্থানের কিছু কিনছে না এবং আপনার পার্স বনটিকে পরিবর্তন করতে পারে।

শিক্ষকতা সম্পর্কে একটি মন্তব্য। আমি মনে করি আর্লি, সেমিনাল যেমনটি ছিল তেমন শিক্ষার পক্ষে খুব জটিল, এবং মূলত একই শিক্ষামূলক সামগ্রীর সাথে সরল অ্যালগরিদম দ্বারা প্রতিস্থাপন করা যেতে পারে। শিক্ষা ধারণা বা প্রযুক্তি সম্পর্কে। আর্লির অ্যালগরিদমে, প্রয়োজনীয় ধারণাগুলি বিবরণের জটিলতায় লুকিয়ে রয়েছে এবং প্রযুক্তিগত দৃষ্টিকোণ থেকে এটি পুরানো। এটি একটি দুর্দান্ত কাগজ ছিল তবে এর অর্থ এই নয় যে এটি সর্বোত্তম শিক্ষাগত পদ্ধতির।

সাধারণ কম্পিউটার বিজ্ঞান চ্যানেলের তুলনায় গণ্য ভাষাতাত্ত্বিক সাহিত্যে আরও তথ্য থাকতে পারে। আমার কাছে সেরিল-গ্রুন-জ্যাকবস বই নেই তবে আমি যদি তাদের সমস্ত যথাযথ তথ্যসূত্র না রাখি তবে আমি অবাক হব (যদিও আমি তাদের নির্বাচনের মানদণ্ড সম্পর্কে নিশ্চিত নই)।


একটি মন্তব্যে একটি অনুরোধ অনুসরণ কমপ্লিমেন্ট (জুলাই 7, 2013)

এই পরিপূরকটি আর্লির তুলনায় সহজ অ্যালগরিদমের অস্তিত্বকে একত্রিত করে।

যেমনটি আমি বলেছি, "পার্সিং চৌরাস্তা বন" -এ ওয়েবে অনুসন্ধান করার জন্য আপনাকে দ্রুত রেফারেন্স দেওয়া উচিত, যা থেকে আপনি আরও খনন করতে পারেন।

মূল ধারণাটি হ'ল একটি ভাগ করা অরণ্য নির্মাণের সাথে সমস্ত পাথ পার্সিং করা একটি নিয়মিত ভাষা এবং একটি প্রাসঙ্গিক মুক্ত ভাষার জন্য বার হিলেল, পেরেলস এবং শামিরের পুরানো চৌরাস্তা নির্মাণ, একটি সীমাবদ্ধ অটোমেটন এবং প্রসঙ্গমুক্ত ব্যাকরণ ব্যবহার করে। সিএফ ব্যাকরণ দেওয়া, আপনি নির্মাণটি একটি তুচ্ছ অটোমেটনে প্রয়োগ করেন যা কেবল আপনার ইনপুট স্ট্রিংকে স্বীকৃতি দেয়। এটাই সব। ভাগ করা বনটি ছেদ করার জন্য কেবল ব্যাকরণ। এটি একটি হোমোর্ফিজমের মাধ্যমে মূল ব্যাকরণের সাথে সম্পর্কিত, কেবলমাত্র প্রদত্ত স্ট্রিংকেই স্বীকৃতি দেয় তবে মূল ব্যাকরণের সমস্ত পার্স-গাছের সাথে সেই হোমোমর্ফিিজম (অর্থাত্, অ-টার্মিনালের সাধারণ নামকরণ) রয়েছে।

ফলস্বরূপ ব্যাকরণে অনেকগুলি অকেজো স্টাফ, নন-টার্মিনাল এবং নিয়ম রয়েছে যা অক্ষর থেকে অ্যাক্সেসযোগ্য (প্রাথমিক প্রতীক থেকে প্রাপ্ত স্ট্রিংয়ের সন্ধানে পাওয়া যায় না) বা উত্পাদনহীন (টার্মিনালে উত্পন্ন হতে পারে না) স্ট্রিং)।

তারপরে, হয় আপনাকে শেষে ভাল ব্রাশ দিয়ে পরিষ্কার করতে হবে (সম্ভবত দীর্ঘ তবে অ্যালগোরিদম সহজ), অথবা আপনি নির্মাণটি উন্নত করার চেষ্টা করতে পারেন যাতে শেষ পর্যন্ত ব্রাশ হওয়ার মতো কম অকেজো ফ্লাফ থাকে।

উদাহরণস্বরূপ, সিওয়াইকি নির্মাণটি হুবহু এটি, তবে এমনভাবে সংগঠিত যাতে তৈরি করা সমস্ত বিধি এবং নন-টার্মিনালগুলি উত্পাদনশীল, যদিও অনেকগুলি অ্যাক্সেসযোগ্য হতে পারে। এটি একটি ডাউন-আপ কৌশল থেকে আশা করা যায়।

শীর্ষ-ডাউন কৌশলগুলি (যেমন এলআর (কে) ভিত্তিক যেকোনগুলি)) অ্যাক্সেসযোগ্য নিয়ম এবং অ-টার্মিনালগুলি এড়িয়ে চলবে, তবে উত্পাদনহীন তৈরি করবে।

পয়েন্টারগুলির পর্যাপ্ত ব্যবহারের মাধ্যমে আসলে অনেকগুলি ব্রাশ করা সম্ভব, আমি মনে করি, তবে আমি দীর্ঘকাল এটি দেখিনি।

সমস্ত বিদ্যমান অ্যালগোরিদম আসলে সেই মডেলটি অনুসরণ করে। সুতরাং এটি সত্যিই বিষয়টির হৃদয় এবং এটি খুব সাধারণ। তাহলে কেন জটিলতায় দাফন করবেন?

লিটারেচারে অনেকগুলি "অপটিমাইজেশন" প্রস্তাব করা হয় প্রায়শই পার্সার নির্মাণের এলআর (কে), এলএল (কে) পরিবারের উপর ভিত্তি করে, সম্ভবত এই নির্মাণগুলির কিছু স্থির ফ্যাটারিংয়ের সাথে (আর্লির কোনও স্ট্যাটিক ফ্যাক্টরিং নেই)। এটি প্রকৃতপক্ষে পুরানো অগ্রগতি পার্সার সহ সমস্ত জ্ঞাত প্রযুক্তিতে প্রয়োগ করা যেতে পারে। আমি উদ্ধৃতিগুলির মধ্যে "অপ্টিমাইজেশন" রেখেছি কারণ আপনি সাধারণত কী অপ্টিমাইজ করছেন তা স্পষ্ট হয় না বা আপনি প্রকৃতপক্ষে এটি অপ্টিমাইজ করছেন কিনা তাও বা উন্নতির সুবিধাটি আপনার পার্সারের অতিরিক্ত জটিলতার পক্ষে মূল্যবান কিনা তা স্পষ্ট নয়। আপনি এটিতে (কিছু আছে) আনুষ্ঠানিক বা পরীক্ষামূলকভাবে সামান্য উদ্দেশ্যমূলক ডেটা পাবেন, তবে আরও অনেক দাবি। আমি বলছি না যে আগ্রহের কিছু নেই। কিছু স্মার্ট ধারণা আছে।

এখন, আপনি যখন প্রাথমিক ধারণাটি জানেন, তখন আপনার আগ্রহী পার্সার নির্মাণ কৌশলটি অনুসরণ করে, ব্যাকরণ থেকে পুশ-ডাউন অটোম্যাটন তৈরি করে "অপ্টিমাইজেশন" বা উন্নতি প্রায়শই স্ট্যাটিকভাবে (সম্ভবত বর্ধিতভাবে) প্রবর্তন করা যেতে পারে applying সেই অটোমেটনে ছেদ করার জন্য ক্রস-প্রোডাক্ট নির্মাণ (ব্যাকরণে এটি করা প্রায় একই জিনিস) বা auto অটোমেটন থেকে প্রাপ্ত ব্যাকরণে।

তারপরে আপনি ঘণ্টা এবং হুইসেলগুলি পরিচয় করিয়ে দিতে পারেন তবে এটি বেশিরভাগ প্রযুক্তিগত বিবরণ।

আইজ্যাক নিউটনের দর্শনশাস্ত্রের ন্যাচারালিস প্রিন্সিপিয়া ম্যাথমেটিকা ​​পদার্থবিজ্ঞান এবং গণিতের একটি দুর্দান্ত অংশ reported আমি মনে করি না এটি অনেক শিক্ষার্থীর পড়ার তালিকায় রয়েছে। অন্যান্য সমস্ত জিনিস সমান হচ্ছে, আমি মনে করি না আর্লির অ্যালগরিদম শেখানো এটি খুব দরকারী তবে এটি একটি গুরুত্বপূর্ণ historicalতিহাসিক অংশ। শিক্ষার্থীদের যেমন রয়েছে তেমন শেখার যথেষ্ট পরিমাণ রয়েছে। অনেক লোক গুলিবিদ্ধ হয়ে মারা যাওয়ার ঝুঁকিতে আমি নূথ এলআর (কে) পেপারের জন্য একই রকম মনে করি। এটি তাত্ত্বিক বিশ্লেষণের একটি দুর্দান্ত অংশ, এবং সম্ভবত কোনও তাত্ত্বিকের জন্য গুরুত্বপূর্ণ পঠন। আমি দৃ strongly়ভাবে সন্দেহ করি যে এটি হার্ডওয়ার এবং সফ্টওয়্যার উভয়ই প্রযুক্তির বর্তমান অবস্থার ভিত্তিতে পার্সার তৈরির জন্য এত প্রয়োজনীয়। সময়গুলি পার্সিং যখন সংকলন সময়ের একটি উল্লেখযোগ্য অংশ ছিল, অথবা যখন সংকলকগুলির গতি একটি জটিল সমস্যা ছিল (আমি এমন একটি কর্পোরেশন জানতাম যা প্রায় 30 বছর আগে সংকলনের জন্য মারা গিয়েছিল)। পার্সিং বিশেষজ্ঞ কোনও সময় সেই বিশেষীকৃত জ্ঞানটি জানতে চাইতে পারেন তবে কম্পিউটার বিজ্ঞান, প্রোগ্রামিং বা ইঞ্জিনিয়ারিংয়ের গড় শিক্ষার্থীর প্রয়োজন হয় না।

যদি শিক্ষার্থীদের পার্সিংয়ের জন্য আরও বেশি সময় ব্যয় করতে হয়, তবে অন্যান্য এক্সটেনশানগুলি রয়েছে যা আরও কার্যকর এবং আরও গঠনমূলক হতে পারে, যেমন গণ্য ভাষাতাত্ত্বিক ব্যবহৃত হয়। শিক্ষার প্রথম ভূমিকাটি হ'ল বৈজ্ঞানিক জ্ঞান গঠনের সহজ ধারণাগুলি নিষ্কাশন করা, গবেষণা বিজ্ঞানীদের যে ভোগ করতে হয়েছিল তা শিক্ষার্থীদের ভোগ করতে বাধ্য করা না (ডক্টরাল শিক্ষার্থীরা ব্যতীত: এটি উত্তীর্ণের রীতি :-)।

লেখকের কাছ থেকে লাইসেন্স সিসি বাই-এসএ 3.0


2
"আর্লি ... পাঠদানের জন্য অনেক জটিল, এবং সরল অ্যালগোরিদম দ্বারা প্রতিস্থাপিত হতে পারে ..."। আপনি কি এই জাতীয় সরল অ্যালগরিদমের উদাহরণ সরবরাহ করতে পারেন?
wjl

@wjl আমি উপরের উত্তরের সংযোজনে আপনাকে উত্তর দিচ্ছি। আমি একটি নির্দিষ্ট অ্যালগরিদমের দিকে ইঙ্গিত করি না যদিও আপনি সুপারিশ হিসাবে কিছু অনুসন্ধান করতে পারেন যদি আপনি কিছু সাহিত্যে খুঁজে পেতে পারেন। আমি বরং ব্যাখ্যা করার চেষ্টা করেছি কেন সহজ, তবুও দক্ষ অ্যালগরিদম তৈরি করা খুব সহজ easy আর্লি সম্ভবত তাদের সবার মধ্যে জটিলতম। বার হিলেল এট আল এর ব্যাখ্যা। নির্মাণটি প্রায় অর্ধেক পৃষ্ঠা পাঠ্যপুস্তকের, প্রমাণ সহ একটি পৃষ্ঠা বলুন।
বাবু

@wjl আপনার অনুরোধের উত্তর দিতে আমাকে কিছুটা সময় নিয়েছে। এটা কি আপনাকে সাহায্য করেছে? । । । । । আপনি যদি একটি আসল অ্যালগরিদম চেয়েছিলেন তবে প্রাথমিক প্রশ্নের শেষ লিঙ্কে একটি রয়েছে।
বাবু

হ্যাঁ, আপনাকে ধন্যবাদ; আমি অতিরিক্ত বিশদ প্রশংসা করি। আমি যে কাজটি করছি তার জন্য একটি সাধারণীকৃত পার্সার লাইব্রেরিতে কাজ করছি এবং বিভিন্ন অ্যালগরিদমগুলিতে এক টন গবেষণা করে চলেছি। আমি বর্তমানে একটি প্রাথমিক-শৈলীর বাস্তবায়নের দিকে ঝুঁকছি যেহেতু আমার কাছে এটি एल्গরিদম বোঝা খুব সহজ বলে মনে হয়েছিল এবং এটি কনজেক্টিভ ব্যাকরণ এবং "ব্ল্যাক বক্স" (সম্ভবত প্রসঙ্গে সংবেদনশীল) টার্মিনালগুলিতে প্রসারিত করা সহজ। আমি স্কিম করে কিছু কাগজপত্র মুদ্রিত করেছি যা আপনি দেখিয়েছিলেন; তবে আমি এখনও এগুলি আন্তরিকভাবে পড়িনি।
wjl

@wjl যদি আপনি যা করছেন তা আপনার নীচের বিষয়গুলির দিকে নজর দেওয়া উচিত: মৃদু প্রসঙ্গে সংবেদনশীল ভাষা, লিনিয়ার প্রেক্ষাপটে মুক্ত পুনর্লিখন সিস্টেম (এলসিএফআরএস) এবং পরিসীমা সংমিশ্রণ ব্যাকরণ। নিশ্চিত না যে আমি "ব্ল্যাক বক্স" টার্মিনালটি কী তা বুঝতে পেরেছি। - - ইমেল: ইনবক্স.কম এ বাবু। - -
বাবু

5

ঘনকালে কীভাবে বাইনারিযুক্ত পার্স বন তৈরি করা যায় সেই কাগজটি বর্ণনা করে (অ্যাঞ্জেলো বোরসোত্তির পোস্টে উল্লিখিত): এলিজাবেথ স্কটের "এসপিপিএফ-স্টাইল পার্সিং ফর্ম আর্লি রিকগনাইজারস"। আপনি এটি এখানে পাবেন: http://dx.doi.org/10.1016/j.entcs.2008.03.044

এই কাগজে একটি ভাগ করে নেওয়া প্যাকড পার্স ফরেস্ট (এসপিপিএফ) নির্মাণের বর্ণনা দেওয়া হয়েছে যা সম্ভাব্য সমস্ত পার্স গাছের প্রতিনিধিত্ব করে। যখনই সম্ভব সাব গাছগুলি ভাগ করা হয় এবং একই ননটার্মিনাল থেকে একই সাবস্ট্রিংয়ের বিভিন্ন ডেরাইভেশন সম্পর্কিত নোডগুলি একত্রিত করা হয়।


পয়েন্টারের জন্য ধন্যবাদ। ঘনকালে বাইনারিযুক্ত পার্স-অরণ্য নির্মানের মান। কিউবিক সময় পাওয়ার একমাত্র উপায় বাইনারিাইজেশন, যাতে জটিলতার কবিতা ব্যাকরণের আকারের বিষয়ে ওপির মন্তব্য অপ্রাসঙ্গিক। আর একটি বিষয় পার্স-অরণ্যকে কীভাবে বাইনারি করা হয় তা বোঝা। এটি অ্যালগরিদম নির্ভর হতে পারে। অন্যান্য ইস্যুগুলি ভাগ করা-বনাঞ্চলে ভাগ করার পরিমাণ এবং পার্সিং কৌশলের বাস্তব দক্ষতা (আর্লি একটি খারাপ ধারণা হতে পারে)। এই সমস্তটি ওপির শেষ রেফারেন্সে বিকশিত। আমার উত্তরটিতে ইস্যুটির একটি সাধারণ আনুষ্ঠানিক দৃষ্টিভঙ্গি আঁকা হয়েছে।
বাবু

1

আমি আপনাকে এই কাগজটি পড়ার পরামর্শ দিয়ে উপরের উত্তরগুলি প্রতিধ্বনিত করতে চাই:

http://dx.doi.org/10.1016/j.entcs.2008.03.044

যদিও আমি এই কাগজে আলগোরিদম প্রয়োগ করেছি এবং আমি বিশ্বাস করি যে এখানে একটি ত্রুটি আছে বলে আমি যোগ্যতা অর্জন করতে চাই। বিশেষত, বিভাগ 4 এর দ্বিতীয় অনুচ্ছেদের প্রথম বাক্যটি আপনি আর্লি "স্ক্যানিং" পর্যায়ে যা কল করবেন তার জন্য আপনি যে পূর্বসূরি লেবেলগুলি তৈরি করেন সেগুলি পি থেকে কিউতে চিহ্নিত করা উচিত এবং অন্যভাবে নয়।

বিশেষত, নিম্নলিখিত লাইন:

E0 টি আইটেম হিসাবে সেট করুন (এস :: = · α, 0)। I> 0 ইনি আদ্যক্ষেত্র আইটেম p = (A :: = αai · β, j) যোগ করে প্রতিটি q = (A :: = α · ai·, j) ∈ Ei − 1 এবং, যদি α = তৈরি করেন তবে পূর্বসূরী পয়েন্টার i - 1 থেকে q পর্যন্ত পি লেবেলযুক্ত

"P থেকে q" পড়তে হবে এবং "q থেকে p" নয়

আমি অ্যালগরিদমটি মূলত যেমনটি বলেছি তেমন প্রয়োগ করেছি, যা আমাকে হাতে তৈরি কিছু পরীক্ষার ক্ষেত্রে ত্রুটি দেয়, যা আমি এখানে পয়েন্টারের দিক পরিবর্তন করার পরে ঠিক করে দেওয়া হয়েছিল।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.