কাঠামোগত সামগ্রী হিসাবে ম্যান পেজ কীভাবে অ্যাক্সেস করবেন to


3

আমি এমন একটি সংস্থান তৈরি করছি যা ম্যান পেজগুলিকে রেফারেন্স করে এবং আমি ভাবছি যদি কেউ কাঠামোগত ডেটা হিসাবে ম্যান পেজ অ্যাক্সেস করার কোনও উপায় জানেন ? আমার বর্তমান পদ্ধতিরটি যদি রেগেক্সিং হয় তবে অনেক কিছু করা তবে এটি ক্লান্তিকর এবং ত্রুটির প্রবণ।

আমি * নিক্সের বিশেষজ্ঞ নই, তবে মানব পৃষ্ঠাগুলি সম্পর্কে আমি যা বুঝতে পারি তা হ'ল এগুলি মূলত একটি নির্দিষ্ট বাক্য গঠন সহ পাঠ্য ফাইল যা manকমান্ড দ্বারা পার্সযোগ্য । এটি আমাকে কিছুটা সংশয়যুক্ত করে তোলে যে বিকল্পগুলি বা পতাকাগুলির তালিকাতে অ্যাক্সেস করার, বলার সহজ উপায় থাকতে পারে। তবে এটি করার একটি উপায় আছে যা আমি জানি না।


আরো নির্দিষ্টভাবে, টেক্সট নির্দেশাবলী ধারণকারী ফাইল এর কিছু বৈচিত্র দ্বারা বিশ্লেষণ হতে troffসঙ্গে an, docঅথবা andocম্যাক্রো প্যাকেজ। কারণ এটি একটি ম্যাক্রো ভাষা। যার অর্থ, সাধারণভাবে, আপনি যদি সামগ্রীটি বের করতে চান তবে আপনাকে ম্যাক্রোগুলি পার্স করতে সক্ষম হতে হবে
ফক্স

উত্তর:


5

কীভাবে এ উঁকি পারে মাছ শেল তার তৈরী করে মানুষ পেজ থেকে সম্পূর্ণকরণ বিশেষ করে কিভাবে __fish_complete_manকাজ করে। groffএইচটিএমএল নির্গমন এবং তারপরে আপনি যা চান তা পেতে সেখানে HTML পার্সারের প্রচুর সংখ্যক একটি ব্যবহার করতে পারে বলে ধরে নেওয়া একটি সহজ বিকল্প হতে পারে:

$ groff -T html -mdoc xpquery.1 | xpquery -p HTML '//p[b="xpquery"][2]' -
<p style="margin-left:17%;"><b>xpquery</b>
[<b>−E </b><i>encoding</i>]
[<b>−n </b><i>namespace</i>]
[<b>−p </b><i>method</i>]
[<b>−S </b><i>xpath-subquery</i>]
[<b>−t </b><i>timeout</i>] <i>xpath-query
file-or-url ..</i></p>
$ 

এটি একটি ম্যান পেজ যা এইচটিএমএল হিসাবে রেন্ডার করা হয়েছে এবং তারপরে সিএনওপিএসিস বিভাগে পতাকাগুলির তালিকা পেতে এক্সপ্যাথ ব্যবহার করে নির্বাচন করা হয়েছে ; সিএসএস নির্বাচনকারীদের ব্যবহার এই দিনগুলিতে আরও বেশি হিপ হতে পারে। তবে উত্পন্ন এইচটিএমএল খুব কাঠামোগত নয়।


2

ম্যান পৃষ্ঠাগুলি রফ ফর্ম্যাট করা পাঠ্য ফাইল যা দুর্ভাগ্যক্রমে এই মুহুর্তে প্রায়শ ফরম্যাটিং ভাষাগুলি পার্স করার ক্ষেত্রে সবচেয়ে বিরক্তিকর। আপনি কিছু ভাগ্য খুঁজে pulling কি (এটা প্রায় সবসময় এক হতে হবে যাই হোক না কেন Roff বাস্তবায়ন আপনার সিস্টেমে ব্যবহারের জন্য ডকুমেন্টেশন মাধ্যমে খুঁজছেন দ্বারা চান থাকতে পারে nroff, troffঅথবা groff)। ফর্ম্যাটটি নিজেই কিছুটা জটিল (এটি একটি যুগে নকশাকৃত হয়েছিল যখন মিনিমালিজম ভাল সফ্টওয়্যার ডিজাইনের উপমা ছিল), তবে বেশিরভাগ মানব পৃষ্ঠাগুলির গঠন যথাযথভাবে সামঞ্জস্যপূর্ণ, তাই এটি খুব শক্ত হওয়া উচিত নয়।

তা ছাড়াও, আপনার কাছে অন্যান্য কয়েকটি বিকল্প রয়েছে। প্রথমটি হল সফ্টওয়্যারটির উত্স বিতরণে ম্যান পৃষ্ঠাগুলির উত্সগুলি সন্ধান করা। আজকাল বেশিরভাগ সফ্টওয়্যার তাদের ম্যান পেজগুলি অন্য কিছু ফর্ম্যাট থেকে ম্যান প্রোগ্রাম দ্বারা পার্স করা রফ উত্সগুলিতে সংকলন করে, যার বেশিরভাগ রফ ম্যাক্রোর চেয়ে পার্স করা আরও সহজ। অন্যটি হ'ল সরঞ্জামগুলির মধ্যে নজর রাখা (সহ groff) যা ম্যান পেজগুলিকে অন্য ফর্ম্যাটে রূপান্তর করে, থ্রিগের উত্তরে পরামর্শ অনুসারে।


0

পরীক্ষা করে দেখুন manServer যা একটি সহজ উপায় মানুষ পৃষ্ঠাগুলি parses এবং সেগুলোকে ওয়েব পেইজ হিসেবে উপস্থাপন করে 1999 সাল থেকে একটি Perl স্ক্রিপ্ট হয়। এটি ট্রফ উত্সটি ব্যাখ্যা করার জন্য আপনার সমস্ত পার্ল কোড রয়েছে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.