পিডিএফ ফাইলগুলি পরীক্ষা করার জন্য সেরা সরঞ্জাম? [বন্ধ]

Question 1

বন্ধ এই প্রশ্নটি স্ট্যাক ওভারফ্লো নির্দেশিকাগুলি পূরণ করে না । এটি বর্তমানে উত্তর গ্রহণ করছে না।

এই প্রশ্নটি উন্নত করতে চান? প্রশ্ন আপডেট করুন তাই এটা -বিষয়ে স্ট্যাক ওভারফ্লো জন্য।

1 বছর আগে বন্ধ ছিল ।

আমি কীভাবে কোনও সরঞ্জামের চেয়ে পছন্দযোগ্য পিডিএফ ফাইলগুলি পরিদর্শন করতে পারি?

কেস ব্যবহার করুন: আমি প্রোগ্রামটিমে পিডিএফ ফাইলগুলি তৈরি করার চেষ্টা করছি (আইটেক্সট ব্যবহার করে)। নির্দিষ্ট লেআউটগুলি অর্জন করতে আমার সমস্যা হচ্ছে, তবে আমার পছন্দ মতো পাঠ্যযুক্ত পিডিএফ ফাইল রয়েছে (শব্দ থেকে উত্পন্ন)। আমি কীভাবে প্রকৃত প্রকৌশলীকে এটি করতে পারি তা চাই।

পিডিএফ ইন্সপেক্টর ভাল বলে মনে হচ্ছে, তবে আমি উইন্ডোজের জন্য কিছু খুঁজছি।

Question 2

অ্যাডোব অ্যাক্রোব্যাট একটি খুব দুর্দান্ত তবে ভাল লুকানো মোড রয়েছে যা আপনাকে পিডিএফ ফাইলগুলি পরীক্ষা করতে দেয় allowing আমি https://blog.idrsolutions.com/2009/04/viewing-pdf-objects/ এ ব্যাখ্যা করে একটি ব্লগ নিবন্ধ লিখেছিলাম

Question 3

অন্যান্য উত্তরে উল্লিখিত জিইউআই-ভিত্তিক সরঞ্জামগুলি ছাড়াও, কয়েকটি কমান্ড লাইন সরঞ্জাম রয়েছে যা মূল পিডিএফ উত্স কোডকে আলাদা উপস্থাপনে রূপান্তর করতে পারে যা আপনাকে একটি পাঠ্য সম্পাদক দ্বারা (এখন পরিবর্তিত ফাইল) পরিদর্শন করতে দেয়। নীচের সমস্ত সরঞ্জাম লিনাক্স, ম্যাক ওএস এক্স, অন্যান্য ইউনিক্স সিস্টেম বা উইন্ডোজে কাজ করে।

`qpdf` (আমার পছন্দ)

(সর্বাধিক) অবজেক্টের স্ট্রিমগুলি সঙ্কুচিত করতে ObjStmএবং পৃথক অপ্রত্যক্ষ বস্তুগুলিতে অবজেক্টগুলিকে বিচ্ছিন্ন করতে qpdf ব্যবহার করুন :

qpdf --qdf --object-streams=disable orig.pdf uncompressed-qpdf.pdf

qpdfনিজেকে এমন একটি সরঞ্জাম হিসাবে বর্ণনা করে যা "পিডিএফ ফাইলগুলিতে কাঠামোগত, সামগ্রী সংরক্ষণের রূপান্তর" করে ।

তারপরে uncompressed-qpdf.pdfআপনার পছন্দের পাঠ্য সম্পাদকটিতে ফাইলটি খালি + পরীক্ষা করুন । পূর্বে সংক্ষেপিত (এবং তাই বাইনারি) বাইটগুলির বেশিরভাগটি এখন সরল পাঠ্য হবে।

`mutool`

রয়েছে mutoolকমান্ড লাইন টুল যা দিয়ে bundled আসে MuPDF PDF ভিউয়ার (যা প্রস্তুতকারী Ghostscript করার জন্য একটি বোন পণ্য, একই কোম্পানী, দ্বারা তৈরি শিল্পী )। নিম্নলিখিত কমান্ডটি স্ট্রিমগুলি সঙ্কুচিত করে এবং পাঠ্য সম্পাদকের মাধ্যমে তদারকি করা আরও সহজ করে তোলে:

mutool clean -d orig.pdf uncompressed-mutool.pdf

`podofouncompress`

পিডিএফও পিডিএফ ফর্ম্যাটের সাথে কাজ করার জন্য একটি ফ্রিসফটওয়্যার / ওপেনসোর্স গ্রন্থাগার এবং এতে কয়েকটি কমান্ড লাইন সরঞ্জাম অন্তর্ভুক্ত রয়েছেpodofouncompress। পিডিএফ স্ট্রিমগুলি সঙ্কুচিত করতে এটি ব্যবহার করুন:

podofouncompress orig.pdf uncompressed-podofo.pdf

`peepdf.py`

পিপিডিএফ একটি পাইথন-ভিত্তিক সরঞ্জাম যা আপনাকে পিডিএফ ফাইলগুলি অন্বেষণ করতে সহায়তা করে। এর মূল উদ্দেশ্যটি পিডিএফ-ভিত্তিক ম্যালওয়্যার গবেষণা এবং বিচ্ছিন্নকরণের জন্য ছিল, তবে আমি সম্পূর্ণ সৌম্য পিডিএফ ফাইলগুলির কাঠামোটি তদন্ত করাও দরকারী বলে মনে করি।

এটি একটি পিডিএফ অন্তর্ভুক্ত থাকা বস্তু এবং স্ট্রিমগুলিকে "ব্রাউজ" করতে ইন্টারেক্টিভভাবে ব্যবহার করা যেতে পারে।

আমি এখানে ব্যবহারের উদাহরণ দেব না, তবে কেবলমাত্র এটির ডকুমেন্টেশনের লিঙ্ক:

পিপডিএফ - পিডিএফ বিশ্লেষণ সরঞ্জাম

`pdfid.py` এবং `pdf-parser.py`

pdfid.pyএবং পাইথনে লেখা ডিডিয়ার স্টিভেন্সেরpdf-parser.py দুটি পিডিএফ সরঞ্জাম are

তাদের পটভূমিটি দূষিত পিডিএফগুলি অন্বেষণে সহায়তা করতে পারে - তবে আমি সৌম্য পিডিএফ ফাইলগুলির কাঠামো এবং বিষয়বস্তু বিশ্লেষণ করতেও এটি দরকারী বলে মনে করি।

এখানে আমি পিডিএফ নং নং সঙ্কুচিত স্ট্রিমটি কীভাবে নিষ্কাশন করব তার একটি উদাহরণ এখানে দেওয়া হয়েছে। 5 * * ডাম্প ফাইলের মধ্যে:

pdf-parser.py -o 5 -f -d obj5.dump my.pdf

চূড়ান্ত নোট

দয়া করে নোট করুন যে কোনও পিডিএফের অভ্যন্তরে কিছু বাইনারি অংশগুলি অগত্যা সংকোচনের নয় (বা মানব পাঠযোগ্য ASCII কোডে ডিকোড-সক্ষম) নয়, কারণ এগুলি এম্বেড করা হয়েছে এবং পিডিএফগুলির অভ্যন্তরে তাদের মূল ফর্ম্যাটে ব্যবহৃত হয়েছে। এই জাতীয় পিডিএফ অংশগুলি হ'ল জেপিইজি চিত্র, ফন্ট বা আইসিসি রঙের প্রোফাইল।
আপনি যদি উপরের সরঞ্জামগুলি এবং প্রদত্ত কমান্ড লাইনের উদাহরণগুলির সাথে তুলনা করেন তবে আপনি আবিষ্কার করবেন যে তারা সবাই অভিন্ন আউটপুট উত্পাদন করে না । তাদের মধ্যে পার্থক্যগুলির জন্য তাদের তুলনা করার প্রচেষ্টা আপনাকে পিডিএফ সিনট্যাক্স এবং ফাইল ফর্ম্যাটের প্রকৃতি আরও ভালভাবে বুঝতে সাহায্য করতে পারে।

Question 4

আমি লিনাক্সে আইটেক্সট আরইউপিএস (পিডিএফ সিনট্যাক্স পড়া এবং আপডেট) ব্যবহার করি । যেহেতু এটি জাভাতে লেখা হয়েছে, এটি উইন্ডোতেও কাজ করে। আপনি গাছের কাঠামোয় পিডিএফ ফাইলের সমস্ত বস্তু ব্রাউজ করতে পারেন। এটি পরিদর্শন করা আরও সহজ করার জন্য ফ্লাইট এনকোডেড স্ট্রিমটিকে ফ্লাই-অন ফ্লাই ডিকোড করতে পারে।

এখানে একটি স্ক্রিন শট হয়:

আইটেক্সট আর ইউ পি এস স্ক্রিনশট

Question 5

ও 2 সলিউশন থেকে পিডিএফএক্সপ্লোরার ইন্টার্নালগুলি প্রদর্শনের অসামান্য কাজ করে।

http://www.o2sol.com/pdfxplorer/overview.htm

(নিখরচায়, বিভ্রান্তিকর ব্যানার নীচে)।

Question 6

আমি ভাল সাফল্যের সাথে পিডিএফবক্স ব্যবহার করেছি । কোডটি দেখতে কেমন তার একটি নমুনা এখানে (০..2.২ সংস্করণ থেকে ফিরে), প্রদত্ত উদাহরণগুলির মধ্যে সম্ভবত এটি এসেছে:

// load the document
System.out.println("Reading document: " + filename);
PDDocument doc = null;                                                                                                                                                                                                          
doc = PDDocument.load(filename);

// look at all the document information
PDDocumentInformation info = doc.getDocumentInformation();
COSDictionary dict = info.getDictionary();
List l = dict.keyList();
for (Object o : l) {
    //System.out.println(o.toString() + " " + dict.getString(o));
    System.out.println(o.toString());
}

// look at the document catalog
PDDocumentCatalog cat = doc.getDocumentCatalog();
System.out.println("Catalog:" + cat);

List<PDPage> lp = cat.getAllPages();
System.out.println("# Pages: " + lp.size());
PDPage page = lp.get(4);
System.out.println("Page: " + page);
System.out.println("\tCropBox: " + page.getCropBox());
System.out.println("\tMediaBox: " + page.getMediaBox());
System.out.println("\tResources: " + page.getResources());
System.out.println("\tRotation: " + page.getRotation());
System.out.println("\tArtBox: " + page.getArtBox());
System.out.println("\tBleedBox: " + page.getBleedBox());
System.out.println("\tContents: " + page.getContents());
System.out.println("\tTrimBox: " + page.getTrimBox());
List<PDAnnotation> la = page.getAnnotations();
System.out.println("\t# Annotations: " + la.size());

Question 7

আরও একটি বিকল্প আছে। অ্যাডোব অ্যাক্রোব্যাট প্রো পিডিএফের অভ্যন্তরীণ বৃক্ষ কাঠামোটি প্রদর্শন করতে সক্ষম।

প্রিফলাইট খুলুন
বিকল্পগুলিতে যান (ডান উপরের কোণায়)
অভ্যন্তরীণ পিডিএফ স্ট্রাকচার

শীর্ষে অ্যাডোব অ্যাক্রোব্যাট প্রো পিডিএফ-তে ডকুমেন্ট হরফের অভ্যন্তরীণ কাঠামো প্রদর্শন করতে পারে অন্যান্য বেশিরভাগ "পিডিএফ ট্রি ট্রি স্ট্রাকচার ভিউয়ার" এর এই গতি নেই

Question 8

অ্যাক্রোব্যাট অবজেক্ট ভিউয়ারটি ভাল তবে উইন্ডজ্যাক সলিউশনের পিডিএফ ক্যানোপেনার পৃষ্ঠায় বস্তু নির্বাচন করার জন্য আইড্রোপার দিয়ে আরও ভাল পরিদর্শন করতে পারবেন। এছাড়াও পিডিএফ করার পরিবর্তনের অনুমতি দেয়।

http://www.windjack.com/products/pdfcanopener.html

Question 9

পিডিএফ বিশ্লেষক অনুরূপ PDFXplorer , কিন্তু এটা আরো বিকল্প রয়েছে। এটি একক নিবন্ধনের পরেও বিনামূল্যে।

Question 10

আপনি যদি পাইথনের মধ্যে থেকেই প্রোগ্রামগতভাবে কাজ করতে চান তবে পিডিএফমিনার একটি ভাল বিকল্প। এটি আপনাকে অবজেক্ট হায়ারার্কি হিসাবে মেমরির পিডিএফ স্ট্রাকচারের সাথে কাজ করতে বা এটি এক্সএমএল হিসাবে সিরিয়ালাইজ করার অনুমতি দেয়।

Question 11

আমার প্রবন্ধটি ফক্সিট পিডিএফ রিডার যা পিডিএফ ফাইলে গুরুত্বপূর্ণ পাঠ্য সম্পাদনার কাজ করতে খুব সহায়ক।

পিডিএফ ফাইলগুলি পরীক্ষা করার জন্য সেরা সরঞ্জাম? [বন্ধ]

qpdf (আমার পছন্দ)

mutool

podofouncompress

peepdf.py

pdfid.py এবং pdf-parser.py