পিডিএফ কে পিডিএফ / এ তে রূপান্তর করছেন?


11

লিনাক্সে এলোমেলো উত্সের পিডিএফ দেওয়া, আমি কীভাবে করব:

  • এটি ইতিমধ্যে পিডিএফ / এ ফর্ম্যাটে রয়েছে কিনা তা নিশ্চিত করুন ?
  • যদি এটি পিডিএফ / এ ফর্ম্যাটে না থাকে তবে ন্যূনতম ক্ষতির সাথে এটিকে পিডিএফ / এ রূপান্তর করুন?

আমি সচেতন যে রূপান্তরটি নথির বহিরাগত উপাদানগুলির ক্ষতির কারণ হতে পারে, তবে আসুন ধরে নেওয়া যাক যে তুলনামূলকভাবে সুদূর ভবিষ্যতে ডকুমেন্টটি খোলার ক্ষমতা যেমন স্পাইফাই বৈশিষ্ট্যগুলির চেয়ে বেশি গুরুত্বপূর্ণ (যা উপলভ্য / পাঠযোগ্য নাও হতে পারে) যাইহোক একটি সময়)। মূল ফাইলটি খুলতে না পারার ঝুঁকির চেয়ে আমি যখন তুচ্ছভাবে পাশাপাশি নথিগুলি পাশাপাশি দেখতে পারি তখন রূপান্তরটির সঠিকতাটি দৃশ্যত নিশ্চিত করতে সক্ষম হব।

উত্তর:


9

সনাক্ত

আমি এই সরঞ্জামটি পেয়েছি যা দেখে মনে হচ্ছে আপনি পিডিএফ / এ ফাইলগুলি সনাক্ত করতে যা ব্যবহার করতে পারেন। এটিকে DROID (ডিজিটাল রেকর্ড এবং অবজেক্ট আইডেন্টিফিকেশন) বলা হয় । এটি জাভা ভিত্তিক এবং এটি জিইউআই বা কমান্ড-লাইন থেকে চালানো যেতে পারে।

উদ্ধৃতাংশ

ন্যাশনাল আর্কাইভস দ্বারা ফাইল ফর্ম্যাটগুলির স্বয়ংক্রিয় ব্যাচ সনাক্তকরণ সম্পাদন করার জন্য ড্রয়েড একটি সফ্টওয়্যার সরঞ্জাম। এর বিস্তৃত ডিজিটাল সংরক্ষণ কার্যক্রমের অংশ হিসাবে এটির ডিজিটাল সংরক্ষণ বিভাগ দ্বারা বিকাশিত, ডিআআরআইডিটি সমস্ত সঞ্চিত ডিজিটাল অবজেক্টের সুনির্দিষ্ট ফর্ম্যাটটি সনাক্ত করতে সক্ষম হতে এবং সেই পরিচয়টিকে কেন্দ্রীয় রেজিস্ট্রিতে সংযুক্ত করতে যে কোনও ডিজিটাল সংগ্রহের মৌলিক প্রয়োজনীয়তা পূরণের জন্য ডিজাইন করা হয়েছে যে ফর্ম্যাট এবং তার নির্ভরতা সম্পর্কে প্রযুক্তিগত তথ্য।

এটি জাতীয় আর্কাইভস দ্বারা পৃষ্ঠপোষক প্রদত্ত আমি পিডিএফ / এ ফর্ম্যাটের উদ্দেশ্যযুক্ত উদ্দেশ্য বিবেচনা করে ধরে নেব এটি করার জন্য এটি সঠিক সরঞ্জাম। এছাড়াও প্রকল্পটি ওপেন সোর্স এবং কোডটি গিথুব-তে পাওয়া যায় পাশাপাশি জাতীয় আর্কাইভস ওয়েবসাইট থেকে বাইনারি আকারে প্যাক করা হয় ।

বৈধকরণ এবং রূপান্তর

আপনি যদি বৈধতা এবং রূপান্তর করার জন্য কোনও সরঞ্জাম সন্ধান করেন তবে আমার বিশ্বাস পিডিএফবক্স এটি করতে পারে। পিডিএফবক্স তাদের ওয়েবসাইটের প্রথম পৃষ্ঠায় পিডিএফ / একটি বৈধতা তালিকাভুক্ত করে। এটি অন্য জাভা অ্যাপ্লিকেশন 8-)।

ওয়েবসাইট থেকে উদ্ধৃতি

পিডিএফ / একটি বৈধতা
পিডিএফ / একটি আইএসও মানের বিপরীতে পিডিএফগুলি বৈধ করুন।

তাদের প্রধান পৃষ্ঠার বাম দিকে কমান্ড লাইন সরঞ্জাম বিভাগের অধীনে সরঞ্জামটির জন্য নিম্নলিখিত ব্যবহারটি দেখায়:

$ java -jar pdfbox-app-x.y.z.jar org.apache.pdfbox.ConvertColorspace [OPTIONS] <inputfile> <outputfile>

ভেরাপিডিএফ হল পিডিএফ / এ যাচাই করতে সক্ষম আরেকটি সরঞ্জাম; এটি ওপেন সংরক্ষণ সংরক্ষণ ফাউন্ডেশনের রেফারেন্স সরঞ্জাম সেটের একটি অংশ। এটি একটি জাভা অ্যাপ্লিকেশন।

রূপান্তর

কেবল রূপান্তর করার জন্য আমি শিরোনামযুক্ত একটি ব্লগ পোস্ট থেকে এই পদ্ধতিটি পেয়েছি: একটি বিদ্যমান পিডিএফকে পিডিএফ / এ রূপান্তর করার বিনামূল্যে উপায় , যা নিম্নলিখিত সরঞ্জামগুলি ব্যবহার করে:

  • ঘোস্টস্ক্রিপ্ট 8.64 কেবল।
  • পিডিএফবক্স 0.7.3
  • পিডিফ্মার্কস (অতিরিক্ত মেটা ডেটা সরবরাহের জন্য ফাইল)
  • PDFA_def.ps
  • USWebCoatedSWOP.icc

উপরের জায়গায় একই জায়গায় আপনি নিম্নলিখিত কমান্ডটি ব্যবহার করুন:

$ gs -sDEVICE=pdfwrite -q -dNOPAUSE -dBATCH -dNOSAFER     \
-dPDFA -dUseCIEColor -sProcessColorModel=DeviceCMYK       \
-sOutputFile=Out_PDFA.pdf PDFA_def.ps pdfmarks IN_PDF.pdf

এটি warts ছাড়া না। নিবন্ধটি তাদের মধ্যে একটি নিয়ে আলোচনা করেছে, হাইপারলিঙ্কগুলির মধ্যে মুদ্রণ পতাকাগুলি তাদের মধ্যে একটি হিসাবে ঠিক করে। নিবন্ধটি জাভা অ্যাপ্লিকেশন সরবরাহ করে যা আপনি এগুলি ঠিক করতে ব্যবহার করতে পারেন:

$ java FixPrintFlag Out_PDFA.pdf New_verifiablePDFA.pdf

এটি সুন্দর নয় তবে এটি কার্যক্ষম বলে মনে হচ্ছে। আরও বিশদ জন্য নিবন্ধ দেখুন ।

তথ্যসূত্র


আমাকে এটি চেষ্টা করে দেখতে হবে - এটি দুর্দান্ত ভয়ঙ্কর দেখায়। অল্প বিস্ফোরনের সাহায্যে এটিকে CUPS-PDF প্রিন্টারে সংহত করা সম্ভবও হতে পারে; /etc/cups/cups-pdf.conf এ সেটিংস রয়েছে যেগুলি সেই উদ্দেশ্যে আশাব্যঞ্জক। সময় দেবার জন্য ধন্যবাদ! এখনই এটি পরীক্ষা করে দেখার মতো নয় তবে আমি এটিতে ফিরে আসব (আশা করি আগামীকাল)।
একটি সিভিএন

@ মাইকেলKjörling - প্রশ্নের জন্য ধন্যবাদ। আমি এর আগে পিডিএফ / এ ফর্ম্যাটটি কখনও শুনিনি এবং কাজের ক্ষেত্রে আমাদের এই সঠিক জিনিসটির প্রয়োজন আছে। সুতরাং আপনি এখন এই জিনিসগুলি সম্পর্কে 8- তে জানার জন্য আমাকে প্রতিভা হিসাবে দেখতে সহায়তা করেছিলেন)
slm



1

ফাইল সনাক্তকরণের জন্য, কমান্ডটি fileপ্রায়শই সহায়ক। এটি যেকোন সহায়ক তথ্য দিতে আপনার যাদু নম্বর, ফাইল শনাক্তকারী, এনকোডিং তথ্য ইত্যাদি অনুসন্ধান করবে।

পিডিএফ ফাইলগুলির বিশেষ ক্ষেত্রে, ইউটিয়ারিটি pdfinfoবিশেষভাবে কার্যকর। আমার ক্ষেত্রে, একটি জেন্টু বিতরণ, এটি popplerএকটি পিডিএফ রেন্ডারিং লাইব্রেরি সহ প্যাকেজযুক্ত ।


1
pdfinfo -metaএবং দেখে xmpmeta/RDF/Description/conformanceমনে হচ্ছে পিডিএফটি পিডিএফ / এ (যে নোডটি রয়েছে A) না (নোডের অস্তিত্ব নেই বা এর অন্য কোনও মান রয়েছে)। এটি একটি শুরু!
একটি সিভিএন

0

এখানে একটি বাশ কমান্ড লাইন স্ক্রিপ্ট ঠিক এটি করছে:

#!/bin/bash

pdf_input=$1
ps_output=${pdf_input%.*}.ps
pdfa_output=${pdf_input%.*}_a.pdf
pdftops $input $ps_output

gs -dPDFA -dBATCH -dNOPAUSE -dNOOUTERSAVE -dUseCIEColor -sProcessColorModel=DeviceCMYK -sDEVICE=pdfwrite -sPDFACompatibilityPolicy=1 -sOutputFile=$pdfa_output $ps_output

এটি আপনার পথে থাকা pdf2pdfa.sh নামক একটি ফাইলে সংরক্ষণ করুন, তারপরে এটিকে কল করুন:

pdf2pdfa.sh ইনপুট.পিডিএফ

এটি ইনপুট_এ.পিডিএফ তৈরি করবে।


2
(1) দয়া করে এটি কী করে তা ব্যাখ্যা করুন। (২) কী input? আমি দেখছি pdf_input, তবে কী input? (3) আপনার কাছে সর্বদা শেল ভেরিয়েবলগুলি উদ্ধৃত করা উচিত যদি না আপনি যদি না চান তবে আপনার পক্ষে সঠিক কারণ নেই এবং আপনি নিশ্চিত যে আপনি কী করছেন তা আপনি নিশ্চিত । মন্তব্যে প্রতিক্রিয়া জানাতে দয়া করে;  আপনার উত্তরটি আরও পরিষ্কার এবং আরও পরিপূর্ণ করতে সম্পাদনা করুন।
জি-ম্যান
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.