ব্যাচ পিডিএফ ফাইলগুলি থেকে মন্তব্যগুলি সরিয়ে দেয়


18

আমি কীভাবে সহজেই কোনও ফোল্ডারের সমস্ত পিডিএফ থেকে সমস্ত মন্তব্য এবং টীকা (ফক্সিট রিডার সহ যুক্ত) মুছে ফেলতে পারি?


1
আপনি কী কেবল বিনামূল্যে (বিয়ারের মতো) বা ফ্রি (স্বাধীনতার মতো) সমাধানের জন্য পরামর্শ চান তা ভাবার বৈধ অনুমান কি?
কর্ট ফেফেল

@ পিপিটাস আমি যে কোনও ধরণের সমাধানে আগ্রহী।
অ্যান্ড্রু

উত্তর:


7

আমি কেবল এই সমস্যার মধ্যে পড়েছি, এবং এখানে দেওয়া কোনও উত্তরই আমার পক্ষে কার্যকর হয়নি। কি করেনি কাজ ছিল rewritepdfউবুন্টু প্যাকেজ থেকে টুল libcam-pdf-perl:

rewritepdf -C in.pdf out.pdf

ডিরেক্টরিতে সমস্ত পিডিএফ ফাইল থেকে টীকা মুছে ফেলার জন্য এটিকে সামান্য স্ক্রিপ্টিংয়ে মুড়িয়ে ফেলা এখন সহজ:

for i in *.pdf; do rewritepdf -C '$i' '$i'.new; done

এটা তোলে জরিমানা কাজ :) কিছু সাহায্য। দ্য উবুন্টু (অর্থাত, ডেবিয়ান) প্যাকেজ এখানে packages.debian.org/sid/perl/libcam-pdf-perl Dependences স্বয়ংক্রিয়ভাবে "উবুন্টু সফটওয়্যার সেন্টার" ব্যবহার ইনস্টল করা নেই। (ওহ, এবং মূলধন "-C" সঙ্গে সতর্ক আমি প্রথম দৌড়ে "-c" এবং কিছুই ঘটেনি, এমনকি কোন ত্রুটি আউটপুট ছিল।।)
loved.by.Jesus

5

আপনি ইউনিক্স সিস্টেমে সরবরাহ করছেন:

cd <directory containing PDFs>
find . -type f -name '*.pdf' -exec perl -pi -e 's:/Annots \[[^]]+\]::g' {} +

এটি হ্যাক যা /Annotsপিডিএফ থেকে সমস্ত কমান্ড সরিয়ে দেয় (কমান্ডগুলি যে টীকাগুলি আঁকবে)। এটি সেখানে টীকাগুলি অবজেক্টগুলিকে ছেড়ে যায় (আপনি কোনও পাঠ্য সম্পাদক দিয়ে পিডিএফটি খুলতে পারেন এবং তাদের সন্ধান করতে পারেন), সেগুলি কেবল আঁকা হয়নি।


আপনি আরই ব্যাখ্যা করতে পারেন? [^]] + মিল কী
জাফতুগা

1
@jftuga, s:(বিকল্প) /Annots \[(পাঠ্য " /Annots [") [^]]+(ব্যতীত কোন চরিত্র এক বা একাধিক দৃষ্টান্ত " ]") \](আক্ষরিক চরিত্র " ]") ::(কিছু কিছুই সাবেক মিলে প্রতিস্থাপন) g(প্রতি লাইনে একাধিক বার প্রতিস্থাপন প্রয়োজন হলে)।
ডিভিনিফ্রন

1
রেজেক্সের একটি সম্ভাব্য বিভ্রান্তিকর অংশটি হ'ল ]সাধারণত একটি আক্ষরিককে পালাতে হয় তবে তা ^প্রত্যাখ্যানের পরে ঠিক নয় ।
ডিভিনিফ্রন

এটি অভ্যন্তরীণ নথির লিঙ্কগুলিও সরিয়ে দেয় (যেমন আমি বিশ্বাস করি, সেগুলি পিডিএফ-এ / এনওট হিসাবেও প্রয়োগ করা হয়)
আলেক জ্যাকবসন

3

এটি একটি দুর্দান্ত ব্যাপার পরীক্ষা করা হয়নি, তবে নিম্নলিখিতগুলি কাজ করে বলে মনে হচ্ছে। এটি অভ্যন্তরীণ ডকুমেন্ট লিঙ্কগুলি বাদ দিয়ে সমস্ত টীকা মুছে ফেলে (যা এখানে উত্তরগুলির কিছুই বলে মনে হচ্ছে না)। এই স্ক্রিপ্টটি পিডিএফআরউ পাইথন লাইব্রেরির উপর নির্ভর করে ।

#!/usr/bin/python

import sys, pdfrw

try:
    in_path = sys.argv[1]
    out = sys.argv[2]
except:
    print("Usage:\tannotclean IN.pdf OUT.pdf")
    exit(0)

reader = pdfrw.PdfReader(in_path)

for p in reader.pages:
    if p.Annots:
        # See PDF reference, Sec. 12.5.6 for all annotation types
        p.Annots = [a for a in p.Annots if a.Subtype == "/Link"]

pdfrw.PdfWriter(out, trailer=reader).write()

ব্যবহার:

  1. স্ক্রিপ্ট হিসাবে কোথাও সংরক্ষণ করুন (আমি ধরে নিই আপনার PATH), যেমন /usr/local/bin/annotclean
  2. annotclean in.pdf cleaned.pdf
  3. (alচ্ছিক) ব্যাচ প্রক্রিয়াজাতকরণ:
# fish shell syntax
for p in **pdf # pdfs from current directory and subdirectories
    annotclean $p $p.new
    mv $p.new $p # overwrite the old
end 

2

আমি মনে করি আপনি পিডিএফ "পুনরায় চেষ্টা" করে খুব সহজেই এটি করতে পারেন। পুনরায় চেষ্টা করার অর্থ: প্রথমে ফাইলটিকে পোস্টস্ক্রিপ্টে রূপান্তর করুন, তারপরে পোস্টস্ক্রিপ্টটিকে পিডিএফে রূপান্তর করুন। সাধারণত পুনঃপ্রকাশের বিষয়টি ভ্রান্ত হয়, কারণ সাধারণত আপনি মানের এবং কিছু সামগ্রী আলগা করেন। আপনার ক্ষেত্রে আপনি বিষয়বস্তু আলগা করতে চান । রি-ফ্রাইং ঘোস্টস্ক্রিপ্ট (এবং এটির সাহায্যকারী ব্যাচের ফাইলগুলি শিপিংয়ের মাধ্যমে করা যায় - gs900w32.exeআপনি উইন্ডোজে থাকলে ডাউনলোড করুন ), তাই আপনি এখানে যান 2 টি সহজ কমান্ড সহ:

pdf2ps.bat input.pdf output.ps
ps2pdf.bat output.ps input_refried.pdf

1
এটি কাজ করে না। লিখিত ইন মন্তব্যগুলি (মন্তব্য হিসাবে নয়, পিডিএফের অংশ হিসাবে) রয়েছে।
অ্যান্ড্রু

2
মন্তব্যগুলি যদি পিডিএফের সামগ্রীতে যুক্ত হয় তবে সেগুলি কেবল ম্যানুয়ালি সরানো যেতে পারে। আসল পিডিএফ টীকা পৃথক।
কার্লএফ

কোন রূপান্তর ব্যবহার না করে কোন উপায় আছে?
ব্যবহারকারী

এটি অভ্যন্তরীণ নথির লিঙ্কগুলিও সরিয়ে দেয়।
অ্যালেক জ্যাকবসন

@ অ্যালেকজ্যাকবসন: অবশ্যই। আপনি যদি পোস্টস্ক্রিপ্টে রূপান্তর করেন তবে আপনি অনেকগুলি "সমৃদ্ধ" সামগ্রীটি পিডিএফের অংশ হিসাবে ছেড়ে দিয়েছেন। পোস্টস্ক্রিপ্টের কোনও লিঙ্ক উপস্থাপন করার উপায় নেই, এমনকি অভ্যন্তরীণ নথির
লিংকও নেই

2

ঠিক আছে, আপনি বলেছিলেন যে আপনি একটি বাণিজ্যিক সমাধানও বিবেচনা করবেন ....

আমি আপনাকে কলস পিডিএফটুলবক্স ব্যবহার করার পরামর্শ দিচ্ছি । এটি উইন্ডোজ এবং ম্যাক ওএস এক্স এর জন্য উপলভ্য Linux লিনাক্স সিএলআই, যদিও।

পিডিএফটুলবক্সে অনেকগুলি এবং অনেকগুলি পৃথক পিডিএফ সমস্যাগুলি হেরফের করার এবং ঠিক করার প্রচুর উপায় রয়েছে।

"ফিক্সআপস" এর একটি হ'ল সমস্ত টীকা মুছে ফেলা।

প্রথমে এটি পরীক্ষা করার জন্য আপনার কোনও অর্থ খোলার দরকার নেই; ক্যালাস 14 দিনের পরীক্ষার জন্য বিনামূল্যে লাইসেন্স দেয়।


এটিতে সমস্ত টীকা মুছে ফেলার উপায় আছে তবে আমি ব্যাচের কাজ কীভাবে করব তা নিশ্চিত নই।
অ্যান্ড্রু

পূর্ববর্তী সংস্করণগুলি সম্পর্কে ডান্নো --- তবে সর্বশেষতম পিডিএফটুলবক্স 5 রিলিজ এটি পিডিএফ সমেত সম্পূর্ণ ফোল্ডারগুলির বিরুদ্ধে ব্যাচ মোডে চালানোর অনুমতি দেয় .....
কার্ট ফেফেল
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.