আপনি যদি অনেকগুলি পৃষ্ঠাগুলি নিষ্কাশন করতে চান তবে নীচের স্ক্রিপ্টটি আপনি এ জাতীয় কলটি ব্যবহার করতে পারেন (ধরে নেওয়া হয়েছে যে আপনি এটি আপনার সিস্টেমের প্যাথের কোথাও, উদাহরণস্বরূপ / usr / স্থানীয় / বিন ফাইল করে pdfextract.py ফাইল করতে পারেন, এবং এটি কার্যকর করার জন্য নির্ধারণ করেন) chmod 744 pdfextract.py এর সাথে অনুমতি):
পিডিএফেক্সট্রাক্ট.পি - ফাইল-ইন / পাথ / টু / লার্জ / পিডিএফ - ফাইল-আউট / পাথ / টু / নতুন / পিডিএফ - স্টার্ট - স্টপ
#!/usr/bin/env python
# -*- coding: utf-8 -*-
import argparse
import os
import subprocess as sp
def main():
parser = argparse.ArgumentParser()
parser.add_argument('--file-in', required=True, type=str, dest='file_in')
parser.add_argument('--file-out', required=True, type=str, dest='file_out')
parser.add_argument('--start', required=True, type=int, dest='start', default=-1)
parser.add_argument('--stop', required=True, type=int, dest='stop', default=-1)
args = parser.parse_args()
assert os.path.isfile(args.file_in)
assert not os.path.isfile(args.file_out)
# remove temporary files
for el in os.listdir('/tmp'):
if os.path.isfile(os.path.join('/tmp', el)) and el[:12] == 'pdfseparate-':
os.remove(os.path.join('/tmp', el))
sp.check_call('pdfseparate -f {:d} -l {:d} {:s} /tmp/pdfseparate-%d.pdf'.format(args.start, args.stop, args.file_in), shell=True)
cmd_unite = 'pdfunite '
for i in range(args.start, args.stop + 1):
cmd_unite += '/tmp/pdfseparate-{:d}.pdf '.format(i)
cmd_unite += args.file_out
sp.check_call(cmd_unite, shell=True)
# remove temporary files
for el in os.listdir('/tmp'):
if os.path.isfile(os.path.join('/tmp', el)) and el[:12] == 'pdfseparate-':
os.remove(os.path.join('/tmp', el))
if __name__ == "__main__":
main()