উত্তর:
নিখরচায় মনে হচ্ছে, এটি চেষ্টা করে দেখুন এবং এটি আমার পক্ষে ভাল কাজ করে।
গুগল ডক্স এখন একটি নতুন এপিআই বৈশিষ্ট্য পরীক্ষা করছে যা চিত্র এবং পিডিএফগুলিতে ওসিআর (অপটিক্যাল ক্যারেক্টার রিকগনিশন) ব্যবহার করে।
থেকে গুগল অপারেটিং সিস্টেম :
গুগল ডক্স এপিআই একটি নতুন বৈশিষ্ট্য পরীক্ষা করে যা আপনাকে একটি চিত্রে ওসিআর (অপটিক্যাল অক্ষর স্বীকৃতি) সম্পাদন করতে দেয়। এখানে একটি লাইভ ডেমো রয়েছে যা এই বৈশিষ্ট্যটির চিত্র তুলে ধরেছে : আপনি একটি উচ্চ-রেজোলিউশন জেপিজি, জিআইএফ, বা পিএনজি চিত্র আপলোড করতে পারেন যা 10 এমবি এরও কম রয়েছে এবং গুগল ডক্স পাঠ্যটি বের করে এবং এটি একটি নতুন দস্তাবেজে রূপান্তর করে। গুগল উল্লেখ করেছে যে "অপারেশনটি বর্তমানে ৪০ সেকেন্ড পর্যন্ত সময় নিতে পারে" এবং একটি ছোট পরীক্ষায় দেখা গেছে যে পরিষেবাটি এখনও নির্ভরযোগ্য নয়: এটি ধীর গতির এবং এটি প্রায়শই ত্রুটিগুলি ফিরিয়ে দেয়।
ফলাফল নিখুঁত থেকে দূরে এবং আপনি অনেক ত্রুটি দেখতে পাবেন, তবে পরিষেবাটি নিখরচায় এবং এটি ক্রমাগত উন্নতি করছে। এই স্ক্যান করা দস্তাবেজের জন্য ওসিআরের ফলাফল এখানে :
গুগল ডক্স ডকুমেন্টটি এইচটিএমএল, ওপেনঅফিস এবং শব্দ সহ বিভিন্ন ফর্ম্যাটে রফতানি করা যায়:
তাই আমার উত্তর প্রতি একটি উপায় সহজেই একটি DOCX বিন্যাস প্রোগ্রামেটিক্যালি করার জন্য একটি পিডিএফ রূপান্তর করতে এর নেই কেউ কি জানেন :
পিডিএফকে এসভিজিতে রূপান্তর করুন (ভূত স্ক্রিপ্ট এটি করবে) এবং এটি আমদানি করুন ...
... পয়েন্টটি হ'ল ওয়ার্ড পিডিএফ এমবেড করবে না, এটি এসভিজি এম্বেড করবে।
পিডিফোনলাইন একটি সুন্দর শালীন কাজ করে।
উদাহরণস্বরূপ Omnipage প্রো এর মতো একটি অপটিক্যাল চরিত্র স্বীকৃতি প্রোগ্রাম ব্যবহার করুন । এটি পিডিএফটিকে ডকুমেন্ট ইনপুট হিসাবে এবং ওয়ার্ডকে আউটপুট হিসাবে সমর্থন করে।
আপনি ওসিআরটিার্মিনালও চেষ্টা করতে পারেন যা প্রতি মাসে 20 পৃষ্ঠাগুলির জন্য নিখরচায় পরিষেবা দেয়। তাদের একটি বিটা ডেস্কটপ ক্লায়েন্ট রয়েছে যা মনে হয় আমন্ত্রণের মাধ্যমে ব্যবহারের জন্য উপলব্ধ রয়েছে (আপনাকে তাদের সাথে যোগাযোগ করতে হবে এবং আগ্রহ প্রকাশ করতে হবে)।