মাইক্রোসফ্ট ওয়ার্ডে জিপিপি?


10

মাইক্রোসফ্ট ওয়ার্ডে জিপিপি?

আমি একটি শব্দ নথি থেকে প্রদত্ত স্ট্রিং সহ সমস্ত লাইন টানতে চাই। Unix বিশ্বের মধ্যে ... grep একটি ত্রুটি ছাড়া এই কাজ করে। উইন্ডোজ আমার জন্য সুস্পষ্ট চেয়ে কম।

উত্তর:


10

সিগুইন (অথবা একটি লিনাক্স মেশিন অ্যাক্সেস) দিয়ে আপনি করতে পারেন

antiword file.doc | grep "my phrase"

অথবা

catdoc file.doc | grep "my phrase"

সেখানে কমান্ড লাইন ফাইল ফরম্যাট কনভার্টার প্রচুর আছে , grep অনুরূপ ফ্যাশন।

বিশুদ্ধভাবে-শব্দ সমাধান হতে পারে জন্য Ctrl + এফ (খুঁজুন), এবং তারপর সব খুঁজুন - তবে, আমি নিশ্চিত নই যে এমএস ওয়ার্ডের সমস্ত সংস্করণ যদি থাকে সব খুঁজুন বোতাম।


2
আমি প্রশ্ন শিরোনাম দেখেছি যখন আমি "হা! এটা চমৎকার হবে, এটা হবে না"। আমি আবার GNU প্রোগ্রামার underestimate করা উচিত নয়।
Phoshi

এর সাম্প্রতিক সংস্করণ catdoc প্রতি উপর segfaults .doc / .docx ফাইল আমি, এবং antiword শুধু আমার নথি "একটি শব্দ নথি নয়" আমাকে বলে। আপনি কি অন্য কোন বিকল্প জানেন?
detly

আমি যা কিছুই ব্যবহার করেছি ... দ্রুত অনুসন্ধান যে দেখায় docx2txt ডেবিয়ান রিপোজিটরিতে বিদ্যমান - কাজ করতে পারে। আমি OpenOffice / LibreOffice কমান্ড-লাইন ফর্ম্যাট রূপান্তর ইউটিলিটি (unoconv) এও দেখতে চাই, যা একই উদ্দেশ্যে ব্যবহার করা যেতে পারে।
chronos

3

আমি এই আদিম শব্দ জানি, কিন্তু আপনি .txt হিসাবে ফাইল সংরক্ষণ থেকে এবং তারপর আপনার পছন্দমত এটি আলাদা আলিঙ্গন থেকে বিরতি কি।


2
তাদের জন্য শত শত থাকার জন্য এটি কি।
tchrist

1

একটি শব্দ প্রসঙ্গে "লাইন" মানে কি? প্রদর্শিত লাইন, যা আপনি পৃষ্ঠা ফর্ম্যাটিং করতে কিছু পরিবর্তন করেন? অনুচ্ছেদ? অন্যকিছু?

আপনি ফর্ম্যাটিং এবং অন্যান্য অ-সুস্পষ্ট জিনিসগুলি সহ ওয়ার্ডের সন্ধান-এবং-প্রতিস্থাপনের ফাংশনগুলির সাহায্যে সামগ্রীর একটি গুচ্ছ কাজ করতে পারেন, তবে এটির সমস্তগুলি শুধুমাত্র সন্ধানের জন্যই কাজ করবে-কোনও পাঠ্যকে নয় কি পাঠ্য।


গ্রেপের যে রেগেক্স lovin পেয়েছিলাম, যদিও!
Phoshi

1

এমএস ডকুমেন্টস - ওয়ার্ড, পাওয়ার পয়েন্ট, এক্সেল - ইন এর জন্য সমর্থন আছে CRGREP যা আমি একটি মুক্ত ওপেনসোর্স টুল হিসাবে উন্নত করেছি। এটি ডাটাবেস টেবিল, চিত্র, অডিও, সংরক্ষণাগার, PDF এবং এর সমন্বয়গুলির মতো সামগ্রীগুলি অনুসন্ধানের জন্য আরও কঠিন করে তোলে। আনন্দ কর.


0

PowerGREP করব ঠিক যে আপনার জন্য, এবং দ্রুত - কিন্তু বিনামূল্যে না। এটা আমার মতে, যদিও, প্রতিটি পেনি মূল্য। প্লাস, একটি 30 দিনের বিনামূল্যে ট্রায়াল আছে।

Screenshot of PowerGREP searching through a Word file


0

মন্তব্য করার জন্য যথেষ্ট রেপ পাওয়া যায় নি কিন্তু আমি এই ডক বনাম ডকক্স ইস্যু নিয়ে আলোচনা করতে পেরেছি যাতে কেউ যে থ্রেডের পশ্চাদ্ধাবন করতে পারে (যেমন আমি ছিলাম) এটি সহায়ক হতে পারে।

আপনি docx ফাইলের জন্য একটি বিশেষ হাতিয়ার প্রয়োজন হয় না। docx এক্সএমএল ফাইল জিপ করা হয়।

এক্সএমএল এক্সট্র্যাক্ট এবং স্ট্রিপ্ট কিছু উপর ভিত্তি করে চেষ্টা করুন

unzip -p "*.docx" word/document.xml | sed -e 's/<[^>]\{1,\}>//g; s/[^[:print:]]\{1,\}//g'

থেকে কমান্ড লাইন FU

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.