আমি কীভাবে রেজেক্স এবং নোটপ্যাড ++ দিয়ে সমস্ত নন-এসসিআইআই অক্ষর মুছব?


147

আমি অনেক অনুসন্ধান করেছি, কিন্তু নোটপ্যাড ++ থেকে নন-এএসসিআইআই অক্ষরগুলি কীভাবে সরিয়ে ফেলা যায় তা কোথাও লিখিত নেই।

অনুসন্ধান এবং প্রতিস্থাপনে কোন আদেশ লিখতে হবে তা আমার জানতে হবে (চিত্র সহ এটি দুর্দান্ত হবে)।

  • যদি আমি একটি সাদা তালিকা তৈরি করতে এবং সমস্ত ASCII শব্দ / লাইন বুকমার্ক করতে চাই তবে নন-এএসসিআইআই লাইনগুলি চিহ্নিত করা হবে

  • যদি ফাইলটি বেশ বড় হয় এবং সমস্ত এএসসিআইআই লাইন নির্বাচন করতে না পারে এবং কেবল অ-এসসিআইআই অক্ষরযুক্ত লাইনগুলি নির্বাচন করতে চায় ...

উত্তর:


263

এই অভিব্যক্তিটি নন-এসসিআইআই মানগুলির জন্য অনুসন্ধান করবে:

[^\x00-\x7F]+

'অনুসন্ধান মোড = নিয়মিত অভিব্যক্তি' টিক চিহ্ন টানুন এবং ক্লিক করুন Find Next

উত্স: যে কোনও এএসসিআইআই চরিত্রকে রেজেক্স করুন


4
এবং কেবল যদি এটি স্পষ্ট না হয় তবে আপনি "^" সরিয়ে ফেললে আপনি ASCII লাইনগুলি সন্ধান করছেন
মাইক এম

7
ভাল কাজ করে, তবে আমাকে সেট করতে হয়েছিল Encoding->Encode in ANSI। অন্যথায় কিছু খুঁজে পেতে অক্ষম ছিল।
ফোমাইগুই

1
নেটবিনে তার রিজে এক্সপ্যাক্স-অনুসন্ধান বিকল্পের সাথে পুরোপুরি কাজ করে (গ্রহাণু-বোতাম)
টেসন

ভিএস-কোডে কাজ করে, রেগেক্স অনুসন্ধান বিকল্পটি ক্লিক করতে ভুলবেন না!
yashhy

4
আপনি যদি \ r এবং \ n রাখতে চান - ক্যারেজ রিটার্ন এবং লাইনফিড অক্ষরগুলি - আপনি এই রেজেক্সটি ব্যবহার করতে পারেন: [\ x00- \ x09 \ x0B- \ x0C \ x0E- \ x1F] +
স্টিফেন উইঙ্কলার

53

নোটপ্যাডে ++ আপনি মেনু যেতে অনুসন্ধানসীমার মধ্যে অক্ষর খুঁজুননন- ASCII অক্ষর (128-255) আপনি যা করতে পারেন তারপর প্রতিটি নন- ASCII অক্ষর দস্তাবেজের মাধ্যমে ধাপ।

আপনি যদি সমস্ত নন-এএসসিআইআই অক্ষরের জন্য নথিতে লুপ করতে চান তবে " আশেপাশে মোড়ানো " টিক চিহ্নটি নিশ্চিত করুন।

স্ক্রিনশট "রেঞ্জ ইন সন্ধান করুন"


3
এটি ভালভাবে কাজ করে তবে তালিকার সমস্ত ফলাফল প্রদর্শন করে না এবং "প্রতিস্থাপন" বিকল্পের কোনও বিকল্প নেই
অ্যালেক্স

ঝরঝরে ... কারণ আমি সর্বদা অ-এসসিআইআইয়ের জন্য রেজিটাকে ভুলে যাই এবং প্রতিবার এই পৃষ্ঠায় ফিরে যেতে গুগলে এটি করতে হবে :)
জিন-ফ্রাঙ্কোয়েস টি।

27

প্রোজিএম এর উত্তর ছাড়াও, আপনি যদি এনএলইউ বা এসিএকের মতো বাক্সগুলিতে অক্ষরগুলি দেখতে পান এবং সেগুলি থেকে মুক্তি পেতে চান তবে এগুলি ASCII নিয়ন্ত্রণ অক্ষর (0 থেকে 31), আপনি নিম্নলিখিত অভিব্যক্তিটি সহ তাদের সন্ধান করতে এবং এগুলি সরাতে পারেন:

[\x00-\x1F]+

সমস্ত অ- ASCII এবং ASCII নিয়ন্ত্রণ অক্ষর মুছে ফেলার জন্য, আপনাকে এই রেজেক্সের সাথে মিলে সমস্ত অক্ষর মুছে ফেলা উচিত:

[^\x1F-\x7F]+

থেকে মানগুলি \x00এবং \x1Fইতিমধ্যে ProGM দ্বারা উত্তর মেলানো হয়।
ইউনিহীড্রন

2
আপনি রাখতে চান এমন মানগুলির সাথে সেগুলি মিলছে। আপনি যদি এগুলি থেকে মুক্তি পেতে চান তবে আমি কেবল এটিই পরামর্শ দিচ্ছিলাম।
brunorey

ইউনিট বিভাজক চরিত্রটি বাদ দিতে শেষ উদাহরণটি 20 এ শুরু হওয়া উচিত। 7F এর পাশাপাশি এটি একটি নিয়ন্ত্রণ চরিত্রকেও বাদ দিন।
fgb

উজ্জ্বল! আমি Qdap আর প্যাকেজটি ব্যবহার করে সমস্ত অদৃশ্য নন-এএসসিআইআই অক্ষর মুছে ফেলেছি:mgsub("[^\x1F-\x7F]+", "", text_vector, fixed = FALSE)
পাবলো অ্যাডামস

22

সমস্ত অ-এসসিআইআই অক্ষর মুছে ফেলার জন্য, আপনি নিম্নলিখিত প্রতিস্থাপনটি ব্যবহার করতে পারেন: [^\x00-\x7F]+

নন-এএসসিআইআই অপসারণ করা হচ্ছে

চরিত্রগুলি হাইলাইট করার জন্য, আমি অনুসন্ধান উইন্ডোতে চিহ্ন ফাংশনটি ব্যবহার করার পরামর্শ দিচ্ছি : এটি অ-এসসিআইআই অক্ষরকে হাইলাইট করে এবং এর মধ্যে একটিতে থাকা লাইনগুলিতে একটি বুকমার্ক রাখে

আপনি যদি এর পরিবর্তে ASCII অক্ষরগুলিকে হাইলাইট করতে এবং বুকমার্ক রাখতে চান তবে আপনি এটি করতে রেজিেক্সটি ব্যবহার করতে পারেন [\x00-\x7F]

নন-এএসসিআইআই হাইলাইট করা

চিয়ার্স


1
আপনি যদি অনুসন্ধানের এক্সপ্রেশনটি কপিপাস্ট করতে চান [^ \ x00- \ x7F] +
হাইনা

2
আপনি যদি \ r এবং \ n রাখতে চান - ক্যারেজ রিটার্ন এবং লাইনফিড অক্ষরগুলি - আপনি এই রেজেক্সটি ব্যবহার করতে পারেন: [\ x00- \ x09 \ x0B- \ x0C \ x0E- \ x1F] +
স্টিফেন উইঙ্কলার

4

নতুন লাইন রাখতে:

  1. নতুন লাইনের জন্য প্রথমে একটি চরিত্র নির্বাচন করুন ... আমি # ব্যবহার করেছি।
  2. প্রতিস্থাপন বিকল্প নির্বাচন করুন, প্রসারিত।
  3. ইনপুট \ n # এর সাথে প্রতিস্থাপন করুন
  4. সমস্ত প্রতিস্থাপন হিট

পরবর্তী:

  1. প্রতিস্থাপন বিকল্পটি নিয়মিত এক্সপ্রেশন নির্বাচন করুন।
  2. এটি ইনপুট করুন: [^ \ x20- \ x7E] +
  3. খালি সঙ্গে প্রতিস্থাপন রাখুন
  4. সমস্ত প্রতিস্থাপন হিট

এখন, প্রতিস্থাপন বিকল্পটি প্রসারিত নির্বাচন করুন এবং # টি দিয়ে প্রতিস্থাপন করুন \ n

:) এখন, আপনার একটি পরিষ্কার ASCII ফাইল আছে;)


3

আর একটি ভাল কৌশল হ'ল আপনার সম্পাদকের ইউটিএফ 8 মোডে যাওয়া যাতে আপনি প্রকৃতপক্ষে এই মজার চরিত্রগুলি দেখতে এবং সেগুলি নিজে মুছে ফেলতে পারেন।


1

অন্য উপায়...

  1. যদি আপনার কাছে ইতিমধ্যে পাঠ্য এফএক্স প্লাগইন না থাকে তবে ইনস্টল করুন
  2. টেক্সটএফএক্স মেনু বিকল্পে যান -> সমস্ত মুদ্রণযোগ্য অক্ষরগুলিকে # এ জ্যাপ করুন। এটি 3 অবৈধ চিহ্ন সহ সমস্ত অবৈধ অক্ষর প্রতিস্থাপন করবে
  3. অনুসন্ধান / প্রতিস্থাপন এ যান এবং ### সন্ধান করুন। এটি একটি স্থান দিয়ে প্রতিস্থাপন করুন।

আপনি যদি রেইজেক্সটি মনে করতে না পারেন বা এটি সন্ধান করার জন্য যত্নবান না হন তবে এটি দুর্দান্ত। তবে অন্যদের দ্বারা উল্লিখিত রেজেক্সগুলিও একটি দুর্দান্ত সমাধান।


সমস্ত অক্ষরগুলিকে জ্যাপ করা সমস্ত ধরণের বিরাম চিহ্নগুলিকে ### দিয়ে প্রতিস্থাপন করে। আমি যে সমাধানটি আশা করব তা হ'ল: "&" এর সাথে প্রতিস্থাপন করা। 'এবং' এর সাথে প্রতিস্থাপন করা ইত্যাদি।
কাশিম হোসেনেই

এটি দুর্দান্ত কাজ করে, তবে, সরঞ্জামটি মজার চরগুলিকে একটি # চরের পরিবর্তে তিনটি নয়। দয়া করে নোট নিন
রাঘব

1
পাঠ্য এফএক্স প্লাগইন হ্রাস করা হয়েছে এবং এটি আর সহজে পাওয়া যায় না। উদাহরণস্বরূপ টেক্সটএফএক্সের ভবিষ্যত দেখুন - "তালিকাটি দীর্ঘতর হয়ে গেলে, সম্প্রদায়ের ভাল পরিবেশে পরিণত হওয়া বৃদ্ধ
পিটার মর্টেনসেন
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.