আপনি কীভাবে একটি ভাল অপরিষ্কার ফিল্টার বাস্তবায়ন করবেন?

207

আমাদের মধ্যে অনেকের ব্যবহারকারীর ইনপুট, অনুসন্ধান অনুসন্ধান এবং এমন পরিস্থিতিতে পরিস্থিতি মোকাবেলা করতে হবে যেখানে ইনপুট পাঠ্যটি সম্ভাব্যরূপে অশ্লীলতা বা অযাচিত ভাষা থাকতে পারে। প্রায়শই এটিগুলি ফিল্টার করা দরকার।

বিভিন্ন ভাষা এবং উপভাষায় শপথের শব্দের একটি ভাল তালিকা কোথায় পাওয়া যাবে?

এমন কি এমন সূত্রের জন্য এমন API আছে যা ভাল তালিকাগুলি ধারণ করে? অথবা সম্ভবত এমন একটি এপিআই যা কিছু হ'ল "হ্যাঁ এটি পরিষ্কার" বা কিছু পরামিতি সহ "এটি কি এই নোংরা" নয়?

লোকদের ধরার জন্য $$, আজেজ বা এ 55 এর মতো সিস্টেমটিকে কৌতুক করার চেষ্টা করার জন্য কী কী ভাল পদ্ধতি রয়েছে?

আপনি পিএইচপি জন্য সমাধান প্রস্তাব যদি বোনাস পয়েন্ট। :)

সম্পাদনা করুন: যে উত্তরগুলির উত্তর কেবলমাত্র প্রোগ্রাম্যাটিক সমস্যা এড়িয়ে চলেছে তার প্রতিক্রিয়া:

আমি মনে করি যে এই ধরণের ফিল্টারটির জন্য একটি জায়গা রয়েছে যখন উদাহরণস্বরূপ, কোনও ব্যবহারকারী কোনও সংবেদনশীল সম্প্রদায় পুলে যুক্ত হওয়া ছবিগুলি সন্ধান করতে সর্বজনীন চিত্র অনুসন্ধান ব্যবহার করতে পারেন। যদি তারা "লিঙ্গ" অনুসন্ধান করতে পারে তবে তারা সম্ভবত হ্যাঁ এর অনেকগুলি ছবি পাবে। আমরা যদি এর চিত্রগুলি না চাই, তবে অনুসন্ধান শব্দ হিসাবে শব্দটি প্রতিরোধ করা ভাল দারোয়ান, যদিও স্বীকার করা একটি বুদ্ধিমান পদ্ধতি নয়। শব্দের তালিকা প্রথম স্থানে পাওয়াটাই আসল প্রশ্ন।

সুতরাং আমি সত্যিই একটি টোকেনটি খুঁজে বের করার কোনও উপায় উল্লেখ করছি যা নোংরা বা না এবং তারপরে কেবল এটিকে অস্বীকার করুন। আমি সম্পূর্ণ হাসিখুশি "লম্বা গলা জিরাফ" রেফারেন্সের মতো কোনও অনুভূতি রোধ করতে বিরক্ত করব না। আপনি সেখানে কিছুই করতে পারবেন না। :)

php regex user-input

— বেন থ্রুপ
সূত্র

12

এটি লজ্জার বিষয় যে সমস্ত শীর্ষ উত্তরগুলি প্রোগ্রামিং চ্যালেঞ্জ থেকে উপস্থিতি এবং পরাজয়বাদী ডাইভারশন ions মেকানিকাল তুর্কের মতো "সাইবার্গ" গণনামূলক পরিষেবাগুলি বাষ্প অর্জন করার সাথে সাথে এবং প্রায় সমস্ত সফ্টওয়্যার সামাজিক হয়ে ওঠে, লাল-পতাকার বিষয়বস্তুতে একটি তাত্পর্যপূর্ণ হওয়া এবং এটি একটি মডারেটরের নজরে আনার চেয়ে আগের চেয়ে বেশি গুরুত্বপূর্ণ!

— জেসনস্মিথ

10

ভাষার প্রসঙ্গটি সম্পর্কে বিশেষত সতর্কতা অবলম্বন করুন, বিশেষত যদি আপনি i18n করছেন। আমি একবার যে কোর্সটি দিয়েছিলাম তার জন্য একটি গুগল গ্রুপ স্থাপন করার চেষ্টা করেছি "সানাল অর্থমামা গার্সেল্লেট্রিমে" যা "ভার্চুয়াল মিডিয়ায় ভিজ্যুয়ালাইজেশন" এর জন্য তুর্কি। গুগল এটি প্রত্যাখ্যান করার জন্য যথেষ্ট বোকা ছিল কারণ শিরোনামটিতে "মলদ্বার" শব্দটি ছিল । সানাল [টিআর] = ভার্চুয়াল [এন] এবং গুগল নির্লজ্জভাবে আমাকে অবজ্ঞার জন্য অভিযুক্ত করেছে! : ডি দয়া করে অদ্ভুত জিনিসগুলি যেন এরকম না ঘটে।

— এডারগার্নার

আপনি যদি স্প্যানিশ শব্দটির জন্য সিচ করেন তবে কী হবে ? আপনি প্রকৃতপক্ষে গুগল চিত্রগুলি ফিল্টার পেতে পারেন (যদি আপনি অন্য কোনও ভাষায় স্থানীয় হয়)।

— new123456

আরেকটি পরামর্শ হ'ল এই শব্দগুলিকে নিষিদ্ধ করা নয়, তবে ব্যবহারকারীরা তাদের ব্যবহার করে যা তাদের ব্যবহার করে। যদি কোনও ব্যবহারকারী / আইপি 2, 3 এর বেশি বা আপনি যা চান তাই পান তবে সেই ব্যক্তিকে অবরুদ্ধ করুন। বোকা নয়, তবে আমি মনে করি এটি ব্লক করা এবং ইউজার / আইপি / উভয়ই বদলাতে হবে 'ভগ' এর পরিবর্তে 'ফ্লাফি হোয়াইট বানি' লেখার চেয়ে। একটি অংশ, ব্যবহারকারীরা কী শব্দ বা বাক্য ব্যবহার করতে পারবেন না তা জানেন না, তাই তারা নিষিদ্ধ হওয়ার সাথে সাথে তারা সহজেই বিভিন্ন খারাপ শব্দ অনুমান করতে পারে না।

— ফ্রান্সিসকো প্রেজেনসিয়া

1

অসচ্ছল ফিল্টারগুলি একটি খারাপ ধারণা। যে কেউ সিস্টেমটি কৌতুক করার চেষ্টা করছে ("আপনাকে বোঝাচ্ছে!") এবং বৈধভাবে সম্পূর্ণরূপে উপযুক্ত কোনও বিষয়ে কথা বলার মধ্যে পার্থক্য করা খুব কঠিন ("আমি চকোলেট ফ্যাদ পছন্দ করি।")

— ক্লিকবাইট

176

অশ্লীলতা ফিল্টার: খারাপ ধারণা, বা অবিশ্বাস্যভাবে ইন্টারকোর্সিং খারাপ ধারণা?

এছাড়াও, টুটাউনের স্পিডচ্যাটের দ্য আনটোল্ড হিস্ট্রিটি কেউ ভুলতে পারে না , যেখানে "নিরাপদ-শব্দ শ্বেত তালিকা" ব্যবহারের ফলে 14 বছর বয়সী এটির সাথে দ্রুত তাড়াহুড়ো করে: "আমি আমার লম্বা গলা জিরাফকে আপনার সাঁকো সাদা সাদা বানিটি আটকে রাখতে চাই want । "

নীচের লাইন: অবশেষে, আপনি যে কোনও সিস্টেম প্রয়োগ করেন তার জন্য মানুষের পর্যালোচনার (একেবারে পিয়ার বা অন্যথায়) বিকল্প নেই। ড্রাইভ-বাইগুলি থেকে মুক্তি পাওয়ার জন্য একটি প্রাথমিক সরঞ্জাম বাস্তবায়নের জন্য নির্দ্বিধায় মনে করুন তবে নির্ধারিত ট্রোলের জন্য আপনার অবশ্যই একেবারে একটি অ-অ্যালগোরিদম-ভিত্তিক পদ্ধতি থাকতে হবে।

একটি সিস্টেম যা নাম প্রকাশ না করে এবং জবাবদিহিতার পরিচয় দেয় (এমন কিছু যা স্ট্যাক ওভারফ্লো ভাল করে) বিশেষত জন গ্যাব্রিয়েলের জিআইএফটি মোকাবেলায় সহায়তা করার জন্য

আপনি শুরু করার জন্য আপনি কোথায় অস্পষ্টতা তালিকা পেতে পারেন তা জিজ্ঞাসা করেছিলেন - একটি ওপেন-সোর্স প্রকল্প যাচাই করার জন্য ড্যানসগার্ডিয়ান - তাদের ডিফল্ট অশ্লীল তালিকার উত্স কোডটি পরীক্ষা করে দেখুন। এছাড়াও একটি অতিরিক্ত তৃতীয় পক্ষের বাক্যাংশের তালিকা রয়েছে যা আপনি প্রক্সিটির জন্য ডাউনলোড করতে পারেন যা আপনার জন্য সহায়ক গ্রিনিং পয়েন্ট হতে পারে।

প্রতিক্রিয়া হিসাবে সম্পাদনা করুন প্রশ্ন সম্পাদনা: আপনি যা করার চেষ্টা করছেন তার স্পষ্টতার জন্য ধন্যবাদ। সেক্ষেত্রে, আপনি যদি কেবল একটি সাধারণ শব্দের ফিল্টার করার চেষ্টা করছেন তবে দুটি উপায় রয়েছে যা আপনি এটি করতে পারেন। একটি হ'ল আপনি সেন্সর করতে চান এমন সমস্ত নিষিদ্ধ বাক্যাংশের সাথে একটি দীর্ঘ লম্বা রেজিএক্সএক্স তৈরি করা এবং এটির সাথে কেবল একটি রেজেক্স সন্ধান / প্রতিস্থাপন করুন। একটি রেজেক্সের মতো:

$filterRegex = "(boogers|snot|poop|shucks|argh)"

এবং এটি আপনার ইনপুট স্ট্রিংটিতে প্রিগ_ম্যাচ () ব্যবহার করে হিটের জন্য পাইকারি পরীক্ষার জন্য চালনা করুন ,

বা এগুলিকে ফাঁকা করার জন্য preg_replace () ।

আপনি এই ফাংশনগুলিকে একক লম্বা রেগেক্সের চেয়ে অ্যারে দিয়েও লোড করতে পারেন এবং দীর্ঘ শব্দ তালিকার জন্য এটি আরও পরিচালনাযোগ্য হতে পারে। অ্যারেগুলি কীভাবে নমনীয়ভাবে ব্যবহার করা যায় সে সম্পর্কে কয়েকটি ভাল উদাহরণের জন্য প্রিগ_রেপ্লেস () দেখুন ।

অতিরিক্ত পিএইচপি প্রোগ্রামিং উদাহরণগুলির জন্য, শব্দটি ফিল্টারিংয়ের জন্য কিছুটা উন্নত জেনেরিক শ্রেণীর জন্য এই পৃষ্ঠাটি দেখুন যা সেন্সরযুক্ত শব্দের মধ্যবর্তী কেন্দ্রের চিঠিগুলি * এবং এই পূর্ববর্তী স্ট্যাক ওভারফ্লো প্রশ্নটিতে পিএইচপি উদাহরণ রয়েছে (সেখানে মূল মূল্যবান অংশটি রয়েছে) এসকিউএল-ভিত্তিক ফিল্টার করা শব্দের পদ্ধতির পদ্ধতি - যদি আপনি এটি অপ্রয়োজনীয় মনে করেন তবে লেট স্পোক ক্ষতিপূরণকারীকে সরবরাহ করা যেতে পারে)।

আপনি আরও যোগ করেছেন: " শব্দের তালিকা প্রথম স্থানে পাওয়াটাই আসল প্রশ্ন " "- পূর্ববর্তী কিছু দানসাগারডিয়ান লিঙ্কের পাশাপাশি, আপনি 458 শব্দের এই সহজ জীপটি সহায়ক হতে পারেন।

— হ্যানক্লিন্টো
সূত্র

@ জেপিএলমে: হ্যাঁ এটি করা উচিত - এর পরে আমার [এসআইসি] যোগ করা উচিত ছিল, যেহেতু এটউড এটি বানান করেছিল। :)

— হ্যানক্লিন্টো

"ক্লাব পেঙ্গুইন" প্রতিদিন তাদের অশ্লীল ফিল্টারে শত শত এন্ট্রি যুক্ত করে : raphkoster.com/2008/05/09/…

— ফ্র্যাঙ্ক ফার্মার

6

আপনার রেজেক্স বিকল্পগুলির চারপাশে একটি শব্দ সীমানা মোড়ক ক্লাবুটিক ভুলকে আটকাতে পারে

— সিজেকে

@ কেক: কেবলমাত্র যদি আপনি বানান ভুল বানান "এফ * সি কেকেক্ক ইও এসসস" ছাঁটাই করতে সক্ষম হন তবে আপনি চিন্তিত নন :) আমি নিশ্চিত নই যে আমার ট্রোলগুলিতে খুব সুনির্দিষ্ট বানান আছে বলে আমি বিশ্বাস করি।

— হ্যানক্লিন্টো

1

প্রবাদকৃত ঘোড়ার মুখ থেকে যদি আপনি "ফ্লফি হোয়াইট বানি" গল্পটি শুনতে চান তবে এটি এখনই একটি পডকাস্ট পর্ব: সোশ্যালমিডিয়াক্যালিটি.টাম্বলআর

— এফ র্যান্ডাল ফার্মার

44

আমি জানি যে এই প্রশ্নটি বেশ পুরানো, তবে এটি একটি সাধারণভাবে দেখা প্রশ্ন ...

অশ্লীল ফিল্টারগুলির জন্য একটি কারণ এবং পৃথক প্রয়োজন উভয়ই রয়েছে ( উইকিপিডিয়ায় এন্ট্রি দেখুন এখানে ), তবে তারা খুব স্বতন্ত্র কারণে প্রায়শই 100% নির্ভুল হতে কম হন; প্রসঙ্গ এবং নির্ভুলতা ।

এটি আপনি কী অর্জন করার চেষ্টা করছেন তার উপর (সম্পূর্ণ) নির্ভর করে - এটি সর্বাধিক মৌলিক, আপনি সম্ভবত " সাতটি নোংরা শব্দ " এবং তারপরে কিছু আবরণ করার চেষ্টা করছেন ... কিছু ব্যবসায়ের সবচেয়ে বেশি অবজ্ঞার ফিল্টার করা দরকার: মৌলিক শপথ শব্দের, ইউআরএল বা এমনকি ব্যক্তিগত তথ্য এবং এই জাতীয়, কিন্তু অন্যদের অবৈধ অ্যাকাউন্ট নামকরণ (এক্সবক্স লাইভ একটি উদাহরণ) বা আরও অনেক কিছু ...

ব্যবহারকারীর উত্পন্ন সামগ্রীতে কেবল সম্ভাব্য শপথের শব্দ নেই, এতে আপত্তিজনক উল্লেখগুলিও থাকতে পারে:

যৌন ক্রিয়াকলাপ
যৌন দৃষ্টিভঙ্গি
ধর্ম
জাতিতত্ত্ব
ইত্যাদি ...

এবং সম্ভাব্য, একাধিক ভাষায়। শাটারস্টক আজ অবধি 10 টি ভাষায় মৌলিক নোংরা শব্দের তালিকা তৈরি করেছে , তবে এটি এখনও বেসিক এবং তাদের 'ট্যাগিং' প্রয়োজনের দিকে লক্ষ্য করে। ওয়েবে আরও কয়েকটি তালিকা উপলব্ধ।

আমি গৃহীত উত্তর যে এটি একটি সংজ্ঞায়িত বিজ্ঞান নয় সঙ্গে আপনি কি একমত এবং যেমন ভাষা একটি ক্রমাগত পরিবর্তিত হয়ে চলেছে চ্যালেঞ্জ কিন্তু এক যেখানে একটি 90% ধরা হার 0% বেশী ভালো। এটি নিখুঁতভাবে আপনার লক্ষ্যগুলির উপর নির্ভর করে - আপনি কী অর্জন করতে চাইছেন, আপনার যে স্তরের সমর্থন রয়েছে এবং বিভিন্ন ধরণের অপবিত্রতা অপসারণ করা কতটা গুরুত্বপূর্ণ।

ফিল্টার তৈরির ক্ষেত্রে আপনাকে নিম্নলিখিত উপাদানগুলি এবং সেগুলি কীভাবে আপনার প্রকল্পের সাথে সম্পর্কিত তা বিবেচনা করা উচিত:

শব্দ / বাক্যাংশ
সংক্ষিপ্ত বিবরণ (FOAD / LMFAO ইত্যাদি)
মিথ্যা ধনাত্মক (শব্দ, স্থান এবং 'মিশিত', 'সান্টহর্পে' এবং 'মাইসওয়ার্থ' এর নাম)
ইউআরএল (পর্ন সাইটগুলি একটি সুস্পষ্ট লক্ষ্য)
ব্যক্তিগত তথ্য (ইমেল, ঠিকানা, ফোন ইত্যাদি - প্রযোজ্য ক্ষেত্রে)
ভাষার পছন্দ (সাধারণত ডিফল্ট অনুসারে ইংরেজি)
সংযমীকরণ (কীভাবে, যদি হয় তবে আপনি ব্যবহারকারীর উত্পন্ন সামগ্রীর সাথে ইন্টারঅ্যাক্ট করতে পারেন এবং এটি দিয়ে আপনি কী করতে পারেন)

আপনি সহজেই একটি অসতর্কতা ফিল্টার তৈরি করতে পারেন যা 90% + টি অবমাননাকে ক্যাপচার করে তবে আপনি কখনও 100% মারবেন না। এটা ঠিক সম্ভব নয়। আপনি যত কাছাকাছি 100% এ যেতে চান, তত কঠিন হয়ে ওঠে ... অতীতে একটি জটিল অবজ্ঞার ইঞ্জিন তৈরি করা যা প্রতিদিন 500K এরও বেশি রিয়েলটাইম বার্তাগুলি নিয়ে কাজ করে, আমি নিম্নলিখিত পরামর্শটি উপস্থাপন করব:

একটি বেসিক ফিল্টার জড়িত:

প্রযোজ্য অপবিত্রগুলির একটি তালিকা তৈরি করা
অপব্যবহারের উপকরণগুলি নিয়ে কাজ করার একটি পদ্ধতি বিকাশ করা

একটি মাঝারি জটিল ফাইলার অন্তর্ভুক্ত হবে, (একটি বেসিক ফিল্টার ছাড়াও):

বর্ধিত ডেরাইভেশনগুলি মোকাবেলা করতে জটিল প্যাটার্ন মেলানো ব্যবহার করা (উন্নত রেজেক্স ব্যবহার করে)
লীটস্পেকের সাথে ডিলিং (l33t)
সঙ্গে লেনদেন মিথ্যা positives

একটি জটিল ফিল্টার নিম্নলিখিত সংখ্যক জড়িত (একটি মাঝারি ফিল্টার ছাড়াও):

হোয়াইটলিস্ট এবং ব্ল্যাকলিস্ট
বাক্যাংশ / পদগুলির নিখুঁত বেয়েসিয়ান অনুমান ফিল্টারিং
সাউন্ডেক্স ফাংশন (যেখানে কোনও শব্দ অন্যটির মতো শোনাচ্ছে)
লেভেনস্টেইনের দূরত্ব
গৌন
একজন ফিল্টারিং ইঞ্জিনকে উদাহরণস্বরূপ শিখতে বা যেখানে ম্যাচগুলি গাইডেন্স ছাড়াই যথেষ্ট সঠিক নয় (একটি স্ব / ক্রমাগত উন্নতি ব্যবস্থা)
সম্ভবত এআই ইঞ্জিনের কিছু ফর্ম

— nickhar
সূত্র

28

আমি এর জন্য কোনও ভাল গ্রন্থাগার সম্পর্কে জানি না, তবে আপনি যা-ই করুন না কেন, নিশ্চিত করে নিন যে আপনি জিনিসগুলি প্রবেশের দিক দিয়েই ভুল করেছেন। আমি এমন সিস্টেমগুলি নিয়ে কাজ করেছি যেগুলি আমাকে "এমপাসেল" ব্যবহারকারীর নাম হিসাবে ব্যবহার করতে দেয় না, কারণ এতে "অ্যাস" একটি স্ট্রিং হিসাবে রয়েছে। এটি ব্যবহারকারীদের বিভক্ত করার একটি দুর্দান্ত উপায়!

— ম্যাট পাসেল
সূত্র

17

বা উড়ন্ত স্পেসশিপস গেমটিতে "ককপিট" বারণ করা

— শিনহান

24

আমার একটি কাজের সাক্ষাত্কারের সময়, সিটিও যে আমার সাথে সাক্ষাত্কার নিয়েছিল তারা জাভাতে লেখা একটি শব্দ / ওয়েব গেমটি চেষ্টা করে। পুরো অক্সফোর্ড ইংরেজি অভিধানের একটি শব্দের তালিকার মধ্যে, অনুমান করা প্রথম শব্দটি কী ছিল?

অবশ্যই, ইংরাজী ভাষায় সবচেয়ে বাজে শব্দ।

একরকম, আমি এখনও কাজের অফার পেয়েছি, তবে আমি তখন একটি অসতর্কতা শব্দের তালিকাটি সন্ধান করেছি (এটির মতো নয়) ) এবং সমস্ত বাজে শব্দ ছাড়াই একটি নতুন অভিধান তৈরি করার জন্য একটি দ্রুত স্ক্রিপ্ট লিখেছিলাম (এমনকি তালিকার দিকে নজর না দিয়ে) ।

আপনার বিশেষ ক্ষেত্রে, আমি মনে করি অনুসন্ধানটিকে সত্য শব্দের সাথে তুলনা করা শব্দের তালিকার সাথে শোনার উপায়ের মতো শোনাচ্ছে। বিকল্প শৈলী / বিরামচিহ্নগুলিকে আরও কিছুটা কাজের প্রয়োজন, তবে আমি সন্দেহ করি যে ব্যবহারকারীরা একটি সমস্যা হিসাবে যথেষ্ট পরিমাণে এটি ব্যবহার করবেন।

— ম্যাথু
সূত্র

8

বিষয় বন্ধ, কিন্তু সবচেয়ে বাজে শব্দটি কী? আমি সর্বদা এটি সি শব্দ বা এন শব্দ হিসাবে বিবেচনা করেছি, তবে আমি ধরে নিয়েছি যে লোকেরা চ শব্দটি মনে করে

— জেফ

2

"আমি সন্দেহ করি যে ব্যবহারকারীরা একটি সমস্যা হিসাবে এটি প্রায়শই যথেষ্ট ব্যবহার করবেন" আশা করি বেঁচে থাকুন। ব্যবহারকারীরা একবার ফিল্টারটিতে হোঁচট খেয়ে গেলে তারা সাবধানতার উপায়গুলি সন্ধানের জন্য কাজ করবে। এটি অক্ষরের সাথে সংখ্যাসূচক স্থানগুলির স্থান নির্ধারণ ইত্যাদির পরিবর্তে সহজ হতে পারে)।

— ব্রায়ানএইচ

21

প্রোগ্রামারটি ককসুর হয়ে থাকলেও এবং সমস্ত নগ্ন বিকাশকে অব্যাহত রাখে এমনকী, অপছন্দ ফিল্টারিং সিস্টেমটি কখনই নিখুঁত হতে পারে না

যেটি বলেছিল যে, 'দুষ্টু শব্দগুলির কোনও তালিকা সম্ভবত অন্য যে কোনও তালিকার পাশাপাশি সম্পাদন করতে পারে, কারণ অন্তর্নিহিত সমস্যাটি ভাষা বোঝা যা বর্তমান প্রযুক্তির সাথে অনেকটাই অক্ষম

সুতরাং, একমাত্র ব্যবহারিক সমাধান হ'ল দ্বিগুণ:

আপনার অভিধানটি ঘন ঘন আপডেট করার জন্য প্রস্তুত থাকুন
মিথ্যা ধনাত্মক (যেমন "ক্লাসিক" এর পরিবর্তে "ক্লাবুটিক") এবং মিথ্যা নেতিবাচক (উফ! মিস হওয়া এক!) সংশোধন করার জন্য একজন মানব সম্পাদক নিয়োগ করুন

— স্টিভেন এ লো
সূত্র

1

দু'পাশে ফাঁকা জায়গায় শব্দটি শনাক্ত করুন, পুরো স্টপ পরে, না?

— ডেভিড ডি

1

H3ll কোনও মানুষ নয়, এটি কেবলমাত্র মামলার সবচেয়ে ক্ষুদ্রের জন্য কাজ করে; আমরা এখানে মানুষের সাথে ডিল করছি, এবং তারা বেশ চালাক :)

— স্টিভেন এ। লো

14

আপত্তিজনক ব্যবহারকারীর ইনপুট প্রতিরোধের একমাত্র উপায় হ'ল সমস্ত ব্যবহারকারীর ইনপুট প্রতিরোধ করা।

যদি আপনি ব্যবহারকারীর ইনপুটকে মঞ্জুরি দেওয়ার জন্য জোর দিয়ে থাকেন এবং সংযম প্রয়োজন তবে মানব মডারেটর অন্তর্ভুক্ত করুন।

— অ্যাক্সেল
সূত্র

13

কটাক্ষপাত আছে CDYNE এর অপবিত্রতা ফিল্টার ওয়েব পরিষেবা

URL পরীক্ষা করছে

— টিম কাভানহো
সূত্র

13

দুর্দান্ত .. তবে এটি গ্রহণ করা যায় নি (।) (।)

— জেসন জং

2

সাবধান হন। CDYNE আর এই পণ্যটি বজায় রাখে না। আপনি এটি নিজের ঝুঁকিতে ব্যবহার করতে পারেন।

— শাড়ি রাহাল

7

আপনার "কৌতুক সিস্টেমটি" সাবক্রিপশন সম্পর্কিত, আপনি নিজের অনুসন্ধানের আগে "খারাপ শব্দ" তালিকা এবং ব্যবহারকারী-প্রবেশ করা পাঠ্য উভয়কেই স্বাভাবিক করে সেটি পরিচালনা করতে পারেন। উদাহরণস্বরূপ, রেগেক্সেসের একটি সিরিজ ব্যবহার করুন (বা [জেড $ 5] কে "এস", [4 @] তে রূপান্তর করতে পিএইচপি থাকলে এটি টিআর ) ব্যবহার করুন , তবে সাধারণকরণের তুলনায় স্বাভাবিক "খারাপ শব্দ" তালিকার তুলনা করুন পাঠ্য। নোট করুন যে স্বাভাবিককরণটি সম্ভবত অতিরিক্ত মিথ্যা ধনাত্মক দিকে পরিচালিত করতে পারে, যদিও আমি এই মুহুর্তে কোনও আসল কেস সম্পর্কে ভাবতে পারি না।

বৃহত্তর চ্যালেঞ্জ হ'ল এমন কিছু নিয়ে আসা যা লোককে " কলমটি হল The তরবারির চেয়েও শক্তিশালী করার সময় "পেনি এস" কে ব্লক করে দেয়।

— ডেভ শেরোহমান
সূত্র

14

বিশেষজ্ঞ-এক্সচেঞ্জ.কম এবং পেন-আইসল্যান্ড ডটকমকে ভুলে যাবেন না; এই সাইটের url গুলিতে একবার হাইফেন থাকে না।

— ব্রায়ানএইচ

7

স্থানীয়করণ সম্পর্কিত বিষয়গুলি থেকে সাবধান থাকুন: একটি ভাষায় একটি শপথের শব্দটি অন্য ভাষায় একেবারে সাধারণ শব্দ হতে পারে।

এর একটি বর্তমান উদাহরণ: ইবে প্রতিক্রিয়া থেকে "খারাপ শব্দ" ফিল্টার করতে একটি অভিধান পদ্ধতির ব্যবহার করে। যদি আপনি "এটি একটি নিখুঁত লেনদেন" ("ডাস ওয়ার ইনে পারফেক্ট ট্রান্সএকশন") এর জার্মান অনুবাদ প্রবেশ করার চেষ্টা করেন, তবে খারাপ কথার কারণে ইবে প্রতিক্রিয়া প্রত্যাখ্যান করবে।

কেন? কারণ "এর" জন্য জার্মান শব্দটি হ'ল "যুদ্ধ", এবং "যুদ্ধ" "খারাপ শব্দ" এর ইবে অভিধানে রয়েছে।

তাই স্থানীয়করণ সম্পর্কিত বিষয়ে সাবধান থাকুন।

— স্যাম
সূত্র

6

আপনি যদি ডিজি / স্ট্যাকওভারফ্লো এর মতো এমন কিছু করতে পারেন যেখানে ব্যবহারকারীরা অশ্লীল সামগ্রীকে কমিয়ে ফেলতে / চিহ্নিত করতে পারে ... তাই করুন।

তারপরে আপনাকে যা করতে হবে তা হ'ল "দুষ্টু" ব্যবহারকারীদের পর্যালোচনা করা এবং যদি তারা নিয়মগুলি ভঙ্গ করে তবে এগুলি ব্লক করুন।

— scunliffe
সূত্র

4

আমি পার্টিতে কিছুটা দেরি করেছি, তবে আমার কাছে একটি সমাধান রয়েছে যা এটি পড়তে পারে এমন কিছু ব্যক্তির পক্ষে কাজ করতে পারে। এটি পিএইচপি এর পরিবর্তে জাভাস্ক্রিপ্টে রয়েছে তবে এর একটি বৈধ কারণ রয়েছে।

সম্পূর্ণ প্রকাশ, আমি এই প্লাগইনটি লিখেছি ...

যাইহোক।

আমি যে পদ্ধতির সাথে চলেছি তা হ'ল কোনও ব্যবহারকারীকে তাদের অপব্যয় ফিল্টারিংয়ের জন্য "অপ্ট-ইন" করার অনুমতি দেওয়া। মূলত অবজ্ঞাকে ডিফল্টরূপে অনুমতি দেওয়া হবে তবে আমার ব্যবহারকারীরা যদি এটি পড়তে না চান তবে তাদের দরকার নেই। এটি "l33t sp3 @ k" ইস্যুতে সহায়তা করে।

ধারণাটি একটি সাধারণ jQueryযদি ক্লায়েন্টের অ্যাকাউন্টটি অস্পষ্টতা ফিল্টারিং সক্ষম করে তবে সার্ভার দ্বারা ইনজেকশন পাওয়া প্লাগইন। সেখান থেকে, এটি কেবল কয়েকটি সহজ লাইন যা শপথ করে bl

এখানে ডেমো পৃষ্ঠাটি
https://chaseflorell.github.io/jQuery.ProfanityFilter/demo/

<div id="foo">
    ass will fail but password will not
</div>

<script>
    // code:
    $('#foo').profanityFilter({
        customSwears: ['ass']
    });
</script>

ফলাফল

*** ব্যর্থ হবে তবে পাসওয়ার্ডটি হবে না

— চেজ ফ্লোরেল
সূত্র

এই উত্তরটি সহ একটি jsFizz ওয়ার্কিং ডেমো রয়েছে ।

— চেজ ফ্লোরেল

খুব নির্বোধ। ফিল্টার হয়নিa$$

— উইঙ্গার সেন্ডন

3

@ এমপায়ারআইমন এটি l33t স্পিকার ফিল্টার করার উদ্দেশ্যে কখনও ছিল না । আমি ফিল্টার করার চেষ্টা করার পরামর্শ দিচ্ছি না, কারণ এটি হেরে যাওয়া লড়াই। যে অশ্লীল ফিল্টারটি আমি পোস্ট করেছি তা "নির্মিত হয়েছে যাতে ব্যবহারকারীরা" অপ্ট-ইন "টি অপছন্দ ফিল্টারিং করতে দেয়"। এর অর্থ এটি কোনও সাইটে সর্বোত্তম ব্যবহার করা হয়েছে যা ডিফল্টরূপে অবজ্ঞার অনুমতি দেয়। আপনি যদি ফিল্টার করতে চান a$$তবে আপনি এটি ফিল্টার তালিকায় যুক্ত করুন।

— চেজ ফ্লোরেল

4

আমি 12 টি ভাষায় 2200 খারাপ শব্দ সংগ্রহ করেছি: এন, আর, সিএস, দা, দে, ইও, এস, ফা, ফাই, ফ্রি, হাই, হু, এটি, জা, কো, এনএল, না, পিএল, পিটি, রু, এসভি , th, tlh, tr, zh

মাইএসকিউএল ডাম্প, জেএসএন, এক্সএমএল বা সিএসভি বিকল্প উপলব্ধ।

https://github.com/turalus/openDB

আমি আপনাকে পরামর্শ দিচ্ছি যে এই এসকিউএলটি আপনার ডিবিতে চালিত করুন এবং ব্যবহারকারী যখন কিছু ইনপুট করেন তখন প্রতিবার তা পরীক্ষা করুন।

— তুরাল আলী
সূত্র

2

না। এটি কেবল সমস্যার দিকে পরিচালিত করে। অশ্লীল ফিল্টারগুলির সাথে আমার এক ক্লাবুটিক ব্যক্তিগত অভিজ্ঞতা হল সেই সময়টি যেখানে আমি একটি আইআরসি চ্যানেল থেকে লাথি / নিষিদ্ধ ছিলাম যে উল্লেখ করার জন্য যে আমি "কয়েক ঘন্টা ধরে ব্রিজের উপর থেকে হ্যানককের দিকে যাচ্ছিলাম" বা তার প্রভাবের কিছু ছিল।

— অ্যাডাম জ্যাসকিউইচ
সূত্র

2

এই আলোচনায় আমি হ্যানক্লিন্টোর পোস্টকে উচ্চতর করে সম্মত। স্ট্রিং-ম্যাচ ইনপুট পাঠ্যের জন্য আমি নিয়মিত এক্সপ্রেশন ব্যবহার করি। এবং এটি একটি নিরর্থক প্রচেষ্টা, যেমন আপনি ইতিমধ্যে উল্লেখ করেছেন যে আপনার নিজের "অবরুদ্ধ" তালিকায় নেটটিতে জনপ্রিয় লেখার প্রতিটি কৌশল রূপের জন্য আপনার স্পষ্টভাবে অ্যাকাউন্টে থাকতে হবে।

অন্যদিকে সেন্সরশিপের নীতি নিয়ে বিতর্ক চলাকালীন, আমি অবশ্যই একমত হতে পারি যে ওয়েবে কিছু ফর্ম প্রয়োজনীয়। কিছু লোক কেবল অশ্লীলতা পোস্ট করা উপভোগ করে কারণ এটি তাত্ক্ষণিকভাবে একটি বিশাল মানুষের পক্ষে আপত্তিজনক হতে পারে এবং লেখকের পক্ষে একেবারেই কোনও চিন্তাভাবনা প্রয়োজন।

ধারণাগুলি জন্য আপনাকে ধন্যবাদ।

হ্যানক্লিন্টোর নিয়ম!

2

আপনি ফিল্টার করতে চান এমন কিছু খারাপ শব্দের একটি ভাল এমওয়াইএসকিউএল টেবিল পরে (আমি এই থ্রেডের একটি লিঙ্ক দিয়ে শুরু করেছি), আপনি এরকম কিছু করতে পারেন:

$errors = array();  //Initialize error array (I use this with all my PHP form validations)

$SCREENNAME = mysql_real_escape_string($_POST['SCREENNAME']); //Escape the input data to prevent SQL injection when you query the profanity table.

$ProfanityCheckString = strtoupper($SCREENNAME); //Make the input string uppercase (so that 'BaDwOrD' is the same as 'BADWORD').  All your values in the profanity table will need to be UPPERCASE for this to work.

$ProfanityCheckString = preg_replace('/[_-]/','',$ProfanityCheckString); //I allow alphanumeric, underscores, and dashes...nothing else (I control this with PHP form validation).  Pull out non-alphanumeric characters so 'B-A-D-W-O-R-D' shows up as 'BADWORD'.

$ProfanityCheckString = preg_replace('/1/','I',$ProfanityCheckString); //Replace common numeric representations of letters so '84DW0RD' shows up as 'BADWORD'.

$ProfanityCheckString = preg_replace('/3/','E',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/4/','A',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/5/','S',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/6/','G',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/7/','T',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/8/','B',$ProfanityCheckString);

$ProfanityCheckString = preg_replace('/0/','O',$ProfanityCheckString); //Replace ZERO's with O's (Capital letter o's).

$ProfanityCheckString = preg_replace('/Z/','S',$ProfanityCheckString); //Replace Z's with S's, another common substitution.  Make sure you replace Z's with S's in your profanity database for this to work properly.  Same with all the numbers too--having S3X7 in your database won't work, since this code would render that string as 'SEXY'.  The profanity table should have the "rendered" version of the bad words.

$CheckProfanity = mysql_query("SELECT * FROM DATABASE.TABLE p WHERE p.WORD = '".$ProfanityCheckString."'");
if(mysql_num_rows($CheckProfanity) > 0) {$errors[] = 'Please select another Screen Name.';} //Check your profanity table for the scrubbed input.  You could get real crazy using LIKE and wildcards, but I only want a simple profanity filter.

if (count($errors) > 0) {foreach($errors as $error) {$errorString .= "<span class='PHPError'>$error</span><br /><br />";} echo $errorString;} //Echo any PHP errors that come out of the validation, including any profanity flagging.


//You can also use these lines to troubleshoot.
//echo $ProfanityCheckString;
//echo "<br />";
//echo mysql_error();
//echo "<br />";

আমি নিশ্চিত যে এই সমস্ত প্রতিস্থাপনের জন্য আরও কার্যকর উপায় আছে তবে আমি এটি নির্ধারণের জন্য যথেষ্ট স্মার্ট নই (এবং এটি অদক্ষভাবে হলেও ঠিকঠাকভাবে কাজ করে বলে মনে হচ্ছে)।

আমি বিশ্বাস করি যে আপনার ব্যবহারকারীদের নিবন্ধন করার অনুমতি দেওয়ার দিক থেকে ভুল হওয়া উচিত, এবং প্রয়োজন অনুসারে আপনার ফিল্টার করার জন্য এবং আপনার অশ্লীল টেবিলটিতে মানব ব্যবহার করা উচিত। যদিও এটি সবগুলি মিথ্যা ধনাত্মক (ভাল শব্দটিকে খারাপ হিসাবে চিহ্নিত করা হয়) বনাম একটি মিথ্যা নেতিবাচক (খারাপ শব্দটি পেয়ে যায়) এর উপর নির্ভর করে। এটি শেষ পর্যন্ত আপনার ফিল্টারিং কৌশলটিতে কতটা আগ্রাসী বা রক্ষণশীল govern

আপনি ওয়াইল্ডকার্ড ব্যবহার করতে চাইলে আমিও খুব সতর্কতা অবলম্বন করব, যেহেতু তারা কখনও কখনও আপনার ইচ্ছার চেয়ে আরও বেশি আচরণ করতে পারে।

— অ্যান্ড্রু
সূত্র

1

সত্যই, আমি তাদের "কৌশলটি" পদ্ধতিটি শব্দটি বের করে দিয়েছিলাম এবং তার পরিবর্তে সেগুলি নিষিদ্ধ করতাম, যা কেবল আমারই। তবে এটি প্রোগ্রামিংকে আরও সহজ করে তোলে।

আমি যা করব তা হ'ল একটি রেজেক্স ফিল্টার বাস্তবায়ন করা: /[\s]dooby (doo?)[\s]/iবা এটি শব্দটি অন্যের উপরে উপস্থাপিত হয় /[\s]doob(er|ed|est)[\s]/,। এগুলি এস্যুইয়েডের মতো ফিল্টারিং শব্দগুলিকে আটকাতে পারে, যা পুরোপুরি বৈধ, তবে অন্যান্য রূপগুলির জ্ঞানও প্রয়োজন এবং যদি আপনি একটি নতুন শব্দ শিখেন তবে প্রকৃত ফিল্টারটি আপডেট করতে হবে। অবশ্যই এগুলি সমস্ত উদাহরণ, তবে কীভাবে আপনি এটি করবেন তা আপনাকে সিদ্ধান্ত নিতে হবে।

আমি আমার জানা সমস্ত শব্দগুলি টাইপ করতে যাচ্ছি না, যখন আমি আসলে সেগুলি জানতে চাই না not

— রবার্ট কে
সূত্র

1

আমি বিষয়টির নিরর্থকতার সাথে একমত, তবে আপনার যদি ফিল্টার রাখতে হয় তবে নিং বক্সউড দেখুন :

টেক্সটের টুকরোয় একাধিক শব্দের দ্রুত প্রতিস্থাপনের জন্য বক্সউড একটি পিএইচপি এক্সটেনশন। এটি কেস-সংবেদনশীল এবং কেস-সংবেদনশীল মিলটিকে সমর্থন করে। এটিতে যে পাঠ্যটি পরিচালনা করা হয় তা ইউটিএফ -8 হিসাবে এনকোড হওয়া দরকার।

আরও বিস্তারিত জানার জন্য এই ব্লগ পোস্টটি দেখুন:

পিএইচপি-তে দ্রুত একাধিক স্ট্রিং প্রতিস্থাপন

বক্সউডের সাহায্যে আপনার অনুসন্ধানের পদগুলির তালিকাটি আপনার পছন্দ মতো দীর্ঘ হতে পারে - সন্ধান এবং প্রতিস্থাপন অ্যালগরিদমটি শব্দের তালিকার তালিকার আরও শব্দের সাথে ধীর হয় না। এটি সমস্ত অনুসন্ধানের পদগুলির একটি ট্রাই তৈরি করে এবং তারপরে ট্রাইয়ের উপাদানগুলি নীচে রেখে আপনার পাঠ্যের অক্ষরের সাথে তুলনা করে কেবল একবার আপনার বিষয় পাঠ্যটি স্ক্যান করে। এটি ইউএস-এএসসিআইআই এবং ইউটিএফ -8 সমর্থন করে, কেস-সংবেদনশীল বা সংবেদনশীল মিল নেই এবং এতে কিছু ইংরাজিক কেন্দ্রিক শব্দ সীমানা যাচাইয়ের যুক্তি রয়েছে।

— গর্ডন
সূত্র

1

আমি উপসংহারে পৌঁছেছি, একটি ভাল অশ্লীল ফিল্টার তৈরি করতে আমাদের 3 টি প্রধান উপাদান প্রয়োজন, বা কমপক্ষে এটি আমি যা করতে যাচ্ছি। এগুলি হ'ল:

ফিল্টার: একটি ব্যাকগ্রাউন্ড পরিষেবা যা একটি কালো তালিকাভুক্ত, অভিধান বা এর মতো কোনও কিছুর বিরুদ্ধে যাচাই করে।
বেনামি অ্যাকাউন্টের অনুমতি দেবেন না
অপব্যবহার রিপোর্ট করুন

একটি বোনাস, যারা সঠিক আপত্তিজনক সাংবাদিকদের সাথে অবদান রাখবে এবং অপরাধীকে শাস্তি দেবে, যেমন তাদের অ্যাকাউন্ট স্থগিত করা some

— Jaider
সূত্র

1

খেলায় দেরি হলেও কিছু গবেষণা করে এখানে হোঁচট খেয়েছে। যেমনটি অন্যরা উল্লেখ করেছেন, এটি স্বয়ংক্রিয়ভাবে চালিত হলে এটি প্রায় অসম্ভবের কাছাকাছি, তবে যদি আপনার নকশা / প্রয়োজনীয়তা কিছু ক্ষেত্রে জড়িত হতে পারে (তবে সমস্ত সময় নয়) এটি অবজ্ঞাপূর্ণ কিনা তা পর্যালোচনা করার জন্য মানুষের মিথস্ক্রিয়াটি আপনি এমএল বিবেচনা করতে পারেন। https://docs.microsoft.com/en-us/azure/cognitive-services/content-moderator/text-moderation-api#profanity একাধিক কারণে এখনই আমার বর্তমান পছন্দ:

অনেক স্থানীয়করণ সমর্থন করে
তারা ডাটাবেস আপডেট করে চলেছে, সুতরাং আমাকে সর্বশেষতম স্ল্যাং বা ভাষা (রক্ষণাবেক্ষণের সমস্যা) বজায় রাখতে হবে না
যখন উচ্চ সম্ভাবনা থাকে (অর্থাত্ 90% বা তার বেশি) আপনি কেবল এটি ব্যবহারিকভাবে অস্বীকার করতে পারেন
আপনি এমন বিভাগের জন্য পর্যবেক্ষণ করতে পারেন যার ফলে এমন পতাকা তৈরি হয়েছে যা অশ্লীল হতে পারে বা নাও হতে পারে এবং কেউ এটির জন্য এটি পর্যালোচনা করতে পারেন যে এটি অশুদ্ধ বা না isn't

আমার প্রয়োজনের জন্য, এটি জন-বান্ধব বাণিজ্যিক পরিষেবা (ঠিক আছে, ভিডিওগেমস) এর উপর ভিত্তি করে ছিল / যা অন্য ব্যবহারকারীরা / ব্যবহারকারীর নামটি দেখতে পাবে, তবে ডিজাইনের প্রয়োজন হয় যে আপত্তিকর ব্যবহারকারীর নামটি প্রত্যাখ্যান করার জন্য এটি অসতর্কতা ফিল্টারটি দিয়ে যেতে হবে। এ সম্পর্কে দুঃখজনক বিষয়টি ক্লাসিক "ক্লাবুটিক" ইস্যুটি সম্ভবত ঘটবে কারণ ব্যবহারকারী নামগুলি সাধারণত একাধিক শব্দের একক শব্দ (এন অক্ষর পর্যন্ত) থাকে ... আবার, মাইক্রোসফ্টের জ্ঞানীয় পরিষেবাটি "সহায়ক "টিকে পাঠ্য হিসাবে চিহ্নিত করবে না। HasProfanity = সত্য তবে সম্ভাব্যতা বেশি হওয়ার সম্ভাব্য শ্রেণীর মধ্যে একটিটিকে পতাকাঙ্কিত করতে পারে।

ওপি যেমন জিজ্ঞাসা করেছে, "এ $$" সম্পর্কে কী হবে, আমি যখন এটি ফিল্টারটি দিয়েছিলাম তখন এখানে একটি ফলাফল রয়েছে: যেমন আপনি দেখতে পাচ্ছেন এটি নির্ধারিত করেছে যে এটি অপবিত্র নয়, তবে এটির উচ্চ সম্ভাবনা রয়েছে তাই সুপারিশ হিসাবে পতাকা রয়েছে পর্যালোচনা (মানুষের মিথস্ক্রিয়া)।

যখন সম্ভাবনা বেশি থাকে, আমি ফিরে যেতে পারি "আমি দুঃখিত, সে নামটি ইতিমধ্যে নেওয়া হয়েছে" (এমনকি এটি না হলেও) যাতে এটি সেন্সরবিরোধী ব্যক্তি বা কোনও কিছুর প্রতি কম আপত্তিজনক হয়, যদি আমরা না চান মানব পর্যালোচনা সংহত করতে, বা "আপনার ব্যবহারকারীর নামটি লাইভ অপারেশন বিভাগে অবহিত করা হয়েছে, আপনি আপনার ব্যবহারকারী নামটি পর্যালোচনা ও অনুমোদিত হওয়ার জন্য অপেক্ষা করতে পারেন বা অন্য ব্যবহারকারীর নাম চয়ন করেছেন" ফেরত দিতে। বা যাই হোক না কেন...

যাইহোক, এই পরিষেবার জন্য ব্যয় / মূল্য আমার উদ্দেশ্যে বেশ কম (ইউজারনেমটি কত ঘন ঘন পরিবর্তিত হয়?) তবে আবার, ওপি'র জন্য সম্ভবত নকশাটি আরও নিবিড় প্রশ্নের দাবি করে এবং এর জন্য অর্থ প্রদান / সাবস্ক্রাইব করার জন্য আদর্শ নাও হতে পারে এমএল-পরিষেবাগুলি, বা মানব-পর্যালোচনা / ইন্টারঅ্যাকশন থাকতে পারে না। এগুলি সবই ডিজাইনের উপর নির্ভর করে ... তবে যদি ডিজাইনটি বিলে ফিট করে তবে সম্ভবত এটি ওপির সমাধান হতে পারে।

আগ্রহী হলে, আমি ভবিষ্যতে মন্তব্যে কনসটি তালিকা করতে পারি।

— HidekiAI
সূত্র

-2

অসচ্ছল ফিল্টারগুলি একটি খারাপ ধারণা। কারণটি হ'ল আপনি প্রতিটি শপথের শব্দটি ধরতে পারবেন না। আপনি যদি চেষ্টা করেন তবে আপনি মিথ্যা-পজিটিভ পাবেন।

শব্দ ধরা

আসুন কেবল বলে দিন যে আপনি এফ-শব্দটি ধরতে চান। সহজ, তাই না? বেশ, দেখা যাক.

"ফাক" খুঁজে পেতে আপনি স্ট্রিং দিয়ে লুপ করতে পারেন। দুর্ভাগ্যক্রমে, লোকেরা আজকাল ফিল্টারগুলি চালিত করে। অশ্লীল ফিল্টার "ফুক" তুলেনি।

কেউ শব্দের একাধিক বানান এবং রূপগুলির জন্য যাচাই করার চেষ্টা করতে পারে তবে এটি আপনার কোডের কার্য সম্পাদনকে কমিয়ে দেবে। এফ-ওয়ার্ডটি ধরার জন্য আপনাকে "ফুক", "ফুক", "ফুক", "ফুক", "এফ ***", ইত্যাদি সন্ধান করতে হবে এবং তালিকাটি চালিয়ে যাচ্ছে।

ইনোসেন্স এড়ানো

ঠিক আছে, সুতরাং এটি কীভাবে সংবেদন-সংবেদনশীল তৈরি করবে এবং স্পেসগুলি উপেক্ষা করবে যাতে এটি "এফ ইউ সি কে" ধরে? এটি একটি ভাল ধারণা মত শোনাতে পারে, কিন্তু কেউ "FUCK" দিয়ে অবজ্ঞাপূর্ণ ফিল্টারটিকে বাইপাস করতে পারবেন

আপনি বিরামচিহ্ন উপেক্ষা করুন।

এখন এটি একটি আসল সমস্যা, যেহেতু " নরকের মতো" বাক্য ওরে, সেখানে!" "নরক" হিসাবে উঠবে এবং "কে পাছা ?" "গাধা" হিসাবে উঠছে

এবং এমন অনেকগুলি শব্দ রয়েছে যা আপনাকে ফিল্টার থেকে বাদ দিতে হবে, যেমন "কনস টাইট ইউটিশন", কারণ এতে "শিরোনাম" রয়েছে।

লোকেরা বিকল্প শব্দও ব্যবহার করতে পারে, যেমন "ফ্র্যাক"। তুমিও তা ব্লক করেছ? "পেনিস" এর জন্য "কলম" কী? আপনার প্রোগ্রামটির স্ট্রিংটি ভাল বা খারাপ কিনা তা জানতে কৃত্রিম বুদ্ধি নেই।

অশ্লীল ফিল্টার ব্যবহার করবেন না। এগুলি বিকাশ করা শক্ত এবং তারা ক্রলের মতো ধীর।

— clickbait
সূত্র

2

-1 ওপি প্রশ্নের উত্তর দেয় না এবং বেশিরভাগই একটি মতামত মন্তব্য। এই ইউটিলিটির জন্য অনেকগুলি বৈধ ব্যবহারের কেস রয়েছে। উদাহরণস্বরূপ কোনও অডিটের আগে উত্স কোড পরিষ্কার করা যাতে সংস্থা বিব্রত হয় না।

— ডেভিডজমক্লেলল্যান্ড

-3

না।

কারণ:

Clbuttic
অশ্লীলতা ওএমজি ইভিএল নয়
অশ্লীলতার কার্যকরভাবে সংজ্ঞা দেওয়া যায় না
বেশিরভাগ লোকেরা সম্ভবত অশক্তি থেকে "সুরক্ষিত" হওয়ার প্রশংসা করেন না

সম্পাদনা: আমি যে মন্তব্যকারীকে "সেন্সরশিপটি ভুল তা" বলে সম্মতি জানালেও এই উত্তরের প্রকৃতি এটি নয়।

— eyelidlessness
সূত্র

90

এই উত্তর না করা জন্য 10 upvotes? যেন কেউ যদি অশ্লীলতা ফিল্টার করতে চায় তবে তাকে অবশ্যই একজন নৈতিকতা অর্ধেক বুদ্ধিমান হতে হবে? শুভ দুঃখ। এটি একটি বৈধ প্রশ্ন এবং স্পর্শকাতর ড্রাইভ বাই প্রতিক্রিয়াগুলি পুরষ্কার দেওয়া উচিত নয়। -1।

— ক্লুগে

12

@ ক্লজেজ: আপনিই একমাত্র যারা "অর্ধাহীন জ্ঞানকে নৈতিকীকরণ" বলেছিলেন, বাস্তবে আমি অশ্লীল ফিল্টার বাস্তবায়নের নৈতিক প্রকৃতি সম্পর্কে কিছুই বলিনি। আমি বলেছি "না" বলে মিচ একটি কারণ নিয়ে আসে এবং এটি কোনও ছদ্মবেশী ড্রাইভ বাই নয়। কখনও কখনও "না" হ'ল "আমি কীভাবে ...?" এর সঠিক উত্তর [

— cont'd

2

@ আইলিডলেসনেস: সম্ভবত আপনি ঠিক বলেছেন যে আমি আপনার একক-শব্দের উত্তরে খুব বেশি পড়েছি। তবে যেহেতু আপনি বিশদ বর্ণনা করেননি, তাই আপনার আপত্তিগুলি নৈতিক ভিত্তিতে বা প্রযুক্তিগত কারণে ছিল কিনা তা আমি বলতে পারি না। আমি স্বীকার করব যে আমি "যে কোনও রূপে সেন্সরশিপ খারাপ" মন্তব্য সম্পর্কে ক্লান্ত হয়ে পড়েছি।

— ক্লুগ

5

-1। "করবেন না" নৈতিক বা প্রযুক্তিগত সমস্যা নির্বিশেষে একটি বৈধ উত্তর নয়। প্রচুর সময় রয়েছে যেখানে সামগ্রীর প্রকৃতির উপর ভিত্তি করে বিষয়বস্তু ফিল্টার করা পুরোপুরি উপযুক্ত। কোনও ইকমার্স সাইটটি মহিলাদের অন্তর্বাসগুলি বিক্রি করে একটি 'পর্যালোচনা' বৈশিষ্ট্যটি কল্পনা করুন। আপনি কি সত্যিকারের ছেলের ছেলেরা আবর্জনায় আপনার সাইটে লিটার ছড়াতে চান? অবশ্যই না. এবং সম্ভবত এটি একটি মানব অনুমোদনের প্রক্রিয়া করা খুব জটিল। আবর্জনা সহ পর্যালোচনাগুলি অস্বীকার করার জন্য একটি সাধারণ ফিল্টার একটি ভাল জিনিস।

— পিএসপাহ্ন

3

@ স্পেন, "করবেন না" হ'ল ভুল সমস্যার সমাধান চাওয়ার যে কোনও প্রশ্নের সঠিক উত্তর। অবশ্যই বৈধ কেস রয়েছে যেখানে বিষয়বস্তুটি মাঝারি হওয়া উচিত, তবে একটি "অসচ্ছল ফিল্টার" এটি নয়।

— পলকহীনতা