প্রোগ্রামগতভাবে পর্ন চিত্রগুলি সনাক্ত করার সর্বোত্তম উপায় কী? [বন্ধ]


120

আকিমমেট স্প্যাম মন্তব্যগুলি সনাক্ত করতে একটি আশ্চর্যজনক কাজ করে। তবে এই দিনগুলিতে মন্তব্যগুলি স্প্যামের একমাত্র ফর্ম নয়। যদি আমি কোনও সামাজিক নেটওয়ার্কিং সাইটে স্বয়ংক্রিয়ভাবে পর্ন চিত্রগুলি সনাক্ত করতে আকিসমেটের মতো কিছু চাইতাম যা ব্যবহারকারীদের তাদের ছবি, অবতার ইত্যাদি আপলোড করতে দেয়?

ইতিমধ্যে কয়েকটি চিত্র ভিত্তিক অনুসন্ধান ইঞ্জিন রয়েছে পাশাপাশি মুখের স্বীকৃতি সামগ্রী উপলব্ধ রয়েছে তাই আমি ধরে নিচ্ছি এটি রকেট বিজ্ঞান নয় এবং এটি করা যেতে পারে। তবে, জিনিসটি কীভাবে কাজ করে এবং এটিকে স্ক্র্যাচ থেকে বিকাশ করতে চাইলে আমার কীভাবে এটি করা উচিত সে সম্পর্কে আমার কোনও ধারণা নেই।

আমি কীভাবে শুরু করব?

এটির জন্য কোনও ওপেন সোর্স প্রকল্প আছে?


82
আসলে আমি বলব যে রকেট বিজ্ঞানের চেয়ে অনেক শক্ত মনে হচ্ছে! আমরা ইতিমধ্যে প্রচুর রকেট পেয়েছি, কিন্তু
এএফআইএকে তেমন কোনও

4
হাঃ হাঃ হাঃ. মুখের স্বীকৃতি আছে, তবে যৌনাঙ্গে এবং স্তনের স্বীকৃতি হিসাবে এখনও কোনও প্রযুক্তি নেই। শক্ত ভাগ্য।
জন লিমাজাপ

11
পর্নোগ্রাফি ভূগোলের একটি বিষয় - তদুপরি, আমি নিশ্চিত যে প্রচুর চিত্র রয়েছে যা যৌনাঙ্গ বা নগ্নতা মোটেও দেখায় না, যা বেশ শক্ত হিসাবে বিবেচিত হবে (আবার - কিছু জায়গায়)। সাধারণ অ্যালগরিদম নয়, উন্নত এআইয়ের জন্য কাজের মতো শোনায়।
নোম গাল

2
আমি কেবল এই ইউটিলিটি জুড়ে হোঁচট খেয়েছি যা আমাকে এই থ্রেডটি মনে রাখতে বাধ্য করে। ভাবলে কি কাজ হয়? প্রুফ্রন্টো.com
মার্টিন স্মিথ

1
@ জেএম 6666, যদি সমস্যাটি আপনার কাছে গুরুতর হয় এবং আপনি মনে করেন যে গত দুই বছরে এই অঞ্চলে শিল্পের অবস্থার উন্নতি হয়েছে, তবে রেফারেন্সড ডুপের উপর অনুদান রাখার কীভাবে? আপনার কিছু মনোযোগ এবং সম্ভবত কিছু উত্তর একত্রিত করা উচিত।
মাইকেল পেট্রোটা

উত্তর:


69

এটি 2000 সালে লেখা হয়েছিল, পর্ন সনাক্তকরণে শিল্পের অবস্থাটি আদৌ উন্নত হয়েছে কিনা তা নিশ্চিত নয়, তবে আমি সন্দেহ করি।

http://www.dansdata.com/pornsweeper.htm

পর্নসুইপারের মনে হয় যে লোকেরা ছবি নয় এমন চিত্রগুলির রঙ থেকে লোকের ছবি আলাদা করার কিছুটা ক্ষমতা আছে বলে মনে হচ্ছে। পরিষ্কার ছবি থেকে লোকদের নোংরা ছবি আলাদা করতে এটি কম সফল।

ডিফল্ট, মাঝারি সংবেদনশীলতার সাথে যদি হিউম্যান রিসোর্স অ্যাকাউন্টগুলিতে নতুন অধ্যায়টির চিত্র পাঠায়, আপনি এটি পাওয়ার প্রায় 50% সুযোগ পেয়েছেন। যদি আপনার বোন আপনাকে তার ছয় মাস বয়সী একটি ছবি পাঠায়, এটি একইভাবে আটকানোর সম্ভাবনা রয়েছে।

মোনালিসা পর্নাকে কল করার মতো মজাদার ত্রুটিগুলি চিহ্নিত করার পক্ষে এটি কেবল ন্যায়সঙ্গত, যদি তারা সফ্টওয়্যারটির আচরণের প্রতিনিধিত্ব করে। যদি নির্মাতারা স্বীকার করেন যে তাদের অ্যালগরিদমিক চিত্র শনাক্তকারী 15% সময় বল ফেলে দেবে, তখন মজা করে যখন এটি ঠিক মূর্খ হয়।

তবে পর্নসুইপার কেবল একটি বিভাগে তার বর্ণিত স্পেসিফিকেশন অনুসারে বাস করে বলে মনে হচ্ছে - আসল পর্ন সনাক্তকরণ। এটি অশ্লীল শনাক্তকরণে আধমাসে শালীন, তবে পরিষ্কার ছবি সনাক্ত করা খারাপ। এবং অদূর ভবিষ্যতে এই অঞ্চলে কোনও বড় লাফানো না হলে আমি অবাক হব না।


কারণের কারণে পর্ন সনাক্তকরণ এগিয়ে গেছে। অবজেক্টের স্বীকৃতি / চিত্র শ্রেণিবদ্ধকরণ / কম্পিউটার দৃষ্টিভঙ্গিতে অনেক ব্রেক-চিন্তা রয়েছে। 2000 আমার কাছে পাথরের যুগের মতো অনুভব করে।
মার্টেন

89

এটি আসলে যুক্তিযুক্ত সহজ। আপনি ক্রমগতভাবে ত্বকের সুর সনাক্ত করতে পারেন - এবং পর্ন চিত্রগুলিতে প্রচুর ত্বকের ঝোঁক থাকে। এটি মিথ্যা ইতিবাচক তৈরি করবে তবে এটি যদি সমস্যা হয় তবে আপনি প্রকৃত সংযমের মাধ্যমে সনাক্ত করা চিত্রগুলি পাস করতে পারেন। এটি কেবলমাত্র মডারেটরদের জন্য কাজকে হ্রাস করে না তা আপনাকে প্রচুর বিনামূল্যে পর্নতাও দেয়। এটা জয়-জয়।

#!python    
import os, glob
from PIL import Image

def get_skin_ratio(im):
    im = im.crop((int(im.size[0]*0.2), int(im.size[1]*0.2), im.size[0]-int(im.size[0]*0.2), im.size[1]-int(im.size[1]*0.2)))
    skin = sum([count for count, rgb in im.getcolors(im.size[0]*im.size[1]) if rgb[0]>60 and rgb[1]<(rgb[0]*0.85) and rgb[2]<(rgb[0]*0.7) and rgb[1]>(rgb[0]*0.4) and rgb[2]>(rgb[0]*0.2)])
    return float(skin)/float(im.size[0]*im.size[1])

for image_dir in ('porn','clean'):
    for image_file in glob.glob(os.path.join(image_dir,"*.jpg")):
        skin_percent = get_skin_ratio(Image.open(image_file)) * 100
        if skin_percent>30:
            print "PORN {0} has {1:.0f}% skin".format(image_file, skin_percent)
        else:
            print "CLEAN {0} has {1:.0f}% skin".format(image_file, skin_percent)

এই কোডটি চিত্রের কেন্দ্রে ত্বকের টোন পরিমাপ করে। আমি ২০ টি তুলনামূলকভাবে "পর্ন" চিত্র এবং ২০ টি সম্পূর্ণ নিরীহ চিত্র পরীক্ষা করেছি। এটি "অশ্লীল" এর 100% এবং পরিষ্কার চিত্রের 20 টির মধ্যে 4 টি পতাকা প্রদর্শন করে। এটি বেশ উচ্চ মিথ্যা পজিটিভ রেট তবে স্ক্রিপ্টটি লক্ষ্য করে মোটামুটি সতর্ক হওয়া এবং আরও টিউন করা যেতে পারে। এটি হালকা, গা dark় এবং এশিয়ান ত্বকের সুরে কাজ করে।

এটি মিথ্যা পজিটিভ সহ প্রধান দুর্বলতাগুলি বালি এবং কাঠের মতো বাদামী জিনিস এবং অবশ্যই এটি "দুষ্টু" এবং "সুন্দর" মাংসের (মুখের শটগুলির মতো) মধ্যে পার্থক্য জানে না।

মিথ্যা নেতিবাচকগুলির সাথে দুর্বলতা হ'ল চিত্রগুলির মধ্যে অনেক বেশি উন্মুক্ত মাংস (যেমন চামড়ার দাসত্ব), আঁকা বা উলকিযুক্ত ত্বক, বিঅ্যান্ডডাব্লুয়ের চিত্র ইত্যাদি থাকে images

উত্স কোড এবং নমুনা চিত্র


আপনার 20 লাইনের পাইথনের ধারণার প্রমাণটি পোস্ট করার জন্য যত্নশীল? (-1)
bobobobo

খারাপ নয়, +1। মজার বিষয় হল নিয়মিত পৃষ্ঠতলগুলির (যেমন কার্পেট বা ফ্রিজ পৃষ্ঠের) ত্বকের পরিমাণ বেশি রয়েছে show
bobobobo

6
স্পোলার: চিত্রের নমুনাগুলিতে কোনও প্রকৃত নগ্নতা নেই।
লু

এটি কাঠকে ত্বক হিসাবে বিবেচনা করবে। কারণ এর হুবহু একই রঙ রয়েছে তবে আলাদা জমিন। Portaits উল্লেখ না।
মার্টেন

45

আমি বরং ব্যবহারকারীদের খারাপ চিত্রের প্রতিবেদন করার অনুমতি দেব। চিত্র স্বীকৃতি বিকাশ অনেক বেশি প্রচেষ্টা এবং সময় নিতে পারে এবং মানুষের চোখের মতো যথাযথ হবে না। এই মধ্যপন্থী কাজটি আউটসোর্স করা অনেক সস্তা।

একবার দেখুন: অ্যামাজন মেকানিকাল তুর্ক

" অ্যামাজন মেকানিক্যাল টার্ক (এমটুর্ক) হ'ল অ্যামাজন ওয়েব সার্ভিসের একটি স্যুইট, ভিড়সোর্সিং মার্কেটপ্লেস যা কম্পিউটার প্রোগ্রামগুলি কম্পিউটারগুলি করতে অক্ষম এমন কাজগুলি সম্পাদনের জন্য মানব বুদ্ধিমত্তার ব্যবহারকে সমন্বিত করতে সক্ষম করে।"


4
অ্যামাজন মেকানিকাল টার্ক-স্টাইলের ওয়েবসাইটের জন্য সম্ভবত বাজার রয়েছে তবে একটি যা এই ধরণের বিষয়টিতে বিশেষীকরণ করে .... :)
সমৃদ্ধ

6
অ্যামাজন মেকানিকাল তুর্ক সম্ভবত অর্থ ব্যয় করে। বিষয় বিবেচনা করে আপনি মনে করবেন এমন একটি চতুর ব্যবসায়ের মডেল রয়েছে যেখানে আপনি এটি নিখরচায় করতে পারবেন।
অঙ্কুর

1
আমি মনে করি এটি একটি সুন্দর অনৈতিক পদ্ধতি।
দুপুর সিল্ক

2
@ আঙ্কুর এলএল! ভালো বুদ্ধি. পর্নঅরনট ডট কম এখনও পাওয়া যায় কিনা তা পরীক্ষা করার জন্য নিক ডটকমের শিরোনাম।
পেক্কা

9
@ নুন সিল্ক আপনি কেন এটি একটি অনৈতিক পদ্ধতি মনে করেন?
মাজতেটক

22

15

গম্ভীর গর্জন! এখানে অ্যালগোরিদমযুক্ত হোয়াইটপেপার রয়েছে।

কেউ কি জানেন যে জাভা (বা কোনও ভাষা) বাস্তবায়নের জন্য সোর্স কোডটি কোথায় পাবেন?

যে দোলা হবে।

ডাব্লুআইএসই নামে পরিচিত একটি অ্যালগরিদমের 98% নির্ভুলতার হার আছে তবে 14% মিথ্যা ধনাত্মক হার। সুতরাং আপনি যা করছেন তা হ'ল ব্যবহারকারীরা যদি 2% মিথ্যা নেতিবাচক পতাকাটিকে পতাকাঙ্কিত করে, আদর্শভাবে স্বয়ংক্রিয় অপসারণের সাথে যদি নির্দিষ্ট সংখ্যক ব্যবহারকারী এটিকে পতাকাঙ্কিত করে এবং মডারেটরদের 14% মিথ্যা ধনাত্মকতা দেখতে দেয় view


আপনি অ্যালগরিদম খুঁজে পেয়েছেন। এটা বেশ সুন্দর। উত্স কোডটি প্রায়শই অনুশীলন হিসাবে ছেড়ে যায়। সর্বোপরি, আমরা কোনও বিশেষ প্রোগ্রামিং ভাষা নির্দিষ্ট করছি না, আমরা কি?
ইয়ান

9

Nude.js উপর ভিত্তি করে whitepaper দে লা সালে বিশ্ববিদ্যালয় থেকে Rigan AP-apid দ্বারা।


ন্যুড.জেএস কেবল চিত্রগুলি নয়, এখন ভিডিওগুলিও স্ক্যান করতে পারে।
geeknik

8

এমন একটি সফ্টওয়্যার রয়েছে যা পর্নীর সম্ভাবনা সনাক্ত করে, তবে এটি কোনও সঠিক বিজ্ঞান নয়, কারণ কম্পিউটারগুলি ছবিতে আসলে কী তা বুঝতে পারে না (ছবিগুলি কোনও গ্রিডে মূল্যগুলির একটি বড় সেট যা কোনও অর্থহীন)। আপনি কেবল কম্পিউটারটি পর্ন কী এবং কোনটি উদাহরণ দিয়ে নয় তা শিখিয়ে দিতে পারেন। এটির এই অসুবিধা রয়েছে যে এটি কেবল এই বা অনুরূপ চিত্রগুলিকেই স্বীকৃতি দেবে।

অশ্লীলতার পুনরাবৃত্তিমূলক প্রকৃতি দেওয়া আপনি যদি সিস্টেমটিকে কয়েকটি মিথ্যা ধনাত্মকতা দিয়ে প্রশিক্ষণ দেন তবে আপনার একটি ভাল সুযোগ রয়েছে। উদাহরণস্বরূপ, আপনি যদি নগ্ন লোকদের সাথে সিস্টেমটি প্রশিক্ষণ দেন তবে এটি কোনও সৈকতের চিত্রগুলিকে "প্রায়" নগ্ন লোকদেরও অশ্লীল হিসাবে পতাকাঙ্কিত করতে পারে।

অনুরূপ একটি সফটওয়্যার হল ফেসবুক সফ্টওয়্যার যা সম্প্রতি প্রকাশিত হয়েছিল। এটি কেবল মুখের উপর বিশেষায়িত। মূল নীতি একই।

প্রযুক্তিগতভাবে আপনি বেইস ফিল্টারিং ব্যবহার করে এমন কিছু বৈশিষ্ট্য সনাক্তকারী প্রয়োগ করবেন। বৈশিষ্ট্য সনাক্তকারী যদি সাধারণ ডিটেক্টর হয় বা কেবলমাত্র সংরক্ষিত অশ্লীল চিত্রগুলির একটি সেট দিয়ে বর্তমান চিত্রের সাদৃশ্য গণনা করে তবে শতভাগ মাংস বর্ণের পিক্সেলের মতো বৈশিষ্ট্যগুলির সন্ধান করতে পারে।

এটি অবশ্যই পর্নীর মধ্যে সীমাবদ্ধ নয়, এটি আসলে আরও বেশি কোণার ক্ষেত্রে। আমি মনে করি আরও সাধারণ হ'ল সিস্টেমগুলি যা চিত্রগুলিতে অন্যান্য জিনিসগুলি অনুসন্ধান করার চেষ্টা করে ;-)


1
লোকেরা কেন এই উত্তরটিকে কম ভোট দেয়?
প্যাট্রিক কর্নেলিসসেন

কারণ এতে অ্যালগরিদম, রেসিপি বা রেফারেন্সের মতো কিছু নেই।
ইয়ান

7
সুতরাং ব্যবহারকারীকে এমন প্রশ্ন জিজ্ঞাসা করার কোনও বৈধ উত্তর নয় যে তিনি যা অর্জন করতে চান তা সত্যই সম্ভব নয়? ডুড, আপনি হয়ত আরও কিছুটা রিল্যাক্সড হয়েছেন ...
প্যাট্রিক কর্নেলিসসেন

এটি একটি মিথ্যা বক্তব্যও
দিচ্ছে

কারণ তারা পারে না। আপনি কেবল নির্দিষ্ট চিত্রগুলি সনাক্ত করতে শিখতে পারেন এবং আপনার ধনাত্মক ও নেতিবাচক ক্ষেত্রে যত বড় আকারের ডিবি হবে তত ভাল, তবে সাধারণভাবে আপনি কখনই এমন কোনও সমাধান পাবেন না যা মানুষের মতো নির্ভুল, সুতরাং আপনি বিশাল সংখ্যক দিয়ে শেষ করবেন মিথ্যা ইতিবাচক এবং নেতিবাচক।
প্যাট্রিক কর্নেলিসসেন

5

উত্তরটি সত্যিই সহজ: এটি বলা নিরাপদ যে এটি পরবর্তী দুই দশকে সম্ভব হবে না। এর আগে আমরা সম্ভবত ভাল অনুবাদ সরঞ্জাম পাবেন। শেষবার যখন আমি যাচাই করলাম, এআই ছেলেরা সামান্য পরিবর্তিত কোণ থেকে গুলি করা দুটি ছবিতে একই গাড়িটি সনাক্ত করতে লড়াই করছিল। একসাথে যথেষ্ট ভাল ওসিআর বা স্পিচ স্বীকৃতি পেতে তাদের কত সময় নিয়েছিল তা একবার দেখুন। এগুলি হ'ল স্বীকৃতিজনিত সমস্যা যা অভিধান থেকে ব্যাপকভাবে উপকৃত হতে পারে এবং এগুলি ফেলে দেওয়া বহু মিলিয়ন মাসের পরেও সম্পূর্ণ নির্ভরযোগ্য সমাধান থেকে দূরে from

বলা হচ্ছে যে আপনি কেবল "আক্রমণাত্মক" যুক্ত করতে পারেন? ব্যবহারকারীর উত্সাহিত লড়াইয়ের পাশের লিঙ্ক এবং আগত অভিযোগগুলির একটি আধুনিক ক্রস পরীক্ষা করুন।

সম্পাদনা:

আমি কিছু ভুলে গেছি: যদি আপনি কোনও ধরণের ফিল্টার প্রয়োগ করতে চলেছেন তবে আপনার একটি নির্ভরযোগ্য প্রয়োজন হবে। যদি আপনার সমাধানটি 50% সঠিক হয় তবে 4000 এর মধ্যে শালীন চিত্রযুক্ত 2000 জন ব্লক হয়ে যাবে। ক্ষোভের আশা


5

তাইওয়ানের ন্যাশনাল চেং কুং বিশ্ববিদ্যালয়ের স্নাতক শিক্ষার্থী ২০০৪ সালে এই বিষয়ে একটি গবেষণা করেছিলেন। ইন্টারনেট থেকে ডাউনলোড করা নগ্ন ছবি সনাক্ত করতে তিনি 89.79% সাফল্যের হার অর্জন করতে সক্ষম হন। তার থিসিসের লিঙ্কটি এখানে: ত্বকের রঙের উপর ভিত্তি করে নগ্ন ব্যক্তিদের চিত্র সনাক্তকরণের উপর অধ্যয়ন এটি
চীনা ভাষায় রয়েছে তাই আপনি এটি পড়তে না পারলে আপনার অনুবাদকের প্রয়োজন হতে পারে।


4

সংক্ষিপ্ত উত্তর: একটি মডারেটর ব্যবহার করুন;)

দীর্ঘ উত্তর: আমি মনে করি না যে পর্ন কি এই কারণে একটি প্রকল্প আছে? কেবলমাত্র পা, সম্পূর্ণ নগ্নতা, ছাঁটাই ইত্যাদি এটির বিষয়ভিত্তিক।


3
প্রশ্নটি হ'ল "প্রোগ্রামারোগিকভাবে পর্ন চিত্রগুলি সনাক্ত করার সর্বোত্তম উপায় কোনটি?", প্রোগ্রামক্রমে ...
আগস্টি-এন

5
আমি প্রশ্নটি জানি, তবে যেমনটি আমি বলেছিলাম যে এখানে 100% সঠিক পর্ন ব্লকার নেই কারণ পর্ন বিষয়ভঙ্গী। বিষয়গত কোডের সাথে সম্পর্কিত হতে পারে না। 1 ভাবেন কেবল নগ্নতা, অন্যরা তার অশ্লীল ধারণা। একটি 'প্রতিবেদন চিত্র' বোতাম থাকা ভাল সমাধান। কোয়েস্ট্যা নাভিন হিসাবে একই ধারণা। নেট
আরভিডিকে

1
"মিজেটস ইত্যাদি"? হোলি নন-সিকুইটার, ব্যাটম্যান।
ডগ ম্যাকক্লিয়ান

মিডজেট পর্ন বলে একটি জিনিস আছে।
ক্রিস শার্লক

4

আপত্তিকর লিঙ্ক যুক্ত করুন এবং আপত্তিকর চিত্রটির এমডি 5 (বা অন্যান্য হ্যাশ) সংরক্ষণ করুন যাতে এটি ভবিষ্যতে স্বয়ংক্রিয়ভাবে ট্যাগ হতে পারে।

কারও কাছে যদি ওয়েবসার্ভিস হিসাবে চলমান বর্ণনামূলক ট্যাগগুলির সাথে ইমেজ এমডি 5 এর একটি বিশাল পাবলিক ডাটাবেস থাকে তবে তা কত শীতল হবে? প্রচুর অশ্লীল আসল কাজ নয় (যে ব্যক্তি এখন এটি নিয়েছে, সম্ভবত এটি তৈরি করে নি) এবং জনপ্রিয় চিত্রগুলি বিভিন্ন জায়গার চারপাশে ভেসে বেড়ায়, তাই এটি সত্যই কোনও পার্থক্য করতে পারে।


8
আমি এটাকে সন্দেহ করি. সেখানে প্রচুর অশ্লীলতা রয়েছে (এবং দিনের তুলনায় আরও বেশি পরিমাণে উত্পন্ন) যে একই চিত্রটি দু'বার দেখার আপনার প্রতিক্রিয়াগুলি (আইএমএইচও) বরং শূন্যের কাছাকাছি।
ভিলক্স-

কিছুক্ষণের জন্য কীভাবে টব মেয়েটি প্রায়শই দেখা যায় তা চিন্তা করুন। এটি একবার পতাকাঙ্কিত হয়ে উঠত এবং তারপরে অন্য প্রত্যেকে এটি এড়াতে পারত।
rfusca

3
যদি তা ক্রপ, পুনরায় আকার না দেওয়া বা
সদ্য

হ্যাঁ, আমি সে সম্পর্কে ভেবেছিলাম :( হ্যাঁ, এটি একটি চিন্তাভাবনা ছিল
rfusca

1
এমডি 5 এর চেয়ে ভাল, লাইসেন্স আইডির টিনই।
তোবু

2

আপনার যদি সত্যিই সময় এবং অর্থ থাকে:

এটি করার একটি উপায় হ'ল 1) কোনও বস্তু মানুষের হয় কি না তা খুঁজে পাওয়ার জন্য একটি চিত্র সনাক্তকরণ অ্যালগরিদম লিখে Writ এটি কোনও চিত্রের "কনট্যুরস" পুনরুদ্ধার করতে বিটমাস্কিং করে এবং কনট্যুরগুলি কোনও মানুষের কনট্যুরের সাথে খাপ খায় কিনা তা দেখুন।

2) অশ্লীল চিত্রগুলির সাথে মেলে এমন প্যাটার্ন সনাক্ত করতে শিখতে ডেটা প্রচুর অশ্লীল চিত্র খনন করে এবং সি মূলে থাকা অ্যালগরিদম বা কণা সোয়ার অপ্টিমাইজেশনের মতো ডেটা মাইনিং কৌশলগুলি ব্যবহার করে।

এটির প্রয়োজন হবে যে আপনি কোনও শরীরে একজন নগ্ন পুরুষ / স্ত্রীকে সংশ্লেষ করার জন্য ডিজিটাইজড ফর্ম্যাটে দেখতে কেমন হবে (এটি ওসিআর চিত্র স্বীকৃতি অ্যালগরিদমগুলি একইভাবে কাজ করা যায়) identify

আশা করি অনেক মজা করেছো! :-)


2

আমার কাছে মনে হচ্ছে মূল বাধাটি কোনও "পর্ন চিত্র" সংজ্ঞায়িত করছে। আপনি যদি এটি সহজেই সংজ্ঞায়িত করতে পারেন তবে আপনি সম্ভবত এমন কিছু লিখতে পারেন যা কার্যকর হবে। কিন্তু এমনকি মানুষেরা কী পর্নাকে সম্মত করতে পারে না। আবেদনটি কীভাবে জানবে? ব্যবহারকারীর সংযোজন সম্ভবত আপনার সেরা বেট।


1

আমি একটি ওয়েব ফিল্টারিং অ্যাপ্লিকেশন দেখেছি যা পর্ন চিত্রের ফিল্টারিং করে, দুঃখিত আমি নামটি মনে করতে পারি না। এটি বেশিরভাগ সময় এটি কাজ করায় মিথ্যা ধনাত্মক হয়ে পড়েছিল।

আমি মনে করি মূল কৌশলটি "ছবিতে খুব বেশি ত্বক সনাক্ত করছে"


1
আমি অধ্যয়নটি মনে করতে পারি না - তবে এটি একটি প্রান্ত সনাক্তকরণ করেছিল এবং এটি ভালভাসের ঘোরানো বা অস্পষ্টের ধরণগুলির সাথে মিলিত হয়েছিল। একটি চিত্র প্রক্রিয়াজাতকরণ দিক থেকে বেশ আকর্ষণীয়।
জিম

-1, এটি ভাষ্য সরবরাহ করে তবে যথেষ্ট সমাধান দেয় না।
ব্র্যাড কোচ

1

পর্ন চিত্রগুলি সনাক্ত করা এখনও একটি নির্দিষ্ট এআই টাস্ক যা এখনও অনেক তাত্ত্বিক।

একটি বোতাম / লিঙ্ক "স্প্যাম / অপব্যবহারের প্রতিবেদন করুন" যোগ করে সম্মিলিত শক্তি এবং মানব বুদ্ধি সংগ্রহ করুন vest অথবা এই কাজটি করার জন্য বেশ কয়েকটি মডারেটর নিয়োগ করুন।

পিএস সত্যিই আশ্চর্য হয়ে গেছে যে কতজন লোক সফ্টওয়্যার এবং অ্যালগরিদমগুলি ধরে নিয়ে প্রশ্ন জিজ্ঞাসা করে যে তারা কী চায় তা করা যায় কিনা তা ভেবেও সর্বশক্তিমান। তারা কি সেই নতুন প্রজাতির প্রোগ্রামারগুলির প্রতিনিধি যারা হার্ডওয়্যার, নিম্ন-স্তরের প্রোগ্রামিং এবং সেই সমস্ত "পিছনে যাদু" সম্পর্কে কিছুই বোঝে না?

পিএস # 2। আমি এও মনে করি যে পর্যায়ক্রমে এমন হয় যে কোনও পরিস্থিতি যখন লোকেরা নিজেরাই সিদ্ধান্ত নিতে পারে না যে কোনও ছবি অশ্লীল বা শিল্পকে আদালতে তোলা হয়েছে কিনা। আদালতের বিধি-বিধানের পরেও, জনগণের অর্ধেক লোক সিদ্ধান্তকে ভুল বিবেচনা করবে। এই ধরনের শেষ বোকা পরিস্থিতি বেশ সম্প্রতি যখন একটি উইকিপিডিয়া পৃষ্ঠা ইউকেতে নিষিদ্ধ হয়ে যায় কারণ একটি সিডি কভার চিত্র ছিল যা কিছু নগ্নতার বৈশিষ্ট্যযুক্ত।


1

দুটি বিকল্পের বিষয়ে আমি ভাবতে পারি (যদিও এগুলির মধ্যে দুটিই ক্রমবর্ধমান পর্ন সনাক্ত করছে না):

  1. সমস্ত আপলোড করা চিত্র অবরুদ্ধ করুন যতক্ষণ না আপনার প্রশাসক একজন তাদের দিকে না তাকিয়ে থাকে। এটি দীর্ঘ সময় নেওয়ার কারণ নেই: আপনি এমন একটি সফ্টওয়্যার লিখতে পারেন যা 10 টি চিত্র দ্বিতীয় সেকেন্ডে দেখায়, প্রায় চলচ্চিত্র হিসাবে - এমনকি এই গতিতেও কোনও মানুষের পক্ষে সম্ভাব্য অশ্লীল চিত্র দেখা সহজ। তারপরে আপনি এই সফ্টওয়্যারটি রিওয়াইন্ড করুন এবং আরও ঘনিষ্ঠভাবে দেখুন।
  2. সাধারণ "এই চিত্রটিকে অনুপযুক্ত হিসাবে পতাকাঙ্কিত করুন" বিকল্পটি যুক্ত করুন।

1

BrightCloud ওয়েব পরিষেবা এপিআই এই জন্য উপযুক্ত। ঠিক এই জাতীয় ওয়েবসাইট দেখার জন্য এটি একটি REST এপিআই। এটিতে একটি খুব বড় এবং খুব নির্ভুল ওয়েব ফিল্টারিং ডিবি রয়েছে এবং অ্যাডাল্ট বিভাগগুলির মধ্যে একটিতে 10 এমেরও বেশি পর্ন সাইট সনাক্ত করা হয়েছে!


1

আমি এমন সরঞ্জামগুলির বিষয়ে শুনেছি যা খুব সাধারণ, তবে বেশ কার্যকর অ্যালগরিদম ব্যবহার করে। অ্যালগোরিদম কিছু পূর্বনির্ধারিত "ত্বক" রঙের কাছাকাছি রঙের মান সহ পিক্সেলের আপেক্ষিক পরিমাণ গণনা করে। যদি সেই পরিমাণটি কিছু পূর্বনির্ধারিত মানের থেকে বেশি হয় তবে চিত্রটি যৌন / অশ্লীল বিষয়বস্তু হিসাবে বিবেচিত হবে। অবশ্যই সেই অ্যালগরিদম মুখোমুখি ছবি এবং অন্যান্য অনেক কিছুর জন্য মিথ্যা ইতিবাচক ফলাফল দেবে।
যেহেতু আপনি সামাজিক নেটওয়ার্কিং সম্পর্কে লিখছেন সেখানে প্রচুর পরিমাণে "স্বাভাবিক" ফটো থাকবে যার উপর ত্বকের রঙ প্রচুর পরিমাণে থাকবে, সুতরাং আপনার ইতিবাচক ফলাফল সহ সমস্ত ছবি অস্বীকার করার জন্য এই অ্যালগরিদম ব্যবহার করা উচিত নয়। তবে আপনি এটি মডারেটরদের জন্য কিছু সহায়তা সরবরাহ করতে ব্যবহার করতে পারেন, উদাহরণস্বরূপ এই ছবিগুলিকে উচ্চ অগ্রাধিকার সহ ফ্ল্যাগ করুন,


আমি বাস্তবে ব্যবহারের মতো একটি সিস্টেম দেখেছি। এটি নিজের হাতে ছেড়ে দেওয়ার মতো যথেষ্ট নির্ভরযোগ্য নয়, তবে এটি উপযুক্ত হলে মডারেটরকে সতর্ক করার জন্য খুব ভাল কাজ করে। এটির পূর্ণ প্রমাণ নয়, বিশেষত যদি ব্যক্তিটি কেবল একটি ছোট উন্মুক্ত অঞ্চল দিয়ে coveredাকা থাকে। বিপরীতে নির্ভরযোগ্যতাটি নির্ভরযোগ্যভাবে কার্যকরভাবে কাজ করে না।
টিম পোস্ট

1

এটি এক প্রতিশ্রুতিবদ্ধ দেখাচ্ছে। মূলত তারা ত্বক সনাক্ত করে (মুখগুলি স্বীকৃতি দিয়ে ক্রমাঙ্কন সহ) এবং "ত্বকের পাথ" নির্ধারণ করে (অর্থাত্ ত্বকের পিক্সেল বনাম মুখের ত্বকের পিক্সেল / ত্বকের পিক্সেলের অনুপাত পরিমাপ করে)। এটি শালীন কর্মক্ষমতা আছে। http://www.prip.tuwien.ac.at/people/julian/skin-detection


0

ফাইলের নাম এবং কোনও বৈশিষ্ট্য দেখুন। দুষ্টু চিত্রের 20% এমনকি সনাক্ত করার জন্য প্রায় পর্যাপ্ত তথ্য নেই, তবে একটি সাধারণ কীওয়ার্ড ব্ল্যাকলিস্ট অন্তত বর্ণনামূলক লেবেল বা মেটাডেটা যুক্ত চিত্রগুলি সনাক্ত করতে পারে। 20% সাফল্যের হারের জন্য 20 মিনিটের কোডিং কোনও খারাপ চুক্তি নয়, বিশেষত একটি প্রিস্ক্রিন হিসাবে আপনি বাকী বিচারকের পক্ষে বিচারের আগে পাস করার আগে কমপক্ষে কিছু সাধারণকে ধরে ফেলতে পারে।

অন্যান্য দরকারী কৌশলটি অবশ্যই এর বিপরীত, সংযম বা পরীক্ষা না করে চিত্রের উত্সগুলির একটি শ্বেত তালিকা বজায় রাখুন। যদি আপনার বেশিরভাগ চিত্রগুলি নিরাপদ আপলোডার বা উত্স থেকে জানা যায়, তবে আপনি কেবল সেগুলিকে বিনীতভাবে গ্রহণ করতে পারেন।


0

সেই সংক্ষিপ্ত বিবরণে ["হার্ড-কোর পর্নোগ্রাফি"] এর মধ্যে আমি যে ধরণের উপাদানটি গ্রহণ করতে পারি তা বোঝার জন্য আমি আজ আর চেষ্টা করব না; এবং সম্ভবত আমি বুদ্ধিমানের সাথে এটি করতে সফল হতে পারে না। তবে আমি এটি যখন দেখি তখন তা জানি, এবং এই ক্ষেত্রে জড়িত গতি চিত্রটি এটি নয়।

- মার্কিন যুক্তরাষ্ট্র সুপ্রিম কোর্টের বিচারপতি পটার স্টুয়ার্ট, 1964



0

এটা রকেট বিজ্ঞান নয়। আর না. এটি মুখের স্বীকৃতির সাথে খুব মিল। আমি মনে করি এটি মোকাবেলার সবচেয়ে সহজ উপায় হ'ল মেশিন লার্নিং ব্যবহার করা। এবং যেহেতু আমরা চিত্রগুলি নিয়ে কাজ করছি, তাই আমি নিউরোনাল নেটওয়ার্কগুলির দিকে নির্দেশ করতে পারি, কারণ এগুলি চিত্রগুলির জন্য পছন্দসই বলে মনে হয়। আপনার প্রশিক্ষণের ডেটা প্রয়োজন হবে। এবং আপনি ইন্টারনেটে প্রচুর প্রশিক্ষণ ডেটা পেতে পারেন তবে আপনি যে অ্যালগরিদম সনাক্ত করতে চান তা নির্দিষ্ট অংশে চিত্রগুলি ক্রপ করতে হবে। অবশ্যই আপনাকে সেই সমস্যাটি শরীরের বিভিন্ন অংশে ভাঙতে হবে যা আপনি প্রতিটিটির জন্য প্রশিক্ষণ ডেটা সনাক্ত করতে এবং তৈরি করতে চান এবং এটিই জিনিসগুলি মজাদার হয়ে উঠেছে।

উপরের কেউ যেমন বলেছেন, এটি 100% শতাংশ করা যায় না। এমন কেস থাকবে যেখানে এই জাতীয় অ্যালগরিদম ব্যর্থ হয়। প্রকৃত নির্ভুলতা আপনার প্রশিক্ষণ ডেটা, আপনার নিউরোনাল নেটওয়ার্কগুলির গঠন এবং আপনি কীভাবে প্রশিক্ষণ ডেটা (পেনিস, যোনি, স্তন, ইত্যাদি এবং এর সংমিশ্রণ) ক্লাস্টার করতে বেছে নেবেন তা দ্বারা নির্ধারিত হবে। যে কোনও ক্ষেত্রে আমি অত্যন্ত আত্মবিশ্বাসী যে স্পষ্টত অশ্লীল চিত্রের জন্য উচ্চ নির্ভুলতার সাথে এটি অর্জন করা যেতে পারে।



-1

আজকাল জ্ঞানের সাথে আপনি এটি করার কোনও উপায় নেই 100% (আমি বলব সম্ভবত 1-5% প্রশংসনীয় হবে)। আপনি আরও ভাল ফলাফল পাবেন (যারা 1-5% এর চেয়ে বেশি) কেবল যৌন-সম্পর্কিত-শব্দের জন্য চিত্র-নাম পরীক্ষা করে :)।

@ এসও ট্রোল: সত্য true


-1, এটি ভাষ্য সরবরাহ করে তবে যথেষ্ট সমাধান দেয় না।
ব্র্যাড কোচ
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.