ইমোজি জন্য সংবেদন ডেটা


12

পরীক্ষা নিরীক্ষা জন্য আমরা ব্যবহার করতে চান সেটি ইমোজি / একটি স্থল সত্য হিসাবে অনেক টুইট সহজ পরিমাণগত senitment বিশ্লেষণ জন্য তথ্য প্রশিক্ষণ এমবেড। NLP ভাল কাজ করার জন্য টুইটগুলি সাধারণত খুব কাঠামোগত হয়।

যাইহোক, ইউনিকোড 6.0 এ 722 ইমোজি রয়েছে এবং সম্ভবত ইউনিকোড 7.0 তে আরও 250 টি যুক্ত হবে।

এমন কোনও ডাটাবেস আছে (যেমন, সেন্টি ওয়ার্ডনেট) যা তাদের জন্য অনুভূতি টীকাগুলি রাখে?

(দ্রষ্টব্য যে সেন্টিওয়ার্ড নেটও অস্পষ্ট অর্থগুলি মঞ্জুরি দেয় । উদাহরণস্বরূপ মজার কথা বিবেচনা করুন : এটি কেবল ইতিবাচক নয়: " এটির মজাদার স্বাদ সম্ভবত সম্ভবত ইতিবাচক নয় ... ;-)উদাহরণস্বরূপ এটি ধারণ করবে । তবে আমি মনে করি না এটি আরও কঠিন)। ইমোগির জন্য এটি নিয়মিত শব্দের চেয়ে ...)

এছাড়াও, যদি অনুভূতি বিশ্লেষণের জন্য সেগুলি ব্যবহার করার অভিজ্ঞতা থাকে তবে আমি শুনতে আগ্রহী।


বিশ্বাস করুন না যে এই জাতীয় কিছু বর্তমানে বিদ্যমান, তবে আপনি যদি এটির জন্য কিছু একসাথে রাখেন তবে এটি পছন্দ করবে!
সূচি

এরিক শুবার্ট, আমি ঠিক একই জিনিসটি খুঁজছি! আপনার জন্য এটির জন্য কোনও দরকারী সংস্থান খুঁজে পাওয়ার কোনও সুযোগ ছিল?
সাeedদ মেহরবী

উত্তর:


4

মোট 972 ইমোজি হ'ল এটিকে ম্যানুয়ালি লেবেল করতে সক্ষম না হওয়াই বড় নয়, তবে আমি সন্দেহ করি যে তারা একটি ভাল স্থল সত্য হিসাবে কাজ করবে। টুইটারের মতো উত্সগুলি বিড়ম্বনা, কটাক্ষ ও অন্যান্য কৌতুকপূর্ণ সেটিংসে পূর্ণ যেখানে সংবেদনশীল চিহ্নগুলি (যেমন ইমোজি বা ইমোটিকন) এর অর্থ সাধারণ ব্যাখ্যার চেয়ে আলাদা কিছু। উদাহরণস্বরূপ, কেউ লিখতে পারেন "xxx তাদের ক্লায়েন্টদের প্রতারণা করেছে, এবং এখন তারা নিজেরাই প্রতারণা করছে! হা হা হা!: ডি"। এটি অবশ্যই নেতিবাচক মন্তব্য, তবে লেখক এক্সএক্সএক্সএক্স সংস্থাকে সমস্যায় দেখে আনন্দিত এবং এভাবে ইতিবাচক ইমোটিকন যুক্ত করেছে। এই মামলাগুলি ঘন ঘন নয়, তবে স্থির সত্যের পক্ষে অবশ্যই উপযুক্ত নয়।

প্রকৃত ডেটা সেট সংগ্রহের জন্য ইমোটিকনকে বীজ হিসাবে ব্যবহার করা আরও অনেক সাধারণ পন্থা । উদাহরণস্বরূপ, এই কাগজে লেখকগণ আরও শ্রেণিবিন্যাসের জন্য দরকারী শব্দের লিক্সিকন ধরতে ইমোটিকন এবং সংবেদনশীল হ্যাশ ট্যাগ ব্যবহার করেন।


1
আসলে আমি একমত না। লেখক যেহেতু তাদের সমস্যায় পড়ে থাকতে পছন্দ করেন তাই এটি সেখানে একটি ইতিবাচক অনুভূতি। এটি সংস্থাটিতে একটি নেতিবাচক মন্তব্য, তবে তবুও এটি লেখকের ইতিবাচক অনুভূতি। এই সরল দৃশ্যে (আমি এটি সম্পূর্ণ লক্ষ্য বলে বলছি না) ভবিষ্যদ্বাণী করে কোন ব্যবহারকারী ইমোজি তার পোস্টে যুক্ত করবেন তা আমার কাছে যুক্তিসঙ্গত কাজ বলে মনে হচ্ছে। প্রকৃতপক্ষে আপনি এমন অনেকগুলি কেস তৈরি করতে পারেন যেখানে ইমোজিগুলি প্রয়োজনীয় হবে .. "গট এফ_ব্যাকড :-)" হিসাবে বিবেচনা করুন "গট এফক্যাকড। :-("
এরিক শুবার্ট

যদি আপনি কোনও বিষয়ের প্রতি ব্যক্তির মনোভাবের বিপরীতে ব্যক্তির সংবেদন অনুমান করার চেষ্টা করেন তবে হ্যাঁ, এই উদাহরণটি কার্যকর হয় না। তবে আরও অনেকে আছেন। সারকাজম সাধারণ ঘটনা। "ওহ হ্যাঁ, আপনি প্রকৃত 'মাস্টার';)" বাক্যটি বিবেচনা করুন। মানব নেতিবাচক প্রসঙ্গটি ধরতে পারে তবে ইতিবাচক ইমোটিকান ইতিবাচক আবেগকে নির্দেশ করবে। তবে আমি সত্যিই এটি পাইনি: আপনি কি টুইটগুলি থেকে বিষয়গত তথ্য আহরণ করতে চান বা কেবল সম্ভাব্য ইমোজিদের পূর্বাভাস দিতে চান? যদিও তারা একইরকম শোনায়, দ্বিতীয় কাজটি প্রকৃতপক্ষে সংবেদন বিশ্লেষণ সম্পর্কে নয়। সরাসরি না, অন্তত।
বন্ধু

"উইঙ্ক" স্মাইলিকে সাধারণত "পজিটিভ" হিসাবে বিবেচনা করা হয় না, তবে "বিড়ম্বনা" ... এই কারণেই সেন্টিওয়ার্ডনেটের মতো একটি ভাল অভিধান বোধগম্য হয়। আপনি যদি সেন্টিওয়ার্ডনেটে মজাদার দেখেন তবে এর একাধিক অর্থও রয়েছে! sentiwordnet.isti.cnr.it/search.php?q=funny (সুতরাং এটি হল তুচ্ছ এগুলো নিজে টীকা যোগ করার, কারণ এটি যেমন ইতিবাচক / নেতিবাচক সহজ হিসাবে নয় না, কিন্তু আপনি স্বাভাবিক interrater-চুক্তি বৈধতা কী করা উচিত ইত্যাদি)
এরিক শুবার্ট

এখন আমি আপনার ধারণা দেখুন। তবে আমি সত্যিই এটি কার্যকর হবে বলে মনে করি না, কারণ (বেশিরভাগ) ইমোজিগুলি আমার কাছে সত্যিই একটি ভাল ভবিষ্যদ্বাণীকের মতো শোনাচ্ছে না এবং আপনি স্পষ্টভাবে অন্যান্য বৈশিষ্ট্যগুলি ব্যবহার করতে চান না। যাইহোক, এটি আমার অভিজ্ঞতার ভিত্তিতে কেবল একটি মতামত, কেবল তথ্যই সত্যিকারের উত্তর দিতে পারে। শুভকামনা!
বন্ধু

কে বলেছে যে আমি অন্যান্য বৈশিষ্ট্যগুলি ব্যবহার করতে চাই না? তবে এগুলির জন্য আমি ডেটাবেসগুলি দেখেছি ...
এরিক শুবার্ট

0

আমি এই গিথুব রেপো দরকারী (একটি ভাল শুরু) পেয়েছি: https://github.com/wooorm/emoji-emotion বিয়োগ পাঁচ (negativeণাত্মক) এবং আরও পাঁচ (ধনাত্মক) এর মধ্যে পূর্ণসংখ্যার সাথে ভ্যালেন্সের জন্য রেট দেওয়া ইমোগুলির তালিকা।

সমর্থিত ইউনিকোড-ইমোজিদের তালিকা দেখুন: https://github.com/wooorm/emoji-emotion/blob/master/Support.md

মনে রাখবেন যে কিছু ইমোজি ইতিবাচক এবং নেতিবাচক উভয় আবেগের জন্য ব্যবহৃত হওয়ার কারণে আটকে থাকা_আপনার_বাঁধা_ক্লসড_ইজ (0) এর মতো বিতর্কিত বিভ্রান্তিযুক্ত পোলারিটিগুলি পেয়ে থাকে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.