পাঠ্য খনির উপর ভাল বই?


11

হাই আমি জানতে চেয়েছিলাম পাঠ্য খনন এবং কিছু ক্ষেত্রে স্টাডি সহ শ্রেণিবিন্যাস সম্পর্কিত কিছু ভাল বই আছে কিনা ?. যদি কিছু কাগজপত্র / জার্নালগুলি জনসাধারণের কাছে অ্যাক্সেসযোগ্য না হয় তবে তা করতে পারে। যদি তারা আর দিয়ে আরও ভাল উদাহরণ দেয়। আমি ধাপে ধাপে ম্যানুয়ালটি খুঁজছি না তবে এমন কিছু যা বিভিন্ন শ্রেণীর সমস্যার কাছে বিভিন্ন পাঠ্য খননের পদ্ধতির পক্ষে ও কুফলগুলি চিত্রিত করে।

উত্তর:


5

পরীক্ষা করে দেখুন http://lintool.github.com/MapReduceAlgorithms/MapReduce-book-final.pdf MapReduce সাথে ডেটা নিবিড় টেক্সট প্রসেসিং - এই বই মোটামুটি একাডেমিক কিন্তু কভার সাধারণভাবে ব্যবহৃত টেক্সট প্রক্রিয়াজাতকরণ কৌশল একটি নম্বর এবং কীভাবে তারা parrallised যাবে মানচিত্র হ্রাস ব্যবহার করে বৃহত্তর ডেটাসেটের বেশি।

www.rtexttools.com এটি একটি দুর্দান্ত আর প্যাকেজ যা আপনাকে বিশ্লেষণের পাঠ্য বিশ্লেষণে শ্রেণিবিন্যাস অ্যালগরিদমগুলির বিস্তৃত পরিসীমা (কিছু জড়িত পদ্ধতি সহ) প্রয়োগ করতে সহায়তা করে। এবং


4
এই উত্তরটি স্ব-অন্তর্নিহিত করতে, আপনি কি প্রতিটি লিঙ্কের একটি সংক্ষিপ্ত সংক্ষিপ্ত বিবরণ প্রদান করতে আপত্তি করবেন?
সিলেট

4

আমি সম্প্রতি এই ক্ষেত্রে চারটি বই পড়েছি:

ফিল্ডম্যান, আর। এবং জেমস স্যাঙ্গার, জে। (2006) পাঠ্য মাইনিং হ্যান্ডবুক: কাঠামোগত ডেটা বিশ্লেষণে উন্নত পদ্ধতি aches ক্যামব্রিজ ইউনিভার্সিটি প্রেস.

এটি ব্যবহারিক উদাহরণ, সফ্টওয়্যার এবং প্রয়োগকৃত পাঠ্য খনির উপর দৃষ্টি নিবদ্ধ করে। এটি পাঠ্য-খনির ব্যবহারিক ব্যবহারের একাধিক উদাহরণ দেয়। আপনি যদি পাঠ্য-খনন সরঞ্জামগুলির বাণিজ্যিক অ্যাপ্লিকেশনগুলি সম্পর্কে পড়তে চান তবে এটি আগ্রহী হতে পারে।

শ্রীবাস্তব, এএন এবং সাহামি, এম (২০০৯)। পাঠ্য মাইনিং: শ্রেণিবিন্যাস, ক্লাস্টারিং এবং অ্যাপ্লিকেশন। চ্যাপম্যান অ্যান্ড হল / সিআরসি।

এটি বিভিন্ন গবেষণামূলক কাগজপত্র যা বিভিন্ন পাঠ্য-খনির সরঞ্জামগুলির উদাহরণ হিসাবে ব্যবহৃত হয় of এটি সূচনামূলক পরীক্ষার জন্য বরং খুব বেশি কেন্দ্রীভূত।

ওয়েইস, এস এম, ইন্দুরখ্যা, এন।, ঝাং, টি এবং ডামেরাউ, এফ (2005)। পাঠ্য মাইনিং: কাঠামোগত তথ্যের বিশ্লেষণের জন্য অনুমানমূলক পদ্ধতি Meth স্প্রিঙ্গের।

খুব সাধারণ পাঠ্য যা কিছু সাধারণ সমস্যা বর্ণনা করে।

ম্যানিং, সি। (1999)। পরিসংখ্যানগত প্রাকৃতিক ভাষা প্রক্রিয়াজাতকরণের ভিত্তি। এমআইটি প্রেস।

এই সেরা বই আমি ইতিমধ্যে এই বিষয়ে পড়ুন। এটি ভালভাবে লিখিত, পরিষ্কার, তত্ত্বের গভীরে যায় তবে অনুশীলন-বান্ধব উপায়ে। সাধারণ পরিচিতি দিয়ে শুরু হয়, তবে বেশিরভাগ সর্বাধিক ব্যবহৃত পদ্ধতি এবং অ্যালগরিদম পর্যালোচনা করার চেয়ে। আপনি যদি কেবল একটি একক বই চয়ন করতে চান তবে আমি এটির জন্য একটি সুপারিশ করব।

আপনি সহজেই প্রাকৃতিক ভাষা প্রক্রিয়াকরণ এবং পাঠ্য খনির বিষয়ে একাধিক বই সন্ধান করতে পারেন যা আর ( টিএম লাইব্রেরি) বা পাইথন ( এনএলটিসি গ্রন্থাগার) ব্যবহারের উপর দৃষ্টি নিবদ্ধ করে ।


2

এটি ঠিক আপনি যা খুঁজছেন তাদের জন্য বিন্দু না হতে পারে, কিন্তু নিয়ন্ত্রণ রেগুলার এক্সপ্রেশন জেফ্রি Friedl দ্বারা কিভাবে পার্স পাঠ্যে রেগুলার এক্সপ্রেশন ব্যবহার শেখার জন্য মহান উৎস। তিনি মডেলিংয়ের কৌশলগুলি নিয়ে আলোচনা করেন না, তবে নিয়মিত অভিব্যক্তি প্রয়োগ করা থেকে সজ্জিত, আপনি বিভিন্ন স্ট্যান্ডার্ড মডেলিং পদ্ধতির প্রয়োগ করতে পারেন।


2

একটি বই আমি সময়ে সময়ে ফিরে যাই এবং ধারণাগুলির জন্য আবার পাঠ্য মাইনিং: ভবিষ্যদ্বাণীমূলক পদ্ধতি ... শোলম ওয়েইসের লেখা by সমস্যাগুলির কাছে পৌঁছানোর জন্য এটির প্রচুর ধারণা রয়েছে যা আমি দরকারী মনে করি যেহেতু কখনও কখনও পাঠ্য খনন বিভিন্ন বিষয়গুলি সম্পর্কে চেষ্টা করে - গ্লোবাল বনাম স্থানীয় অভিধান, রাখার মতো বৈশিষ্ট্যগুলির সংখ্যা ইত্যাদি I আমি এই বইটিকে একটি ভাল ধারণা জেনারেটর বলে মনে করি। এর কেস স্টাডিও রয়েছে।


আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.