আর (টিএম প্যাকেজ) সহ পাঠ্য খনির উদাহরণ


14

আমি তিন দিনের সাথে tmএক বন্ধুর একটি খসড়া কাগজ পড়ার সাথে সাথে কাটালাম যেখানে তিনি ইউসিআইএনইটি দিয়ে একটি টেক্সট কর্পাস অন্বেষণ করেছিলেন, যেখানে টেক্সট ক্লাউড, টু-মোড নেটওয়ার্ক গ্রাফ এবং একক মান পচন (স্টাটা ব্যবহার করে গ্রাফিক্স সহ) দেখিয়েছিলেন। আমি প্রচুর সমস্যার মুখোমুখি হয়েছি: ম্যাক ওএস এক্সে, স্নোবল (স্টেমিং) বা আরগ্রাভিজ (গ্রাফ) এর মতো লাইব্রেরির পিছনে জাভা নিয়ে কিছু সমস্যা রয়েছে।

কেউ বিন্দু আউট গেল না প্যাকেজ - আমি দিকে তাকিয়ে আছে tm, wordfishএবং wordscores, এবং NLTK সম্পর্কে জানতে - কিন্তু গবেষণা, কোড সহ যদি সম্ভব হয়, পাঠগত ডেটার উপর সফল যে ব্যবহারগুলি tmবা অন্য কিছু সংসদীয় বিতর্ক বা বিধানিক নথি মত ডেটা বিশ্লেষণের? আমি ইস্যুতে খুব বেশি কিছু খুঁজে পেতে এবং এর থেকে আরও কম কোড শিখতে পারি না।

আমার নিজস্ব প্রকল্পটি একটি দুই মাসের সংসদীয় বিতর্ক, এই পরিবর্তনগুলি একটি সিএসভি ফাইলে জানানো হয়েছে: সংসদীয় অধিবেশন, স্পিকার, সংসদীয় গ্রুপ, মৌখিক হস্তক্ষেপের পাঠ্য। আমি স্পিকারের মধ্যে এবং বিশেষত বিরল এবং কম বিরল পদ ব্যবহারের ক্ষেত্রে সংসদীয় দলের মধ্যে বিভেদ খুঁজছি, যেমন "নাগরিক স্বাধীনতা" আলাপের বিরুদ্ধে "সুরক্ষা আলাপ"।


উত্তর:


7

টিএম এর লেখক, পিএইচডি গবেষণামূলক গবেষণা অস্ট্রিয়া থেকে ইনগো ফিইনার, ইংরেজি ভাষায় রচিত। এই দস্তাবেজের অধ্যায় 7-10-তে ক্রমবর্ধমান জটিলতার সাথে টিএম প্যাকেজের অ্যাপ্লিকেশন রয়েছে।

http://epub.wu.ac.at/1923/

অধ্যায় 7 টি আর-ডেভেল 2006 মেলিং তালিকা বিশ্লেষণ করে টিএম-এর একটি অ্যাপ্লিকেশন উপস্থাপন করেছে। অষ্টম অধ্যায় গ্রাহক বৈদ্যুতিন বাণিজ্যে ব্যবসায়ের জন্য পাঠ্য খনির প্রয়োগ দেখায়। অষ্টম অধ্যায়টি বকেয়া ও শুল্ক সম্পর্কিত অস্ট্রিয়ান সুপ্রিম প্রশাসনিক আদালতের এখতিয়ারগুলি তদন্তের জন্য টিএম এর প্রয়োগ is [...] । অধ্যায় 10 উইজার্ড অফ ওজেড ডেটা সেটটিতে স্টাইলোমেট্রি এবং লেখক বিশিষ্টতার জন্য একটি অ্যাপ্লিকেশন দেখায়।

কভার সম্পূর্ণ ডকুমেন্ট কভার পড়ুন। নোট করুন, তবে, দস্তাবেজটি ২০০৮ সালে লেখা হয়েছিল এবং তার পর থেকে কয়েকটি এপিআই পরিবর্তন হয়েছে, উদাহরণস্বরূপ, পিএইচডি থিসিস একটি ফাংশন উল্লেখ tmMap()করেছেন যার নামকরণ হয়েছে tm_map()। সুতরাং কোড উদাহরণগুলি যেমন হয় তেমন কার্যকর হবে না, আপনি এগুলি চেষ্টা করার জন্য কাট-পেস্ট ব্যবহার করতে পারবেন না।

আপনিও যেতে পারেন

http://tm.r-forge.r-project.org/users.html

"বিদ্যমান টিএম অ্যাপ্লিকেশনগুলি সম্পর্কে নতুন ব্যবহারকারীদের অবহিত করার প্রয়াসে এই সাইটটি টিএম ব্যবহারকারীদের এবং তাদের মতামতের তালিকা (একটি অসম্পূর্ণ বর্ণানুক্রমিক) সরবরাহ করার লক্ষ্যে রয়েছে। জ্ঞাত ব্যবহারকারীরা গবেষণা প্রতিষ্ঠান থেকে শুরু করে পৃথক পৃথক ব্যক্তিদের মধ্যে রয়েছে।"

এবং "একটি কাগজ লিখেছেন" এই বাক্যাংশের জন্য পৃষ্ঠাটিতে অনুসন্ধান করুন এবং আপনি অনেকগুলি লিঙ্ক পাবেন। আমি কেবলমাত্র একটি কাগজ পড়েছি, "গানের লিরিকগুলিতে স্বয়ংক্রিয় বিষয় সনাক্তকরণ"। বেশ আকর্ষণীয় এবং মজার।


আমি মনে করি ফিিনারারের গবেষণামূলক প্রবন্ধটি এমন নথী যা আমাকে এখনও অবধি সবচেয়ে সহায়তা করেছে। ধন্যবাদ!
Fr.

5

শুরু করার জন্য একটি ভাল জায়গা হতে পারে ওয়েবসাইটের প্রকাশনাগুলির তালিকাtm , যেমন এটির জন্য :

এই প্রকাশনার প্রতিটি শেষে রেফারেন্স তালিকার সফল অ্যাপ্লিকেশন অন্তর্ভুক্ত tm, যা আপনি খুঁজছেন বলে মনে হয়। অনেকগুলি রয়েছে - বিশেষত আপনি যদি পরে উল্লেখগুলি অনুসরণ করেন।

উদাহরণস্বরূপ, এখানে প্রাসঙ্গিক হতে পারে এমন একটি এখানে:

ফিনিয়ার I, হর্নিক কে (2007)। Supreme সুপ্রিম প্রশাসনিক আদালতের এখতিয়ারের পাঠ্য মাইনিং "" সি প্রিসাচ, এইচ বুখার্ট, এল শ্মিড্ট-থিয়েম, আর ডেকার (সংস্করণ), \ ডেটা অ্যানালাইসিস, মেশিন লার্নিং এবং অ্যাপ্লিকেশনস (গেসেলসচাফ্ট উর এর 31 তম বার্ষিক সম্মেলনের কার্যক্রম) ক্লাসিকেশন ইভি, মার্চ 7 {9, 2007, ফ্রেইবার্গ, জার্মানি), "ক্লাসিকেশন স্টাডিজ, ডেটা অ্যানালাইসিস এবং নলেজ অর্গানাইজেশন"। স্প্রিঙ্গের-ভার্ল্যাগ।

শুভকামনা।


রেফারেন্সের জন্য ধন্যবাদ। যদিও এই প্রকাশনাগুলিতে বিশদের মাত্রা অপর্যাপ্ত - tmআমার শেষের দিকে কীভাবে পরিচালনা করা যায় তার জন্য পর্যাপ্ত বিবরণ পেতে আমাকে ফিনেরার প্রবন্ধ থেকে পড়তে হয়েছিল । তবুও, আপনাকে অনেক ধন্যবাদ :)
ফ্রি
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.