মানব কার্যকলাপ স্বীকৃতি স্মার্টফোন ডেটা সেট সমস্যা ব্যবহার করে


9

আমি এই সম্প্রদায়ে নতুন এবং আশা করি আমার প্রশ্নটি এখানে ভালই ফিট হয়ে যাবে। আমার স্নাতক ডেটা অ্যানালিটিক্স কোর্সের অংশ হিসাবে আমি স্মার্টফোনের ডেটা সেট ব্যবহার করে মানবিক কার্যকলাপের স্বীকৃতিতে প্রকল্পটি বেছে নিয়েছি। যতদূর আমি উদ্বিগ্ন এই বিষয়টি মেশিন লার্নিং এবং সমর্থন ভেক্টর মেশিনগুলির সাথে সম্পর্কিত। আমি এখনও এই প্রযুক্তিগুলির সাথে ভালভাবে পরিচিত নই তাই আমার কিছু সহায়তা প্রয়োজন।

আমি এই প্রকল্পের ধারণাটি অনুসরণ করার সিদ্ধান্ত নিয়েছি http://www.inf.ed.ac.uk/teasing/courses/dme/2014/datasets.html (শীর্ষে প্রথম প্রকল্প) প্রকল্প লক্ষ্যটি নির্ধারণ করা হয় যে কোনও ব্যক্তি কী কার্যকলাপ বিষয়টির কোমরে স্মার্টফোন (স্যামসুং গ্যালাক্সি এস II) দ্বারা রেকর্ড করা ডেটা থেকে (যেমন, ওয়াকিং, ওয়ালকিং_উপস্টায়ারস, ওয়াকিং_ডাউনস্টায়ারস, সিটিং, স্ট্যান্ডিং, লয়িং) নিযুক্ত করা। এর এমবেডড অ্যাক্সিলোমিটার এবং জাইরোস্কোপ ব্যবহার করে, ডেটাতে 3-অক্ষিক রৈখিক ত্বরণ এবং 3-অক্ষিক কৌণিক বেগ 50Hz এর স্থির হারে অন্তর্ভুক্ত।

সমস্ত ডেটা সেট কিছু বিবরণ এবং বৈশিষ্ট্য লেবেল সহ একটি ফোল্ডারে দেওয়া হয়। ডেটাটি 'পরীক্ষা' এবং 'ট্রেন' ফাইলগুলির জন্য ভাগ করা হয় যেখানে এই বিন্যাসে ডেটা উপস্থাপন করা হয়:

  2.5717778e-001 -2.3285230e-002 -1.4653762e-002 -9.3840400e-001 -9.2009078e-001 -6.6768331e-001 -9.5250112e-001 -9.2524867e-001 -6.7430222e-001 -8.9408755e-001 -5.5457721e-001 -4.6622295e-001  7.1720847e-001  6.3550240e-001  7.8949666e-001 -8.7776423e-001 -9.9776606e-001 -9.9841381e-001 -9.3434525e-001 -9.7566897e-001 -9.4982365e-001 -8.3047780e-001 -1.6808416e-001 -3.7899553e-001  2.4621698e-001  5.2120364e-001 -4.8779311e-001  4.8228047e-001 -4.5462113e-002  2.1195505e-001 -1.3489443e-001  1.3085848e-001 -1.4176313e-002 -1.0597085e-001  7.3544013e-002 -1.7151642e-001  4.0062978e-002  7.6988933e-002 -4.9054573e-001 -7.0900265e-001

এবং এটি ফাইলটিতে কী রয়েছে তার একটি খুব ছোট নমুনা।

এই ডেটাটি কী উপস্থাপন করে এবং কীভাবে ব্যাখ্যা করা যায় তা আমি সত্যিই জানি না। এছাড়াও ডেটা বিশ্লেষণ, শ্রেণিবদ্ধকরণ এবং ক্লাস্টারিংয়ের জন্য, আমার কোন সরঞ্জামগুলি ব্যবহার করতে হবে? লেবেল অন্তর্ভুক্ত রয়েছে এবং উদাহরণস্বরূপ নমুনা ডেটা বের করতে এবং এতে কাজ করার জন্য আর বা অজগর ব্যবহার করার কোনও উপায় আছে কি না

কোনও ইঙ্গিত / টিপস অনেক প্রশংসা করা হবে।

উত্তর:


8

ডেটা সেট সংজ্ঞা এখানে পৃষ্ঠায় রয়েছে:

নীচে বৈশিষ্ট্যযুক্ত তথ্য

বা আপনি জিপ ফোল্ডারের ভিতরে ক্রিয়াকলাপ_এলবেল নামের ফাইলটি দেখতে পাবেন যা এর ভিতরে আপনার কলামের শিরোনাম রয়েছে, আপনি অবশ্যই সাবধানে পড়ুন তা নিশ্চিত করুন, এতে কিছু ভাল তথ্য রয়েছে। কমান্ডটি .csvব্যবহার করে আপনি সহজেই আর- তে একটি ফাইল আনতে পারেন read.csv

উদাহরণস্বরূপ, আপনি যদি নাম দেন তবে আপনি samsungdataআর খুলতে পারেন এবং এই আদেশটি চালাতে পারেন:

data <- read.csv("directory/where/file/is/located/samsungdata.csv", header = TRUE)

অথবা আপনি যদি ইতিমধ্যে আর এর ডিরেক্টরি ডিরেক্টরি ভিতরে থাকেন তবে আপনি কেবল নীচেরটি চালাতে পারেন

data <- read.csv("samsungdata.csv", header = TRUE)

যেখানে dataআপনি নিজের ডেটা সেটকে কল করতে চান তার নাম পরিবর্তন করা যেতে পারে।


আমি দেখি. আমি README ফাইলটি অধ্যয়ন করেছি, তবে এখনও এটি নিজে কীভাবে ডেটা পড়তে পারে তা আমি বুঝতে পারি না। উদাহরণস্বরূপ, ট্রেন / এক্স_ট্রেইন। টেক্সট'ফিল প্রশিক্ষণ সেটকে উপস্থাপন করে (আমি যে নমুনা পোস্ট পোস্টে দেখিয়েছি তা এই ফাইল থেকে আসে)।
জাকুবে

আমার কাছে মনে হয় যে ডেটা সেটটি প্রশস্ত নয়, সেখানে সারি প্রতি 561 ভেরিয়েবল রয়েছে যা বৈশিষ্ট্য.এসটিএসটি ফাইলের অভ্যন্তরে তালিকাভুক্ত রয়েছে। আমি বিশ্বাস করি এটিই আপনি উল্লেখ করছেন।
এমসিপি_ইন ফিল্টার ২

সুতরাং 'বৈশিষ্ট্যগুলি' ফাইল থেকে প্রতিটি ভেরিয়েবল প্রতিটি কলামের সাথে মিলে যায় যেমন 'x-test.txt' ফাইল, বা আমি কি ভুল করছি?
জাকুবী

এভাবেই আমি নিচ্ছি। README থেকে আমি কী জড়ো করতে পারি তা থেকে ফাইলটি যা থাকে।
এমসিপি_ইন ফিল্টার ২

@ জাকুবে হ্যাঁ features.txtফাইলে 561 সারি / ভেরিয়েবলের নাম এবং ফাইলে 561 কলাম রয়েছে X_train.txt, প্রতিটি ভেরিয়েবলের জন্য একটি করে।
মার্কো 13

5

দেখে মনে হচ্ছে এটি (বা খুব অনুরূপ ডেটা সেট) কোর্সেরা কোর্সের জন্য ব্যবহৃত হয়। এই ডেটাসেটটি পরিষ্কার করা ডেটা পাওয়া এবং পরিষ্কার করার জন্য কাজ , তবে এটি এক্সপ্লোরার ডেটা বিশ্লেষণের ক্ষেত্রে স্টাডির জন্যও ব্যবহৃত হয় । এই কেডি স্টাডি থেকে ভিডিও ইডিএ কোর্স-ওয়্যার এর 4 সপ্তাহের জন্য ভিডিওগুলিতে পাওয়া যায়। এটি আপনাকে এই ডেটা দিয়ে শুরু করতে সহায়তা করতে পারে।

আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.