লগড ভেরিয়েবল কেন ব্যবহার করবেন?


12

সম্ভবত, এটি একটি খুব প্রাথমিক প্রশ্ন তবে আমি এর পক্ষে একটি দৃ answer় উত্তর খুঁজে পেতে সক্ষম হবে বলে মনে হয় না। আমি এখানে আশা করি, আমি পারি।

আমি বর্তমানে আমার নিজের মাস্টারের থিসিসের প্রস্তুতি হিসাবে কাগজপত্র পড়ছি। বর্তমানে, আমি একটি কাগজ পড়ছি যা টুইট এবং শেয়ার বাজারের বৈশিষ্ট্যগুলির মধ্যে সম্পর্কের গবেষণা করে।

তাদের একটি অনুমানের মধ্যে, তারা প্রস্তাব দিয়েছে যে "বর্ধিত টুইটের পরিমাণটি ব্যবসায়ের পরিমাণ বাড়ার সাথে জড়িত"।

আমি তাদের সাথে জুটিবদ্ধ সম্পর্কগুলির সাথে সম্পর্কযুক্ত tweetVolumeহওয়ার প্রত্যাশা করব, tradingVolumeতবে পরিবর্তে তারা লগ করা সংস্করণগুলি ব্যবহার করে রিপোর্ট করুন: LN(tweetVolume)এবং LN(tradingVolume)

আমার থিসিসের জন্য, আমি তাদের কাগজের এই বিটটি প্রতিলিপি করেছি। আমি tweetVolumeএকই সময়সীমার জন্য 6 মাস ( ) ও বেশি স্টক ট্রেডিংয়ের পরিমাণের জন্য প্রায় 100 টি সংস্থার টুইট সংগ্রহ করেছি । আমি যদি পরম ভেরিয়েবলের সাথে সম্পর্কিত করতে পারি r=.282, p.000তবে আমি খুঁজে পাই তবে যখন আমি লগ করা ভার্শনগুলি ব্যবহার করি, তখন আমি সন্ধান করি r=.488, p=.000

আমি বুঝতে পারি না যে গবেষকরা মাঝে মাঝে তাদের ভেরিয়েবলগুলির লগ করা সংস্করণগুলি কেন ব্যবহার করেন এবং আপনি যদি এটি করেন তবে কেন পারস্পরিক সম্পর্ক এত বেশি হয়। এখানে যুক্তি কী, এবং লগড ভেরিয়েবলগুলি ব্যবহার করা কেন ঠিক আছে?

আপনার সাহায্য ব্যাপকভাবে প্রশংসা করা হয় :-)


1
আপনি যদি পৃষ্ঠার নীচের ডানদিকে সম্পর্কিত থ্রেডগুলি দেখেন লোগারিদমের ব্যবহার এর আগে কয়েকবার coveredাকা পড়েছে। বিশেষত দেখুন, লিনিয়ার রিগ্রেশন-এ, প্রকৃত মানগুলির পরিবর্তে স্বতন্ত্র ভেরিয়েবলের লগটি ব্যবহার করা কখন উপযুক্ত?
অ্যান্ডি ডাব্লু

উত্তর:


24

লগড ভেরিয়েবলগুলি ব্যবহারের কারণগুলি দুটি বিভাগে পড়ে: পরিসংখ্যানগত এবং সংক্ষিপ্ত।

পরিসংখ্যানগতভাবে, যদি আপনার ভেরিয়েবলগুলি ডান-স্কু হয় (অর্থাৎ তাদের উচ্চ প্রান্তে একটি দীর্ঘ লেজ থাকে) তবে পারস্পরিক সম্পর্ক বা প্রতিরোধের মতো একটি পদক্ষেপ এক বা উভয় ক্ষেত্রে উচ্চ প্রান্তে এক বা কয়েকটি ক্ষেত্রে অনেকগুলি প্রভাবিত হতে পারে ভেরিয়েবল (আউটলিয়ার, লিভারেজ পয়েন্ট, প্রভাবশালী পয়েন্ট)। লগ গ্রহণ করা স্কিউ হ্রাস বা বাদ দিয়ে এটিকে সহায়তা করতে পারে।

তাত্পর্যপূর্ণভাবে, কিছু ধারণাগুলি পার্থক্যের চেয়ে অনুপাতের দিক থেকে ভাল বিবেচনা করা হয়। আপনি আলোচনা করেছেন যে দুটি ভলিউম ব্যবস্থা গ্রহণ করুন। এখন, দুটি সংস্থার তুলনা করুন: একটি নাসডাকের উপর একটি ছোট সংস্থা ট্রেডিং করছে যা খুব কম লোকই শুনেছিল, অন্যটি একটি মেগা কর্পোরেশন। প্রাক্তন প্রতিদিন খুব কম টুইট পাবেন। পরেরটি অনেক পাবে; একইভাবে ব্যবসায়ের পরিমাণের জন্য। মনে করুন (কেবল সংখ্যা বাছাই করার জন্য) সেই সংস্থা এ সাধারণত দিনে 100 টি টুইট করে এবং পরবর্তীটি 100,000 করে ,000

যদি কোম্পানির এগুলির টুইটগুলি 100 থেকে 500 পর্যন্ত চলে যায় (400 এর একটি পার্থক্য, 5 এর একটি অনুপাত) যে বিশাল খবর - কিছু অবশ্যই চলছে। তবে যদি বি বি 100,000 থেকে 100,400 (400 এর পার্থক্য, একটি অনুপাত 1 এর খুব কাছাকাছি) পর্যন্ত চলে যায় তবে কেউই পাত্তা দেয় না। মোটামুটি সমতুল্য এটি যদি 100,000 থেকে 500,000 এ চলে যায়।


আপনার দ্রুত উত্তরের জন্য ধন্যবাদ. আপনার উত্তর থেকে আরও দুটি প্রশ্ন আসে। প্রথমত, যদি আমার কোনও অবজেক্টের (স্টক ট্রেডিংভলিউম, রিটার্ন, এবং অস্থিরতা) জন্য 3 টি বৈশিষ্ট্য থাকে এবং তাদের মধ্যে একটির জন্য লগ ইন করা সংস্করণটি গ্রহণ করি? আপনি সংস্থা এবং বি এর টুইটগুলির জন্য যা বলছেন, সেগুলি তাদের রিটার্নের জন্যও গণনা করতে পারে: যদি সংস্থা এ স্টক 1 টোট 1,50 থেকে বৃদ্ধি পায় তবে রিটার্নগুলি (50%) 0.50 হয়। একইভাবে% পুনর্বার জন্য কোম্পানির বি 400 থেকে 600 (200) বৃদ্ধি পাবে। এবং এটি থেকে উদ্দীপনা: যদি রিটার্নগুলি নেতিবাচক হয় তবে এলএন (-0.50) স্পষ্টতই কাজ করে না। তাহলে কি এটি -LN (0.50) নেওয়ার অনুমতি রয়েছে?
PR0no

এছাড়াও, আমি যদি সঠিকভাবে বুঝতে পারি, লগড ভেরিয়েবল নেওয়া কোনও নিখরচায় পছন্দ নয় - এটি স্কউনেস-চার্ট (স্ট্যাটিস্টিকালি) দ্বারা যুক্তিযুক্ত হতে হবে? এবং সংক্ষিপ্তভাবে লগইন নেওয়ার জন্য কেবল আরও যুক্তিসঙ্গত যুক্তি যা আসলে এটি করার জন্য প্রোফাইফ সরবরাহ করে? অন্য কথায়, এখানে থাম্বের নিয়ম রয়েছে, উপরে থ্রেশহোল্ডগুলি সংজ্ঞায়িত করা হচ্ছে যার উপরে আপনার লগ করা সংস্করণ নেওয়া উচিত বা এটি কোনও ব্যাখ্যার বিষয়?
PR0no

1
আপনি এই ক্ষেত্রে শতাংশের লগ নিতে চান না: শতাংশ নেওয়া লগটি যা করবে তা করে। যে, এটি জিনিস অনুপাত করে তোলে। অবশ্যই আপনি কিছু ভেরিয়েবলের লগ নিতে পারেন অন্যকে নয়। লগটি নেওয়ার জন্য স্কিউনেস চার্টের প্রয়োজন হয় না, তবে সাধারণত যে ভেরিয়েবলগুলি লগ করা উচিত তা ডান-স্কু হয়। তবে মূল জিনিসটি পদার্থ । যদি এটি লগটি নেওয়ার কোনও সুস্পষ্ট ধারণা তৈরি করে না, তবে এটি করবেন না। পরিবর্তে, পরিসংখ্যানগত পদ্ধতিগুলি ব্যবহার করুন যা স্কিউ ভেরিয়েবলগুলির সাথে কাজ করে। সাবস্ট্যান্স প্রথম আসে।
পিটার ফ্লুম - মনিকা পুনরায়
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.