বেনামে পরিমাপ করা সংখ্যার পূর্বাভাসকারীদের সাথে কীভাবে নামার.ই প্রতিযোগিতাটি পাবেন?


9

নিউমার.ই এখন কিছুটা সময় হয়ে গেছে এবং ওয়েবে কেবলমাত্র কয়েকটি পোস্ট বা অন্যান্য আলোচনা রয়েছে বলে মনে হচ্ছে।

সিস্টেম সময়ে সময়ে পরিবর্তিত হয়েছে এবং আজ সেটআপটি নিম্নলিখিত:

  1. [0,1] এবং বাইনারি টার্গেটে অবিচ্ছিন্ন মান সহ 21 টি বৈশিষ্ট্য সহ ট্রেন (এন = 96 কে) এবং পরীক্ষা (এন = 33 কে) ডেটা।
  2. ডেটা পরিষ্কার (কোনও মূল্য নেই) এবং প্রতি 2 সপ্তাহে আপডেট হয়। আপনি আপনার পূর্বাভাস (পরীক্ষার সেটটিতে) আপলোড করতে এবং লগ-ক্ষতি দেখতে পারেন। পরীক্ষার ডেটার অংশটি হ'ল লাইভ ডেটা এবং আপনি ভাল পূর্বাভাসের জন্য অর্থ প্রদান করেন।

আমি যা আলোচনা করতে চাই:

বৈশিষ্ট্যগুলি সম্পূর্ণ বেনামে থাকাকালীন আমি মনে করি যে খুব বেশি বৈশিষ্ট্যযুক্ত ইঞ্জিনিয়ারিং আমরা করতে পারি না। সুতরাং আমার পদ্ধতির খুব যান্ত্রিক:

  1. অনুপ্রাণিত দ্বারা এই আমি একটি শ্রেণীবিভাগ অ্যালগরিদম ব্যবহার করেন প্রশিক্ষণ ডেটা যা আমার টেস্ট ডেটার সেরা মাপসই করা হবে ফিল্টার করার জন্য।
  2. কিছু সুন্দর প্রাকপ্রসেসিং বের করুন
  3. সুন্দর শ্রেণিবদ্ধকরণ অ্যালগরিদম প্রশিক্ষণ
  4. তাদের ensembles তৈরি (স্ট্যাকিং, ..)।

কংক্রিট প্রশ্ন:

পদক্ষেপ 1 সম্পর্কিত: আপনার কি এই জাতীয় পদ্ধতির অভিজ্ঞতা আছে? ধরা যাক আমি ট্রেনের নমুনাগুলির পরীক্ষার সাথে সম্পর্কিত হওয়ার সম্ভাবনাটি আদেশ করি (সাধারণত 0.5 এর নীচে) এবং তারপরে আমি বৃহত্তম কে সম্ভাব্যতা গ্রহণ করি। আপনি কে কে বেছে নেবেন? আমি 15 কে দিয়ে চেষ্টা করেছি .. তবে প্রধানত 3 ধাপে প্রশিক্ষণের গতি বাড়ানোর জন্য একটি ছোট প্রশিক্ষণের ডেটা সেট করা আছে।

পদক্ষেপ 2 সম্পর্কিত: ডেটা ইতিমধ্যে 0,1 স্কেলে। আমি যদি কোনও (পিসিএ লাইক) লিনিয়ার ট্রান্সফর্মেশন প্রয়োগ করি তবে আমি এই স্কেলটি ভেঙে ফেলব। আপনি যদি এমন সংখ্যাসূচক ডেটা রাখেন এবং এটি আসলে কী তা জানেন না তবে আপনি প্রিপ্রোসেসিংয়ে কী চেষ্টা করবেন?

PS: আমি জানি যেহেতু numer.ai এই বিষয়ে আলোচনা করা লোককে অর্থ প্রদান করে তা আমাকে কিছু অর্থোপার্জনে সহায়তা করতে পারে। তবে এটি সর্বজনীন হওয়ায় এখানকার যে কাউকে সাহায্য করবে ...

পিপিএস: আজকের লিডারবোর্ডটিতে একটি আকর্ষণীয় প্যাটার্ন রয়েছে: 0.64xx এর লগলাস সহ শীর্ষ দুটি, তারপরে 0.66xx সহ 3 নম্বরে এবং তারপরে বেশিরভাগ ভবিষ্যদ্বাণী 0.6888x এ পৌঁছে যায়।

সুতরাং এখানে খুব ছোট একটি শীর্ষ ক্ষেত্র এবং প্রচুর পরিমিতরূপে সফল ছেলে আছে (আমাকে সহ) বলে মনে হচ্ছে।

উত্তর:


2

আমি পদ্ধতির দিকে নজর রেখেছি এবং আমি কে কে একটি ব্যাপ্তি, অর্থাৎ 5 কে, 10 কে, 15 কে ইত্যাদির মাধ্যমে বেছে নিয়েছি এবং তারপরে যে ফলাফলটি সবচেয়ে ভাল ফলাফল হয় তার সীমাটি অন্বেষণ করে বলি সেরা 15k হয় তবে আমি 13, 14 করতে পারি, 15, 16, 17 এবং তাই।

এখনও পর্যন্ত আমি কোনও প্রাক-প্রক্রিয়াকরণ কার্যকর হতে পাইনি।

মন্তব্যের জবাব:

আমি লজিস্টিকআগ্রেশন, এসভিএম, নিউরাল নেটওয়ার্কস, র‌্যান্ডমফোরসেটস, মাল্টিনোমিয়াল এনবি, অতিরিক্ত গাছ ব্যবহার করার চেষ্টা করেছি। নিউরাল নেটওয়ার্ক ব্যতীত সমস্ত স্কলারনে প্রয়োগগুলি ব্যবহার করে। এনএন এর জন্য পাইব্রাইন।


আপনি আরও কিছু বিশদ যুক্ত করতে পারেন? হ্যাঁ, আমরা বিভিন্ন আকারের ডেটা প্রশিক্ষণের চেষ্টা করি। আপনি কোন প্রাক প্রসেসিংয়ের চেষ্টা করেছেন? কোন শ্রেণিবদ্ধ? ধন্যবাদ!
রিচার্ড
আমাদের সাইট ব্যবহার করে, আপনি স্বীকার করেছেন যে আপনি আমাদের কুকি নীতি এবং গোপনীয়তা নীতিটি পড়েছেন এবং বুঝতে পেরেছেন ।
Licensed under cc by-sa 3.0 with attribution required.