الگوریتم تطبیق عمیق نوآورانه برای انتخاب نمونه کارها سهام با استفاده از پروفایل سهام عمیق

  • 2022-06-27

Ganggang Guo ، مفهوم سازی ، درمان داده ها ، تجزیه و تحلیل رسمی ، کسب بودجه ، تحقیق ، روش شناسی ، نظارت ، اعتبار سنجی ، تجسم ، نوشتن - پیش نویس اصلی ، نوشتن - بررسی و ویرایش ، 1 ، * Yulei Rao ، درمان داده ، تجزیه و تحلیل رسمی ، کسب بودجه ، کسب بودجه ، کسب بودجه ، کسب بودجه ، کسب بودجه ، کسب بودجه ، کسب بودجهبررسی ، متدولوژی ، نوشتن - بررسی و ویرایش ، 1 Feida Zhu ، Data Curation ، تجزیه و تحلیل رسمی ، بررسی ، روش شناسی ، اعتبار سنجی ، تجسم ، نوشتن - بررسی و ویرایش ، 2 و Fang Xu ، مفهوم سازی ، درمان داده ها ، تملک بودجه ، روش ، نظارت، نوشتن - پیش نویس اصلی ، نوشتن - بررسی و ویرایش 3 ، *

Ganggang Guo

1 دانشکده تجارت ، دانشگاه مرکزی جنوبی ، چانگشا ، چین

یولی رائو

1 دانشکده تجارت ، دانشگاه مرکزی جنوبی ، چانگشا ، چین

فیدا زو

2 دانشکده سیستم های اطلاعاتی ، دانشگاه مدیریت سنگاپور ، جاده استمفورد ، سنگاپور ، سنگاپور

نیش

3 بیمارستان مرکزی Xiangtan ، پایگاه عمل بالینی دانشگاه مرکزی جنوبی ، شیانگتان ، چین

2 دانشکده سیستم های اطلاعاتی ، دانشگاه مدیریت سنگاپور ، جاده استمفورد ، سنگاپور ، سنگاپور

این یک مقاله دسترسی آزاد است که تحت شرایط مجوز انتساب Creative Commons توزیع شده است ، که امکان استفاده ، توزیع و تولید مثل بدون محدودیت در هر رسانه را فراهم می کند ، مشروط بر اینکه نویسنده و منبع اصلی اعتبار داشته باشند.

داده های مرتبط

پرونده S1: توضیحات روش برای مدل طبقه بندی احساسات متن چینی در زمینه مالی و الگوریتم های تطبیق متن عمیق در این مطالعه.(PDF)

پرونده S2: رتبه بندی پیش بینی شده برای گروهی از سهام در جهان سهام توسط مدل های Rfranker از 2013-01-07 تا 2017-10-16.(CSV)

پرونده S3: رتبه بندی پیش بینی شده برای گروهی از سهام در جهان سهام توسط مدل های TS-Deep-LTM از 2013-01-07 تا 2017-10.(CSV)

پرونده S4: ترکیبی از ویژگی های فاکتورهای پروفایل و داده های پروفایل سهام برای هر سهام در جهان سهام از 2010-05-10 تا 2017-10-16.(CSV)

پرونده S5: لیست سهام موجود در جهان سهام ، تمام تاریخ معاملات هفتگی برای کل نمونه ها از 2013-01-07 تا 2017-10-16 و رتبه بندی برچسب های همه سهام در هر تاریخ معاملات هفتگی.(CSV)

پرونده S6: سوابق تنظیم موقعیت استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S7: ترکیبات بهینه پارامتر پس از تنظیم پارامترهای بیش از حد در آموزش مدل TS-Deep-LTM در گروهی از داده های آموزش (2013-01-07).(CSV)

پرونده S8: بازده تجمعی استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S9: بازده ماهانه استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S10: ALFA از استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S11: بتای استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S12: نسبت های شارپ استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S13: نوسانات استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S14: نسبت اطلاعات استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش پشتی از 2013-01 تا 2017-10.(CSV)

پرونده S15: حداکثر پیش بینی استراتژی های معاملاتی بر اساس مدل های TS-Deep-LTM در آزمایش Backtesting از 2013-01 تا 2017-10.(CSV)

کلیه داده های مربوطه در داخل مقاله و پرونده های اطلاعاتی پشتیبانی آن قرار دارند.

چکیده

ساخت یک سبد سهام قابل اعتماد همچنان یک مسئله باز در سرمایه گذاری کمی است. مدل های یادگیری ماشین چندگانه برای انتخاب نمونه کارها سهام آموزش دیده اند ، اما کاربرد عملی آنها به دلیل چالش های ناشی از مشخصه نسبت سیگنال به نویز کم (SNR) ، ماهیت داده های سری زمانی و غیر محدود است. توزیع یکسان مستقل در داده های مالی. در اینجا ، ما وظیفه انتخاب سهام را به یک مشکل تطبیق بین گروهی از سهام و یک هدف انتخاب سهام تبدیل کردیم. ما یک الگوریتم بازنمایی جدید از هدف انتخاب سهام و یک الگوریتم تطبیق عمیق رمان (TS-Deep-LTM) ارائه دادیم. سپس ما یک روش پروفایل سهام عمیق را برای استخراج ترکیب بهینه از ویژگی ها پیشنهاد کردیم و یک مدل تطبیق عمیق را بر اساس الگوریتم TS-Deep-LTM برای انتخاب نمونه کارها سهام آموزش دادیم. به خصوص ، الگوریتم TS-Deep-LTM با تنظیم شاخص های آماری برای فیلتر و ادغام سه الگوریتم تطبیق متن عمیق بدست آمد. این طراحی چارچوب موازی باعث شده است که در گرفتن سیگنال ها از داده های سری زمانی و سازگاری با داده های توزیع شده غیر مستقل خوب باشد. سرانجام ، ما از مدل پیشنهادی برای انتخاب سهام استفاده کردیم و استراتژی های نمونه کارها را فقط از سال 2010 تا 2017 آزمایش کردیم. ما نشان دادیم که بازده های تنظیم شده با ریسک به دست آمده توسط استراتژی های نمونه کارها ما فراتر از مواردی است که توسط شاخص CSI300 به دست آمده و رویکردهای یادگیری به رتبه در طولهمان دوره

معرفی

انتخاب نمونه کارها سهام به دنبال تخصیص بهینه دارایی در بین اوراق بهادار است به گونه ای که سرمایه گذاری سودآورترین بازده را به دست می آورد ، در حالی که عدم تمرکز ریسک سرمایه گذاری است. کار تحقیقاتی پیشگام در مورد تئوری انتخاب نمونه کارها ، مدل میانگین واریانس (M-V) است [1] ، که اگر گروهی از سهام کاملاً با همبستگی نباشند ، تنوع نمونه کارها می توانند بازده را نگه دارند در حالی که به حداقل می رسد واریانس یا ، به طور معادل ، ریسک و ریسک ، و ریسک و ریسک و ریسک و ریسک و ریسکریسک غیر سیستماتیک می تواند از لحاظ نظری صفر باشد. محققان با الهام از مدل M-V Markowitz ، از رویکردهای کمی برای غنی سازی و بهبود نظریه انتخاب مدرن و روش های تمرین استفاده کرده اند [2-5]. یکی از پرکاربردترین آنها استراتژی انتخاب سهام چند عاملی است. رویکرد سنتی چند عاملی از یک مدل ریسک چند عاملی ساختار یافته استفاده می کند و سه مرحله از جمله کشف عاملی ، غربالگری عامل و مدل سازی انتخاب سهام را برای به دست آوردن استراتژی های کمی دنبال می کند [6]. با ارتقاء برنامه های فناوری هوش مصنوعی ، الگوریتم های یادگیری ماشین در کشف فاکتور و مدل سازی انتخاب سهام شروع به کار کرده اند [7–11]. نمونه هایی از جمله کشف عوامل جدید از داده های رسانه های اجتماعی با فن آوری های معدنکاری متن [8] و ساخت مدل های انتخاب سهام یادگیری ماشین پس از تبدیل مشکلات انتخاب سهام به طبقه بندی ، رگرسیون ، خوشه بندی یا مشکلات بهینه سازی مبتنی بر قانون [9-13]. بیشتر این مطالعات بر روی ساخت اوراق بهادار سهام توسط مدلهای انتخاب سهام متمرکز است که پیش بینی شاخص های مطلق مانند بازده ، حجم معاملات و نوسانات را هدف قرار می دهد [14 ، 15].

با این حال ، این مدل های انتخاب سهام به دلیل چالش های ناشی از مشخصه نسبت سیگنال به نویز کم (SNR) ، ماهیت سری زمانی و توزیع یکسان غیر مستقل (غیر IID) در مالی ، کاربرد عملی محدودی دارند. داده ها [16]. به طور خاص ، پیش بینی بازده سهام می تواند به عنوان یک مشکل رگرسیون برای داده های سری زمانی در نظر گرفته شود. الگوریتم های شبکه عصبی [17] و الگوریتم های یادگیری عمیق (به عنوان مثال ، RNNS و LSTM) [18] معمولاً استفاده می شوند. SNR اندازه گیری خوبی از اعوجاج در حوزه زمان بین سیگنال اصلی و بازسازی شده است [19]. داده های مالی موجود در قالب سری زمانی معمولاً با نوسانات زیاد سر و صدای غیر ثابت و غیرمعمول همراه است [20] ، و در نتیجه مشخصه آن از SNR کم است. بنابراین برای مدلهای رگرسیون دشوار است که سیگنال های بازسازی شده کافی را در فرایند آموزش ضبط کنند تا پیش بینی های نهایی با نرخ خطای بالا بدست آورند. از طرف دیگر ، پیش بینی فراز و نشیب قیمت سهام می تواند به عنوان یک مشکل طبقه بندی تعریف شود. الگوریتم های طبقه بندی ، مانند دستگاه های بردار پشتیبانی [21] ، جنگل های تصادفی [22] و شبکه های عصبی حلقوی (CNN) [23] به طور معمول استفاده می شوند. این نوع رویکرد ممکن است به دقت بالایی برسد ، اما همیشه با بازده بالا از استراتژی تجارت همراه نیست. به عنوان مثال ، یک پیش بینی صحیح توسط مدل ممکن است تنها سود کمی داشته باشد. پیش بینی نادرست گاه به گاه ممکن است باعث ضرر بزرگی شود. بنابراین ، خطرات نزولی قابل توجهی همچنان ادامه دارد. یا پیش بینی گروه ها یا خوشه هایی که سهام آنها با توجه به قیمت یا بازده تعلق دارند می توانند به عنوان یک مشکل خوشه بندی در نظر گرفته شوند. خوشه بندی سلسله مراتبی [24] و خوشه بندی K- به معنای [25] اغلب برای ساخت مدل های انتخاب سهام استفاده می شود. این روش می تواند یک سبد سهام را با نوسانات مشابه بازده بدست آورد ، اما روش با بالاترین بازده آینده پیش بینی شده را نمی توان مستقیماً بدست آورد. سرانجام ، پیش بینی شاخص های مطلق می تواند به عنوان یک مشکل بهینه سازی مبتنی بر قانون تدوین شود که مؤثرترین عوامل کمیت (به عنوان مثال ، شاخص های تکنیک ها ، اصول و اقتصاد کلان) و پارامترهای الگوریتم بهینه را به دست می آورد. الگوریتم های بهینه سازی شامل الگوریتم ژنتیکی [26] و یادگیری تقویت [27] است. با این حال ، با توجه به آموزش مدل با تکیه بر پارامترهای متعدد ، اولیه سازی تجربی و دوره های محاسبات طولانی ، این نوع روش ناقص است. این روش ممکن است با استفاده از الگوریتم های بهینه سازی و کاربرد محدود منجر به مشکل در مدل های آموزش شود. در مواجهه با نواقص در اجرای این مدل ها برای سرمایه گذاری کمی ، محققان اخیراً تشخیص داده اند که استفاده از شاخص های نسبی به عنوان اهداف پیش بینی مدل های یادگیری ماشین امکان پذیر است. به عنوان مثال ، سونگ و همکاران.[28] وظیفه انتخاب سهام را از منظر رتبه بندی دیدگاه های نسبی سرمایه گذاران در مورد عملکرد سهام تعریف کرد. نویسندگان برای آموزش مدلهای رتبه بندی از یادگیری به درجه (LTR) [29] ، RankNet [30] و ListNet [31] استفاده کردند. این روش پیش بینی بازده سهام را به مقایسه بازده بین دو سهام در گروهی از سهام تبدیل کرده است که این امر توانایی مدل ها را در گرفتن سیگنال های بازسازی در طی فرایند آموزش افزایش می دهد. علاوه بر این ، نویسندگان دیدگاه نسبی از احساسات سرمایه گذاران را به عنوان یک عامل پیش بینی کننده جدید معرفی کردند ، که باعث تقویت سیگنال های بازسازی از داده های آموزش ، افزایش SNR داده های آموزش و در نتیجه عملکرد پیش بینی مدل را بهبود بخشید [32].

با الهام از این یافته، ما از شاخص‌های نسبی به عنوان اهداف پیش‌بینی مدل‌های انتخاب سهام استفاده کردیم و عوامل کمی‌سازی متعدد از جمله احساسات سرمایه‌گذاران را در ترکیب ویژگی‌های داده‌های آموزشی گنجاندیم تا اثرات SNR پایین در داده‌های مالی را تا حدی کاهش دهیم. با این وجود، چالش‌های ناشی از ویژگی‌های سری‌های زمانی و Non-IID در داده‌های مالی همچنان ادامه دارد. در واکنش به این چالش ها، وظیفه انتخاب سهام را به یک مشکل تطبیق بین گروهی از سهام و هدف انتخاب سهام تبدیل کردیم. ما یک الگوریتم تطبیق عمیق جدید برای انتخاب سبد سهام با استفاده از پروفایل های سهام عمیق پیشنهاد کردیم.

روش استخراج ترکیب بهینه از داده های آموزش مستقیم با عملکرد نهایی یک مدل یادگیری ماشین مرتبط است. نظریه قیمت گذاری داوری معتقد است که بازده سهام تحت تأثیر عوامل متعدد قرار می گیرد [3]. محققان بر اساس این تئوری با فاش کردن مجموعه ای از مدل های چند عاملی که فاکتورهای تأثیر بازده سهام مقطعی را کشف کردند. از این میان ، نماینده ترین مدل مدل سه عاملی Fama-French است [5]. عوامل کمی کشف شده توسط این مدلها به یک مبنای اساسی برای استخراج ترکیبات ویژگی از داده های مالی ناهمگن تبدیل شده اند [33 ، 34]. مطالعات تجربی مبتنی بر داده های بورس سهام و صورتهای مالی در امور مالی استاندارد ، چندین فاکتور کمی سنتی را برای ما فراهم کرده است [35-37]. در عصر اطلاعات دیجیتال ، رسانه های اجتماعی که توسط Microblog ، وبلاگ ، جامعه شبکه ، انجمن و غیره ارائه می شود ، به بستر اصلی مبادله اطلاعات و اظهار نظر تبدیل می شود. ذهنیت و درک سرمایه گذاران از اطلاعات بازار می تواند به طور مستقیم بر تصمیمات سرمایه گذاری ، رفتارهای تجاری و حتی بازارهای مالی تأثیر بگذارد [38-40]. این امر به محققان این امکان را می دهد تا تأثیر بیشتری در بازارهای مالی با دقت بیشتری نشان دهند. عوامل تأثیر جدید از داده های رسانه های اجتماعی به طور مداوم در مطالعات تجربی در امور مالی رفتاری کشف می شوند [41 ، 42]. علاوه بر احساسات سرمایه گذار [43 ، 44] ، که توسط محققان دارایی رفتاری ، توجه سرمایه گذار [45 ، 46] ، اختلاف نظر سرمایه گذار [47] و تعامل اجتماعی [48] نشان داده شده است که بر قیمت سهام تأثیر می گذارد. به عنوان مثال ، آندری و همکاران.[47] خاطرنشان كرد كه توجه سرمایه گذار ناقص به اطلاعات بازار در آب و هوای فعلی انفجار اطلاعات می تواند باعث انحراف در پیش بینی ارزش دارایی شود ، به ویژه در بازار اوراق بهادار چین كه در حال گذار بوده و تحت سلطه سرمایه گذاران خرده فروشی است. هیلرت و همکاران.[49] دریافت که شاخص های اختلاف نظر سرمایه گذار با بازده بازار روز بعد که به ویژه در طول رکود اقتصادی بیشتر بود ، با بازده بازار همبستگی منفی داشتند. علاوه بر این ، عوامل کمی در تأمین مالی رفتاری از داده های رسانه های اجتماعی در ساخت استراتژی های معاملاتی استفاده می شود [50-52]. با این وجود ، فقط یک عامل کمی واحد (به عنوان مثال ، احساسات سرمایه گذار) معمولاً برای تولید شاخص های متعدد و طراحی استراتژی های معاملاتی در بیشتر مطالعات استفاده می شود. فاکتورهای کمی مانیفولد مؤثر بر بازده سهام مقطعی به سختی در نظر گرفته نشده است. در این مطالعه ، ما برای اولین بار روشی از پروفایل سهام عمیق را پیشنهاد کردیم که می تواند ترکیب ویژگی بهینه را از داده های مالی ناهمگن استخراج کند. پروفایل سهام شامل عوامل کمی سنتی و جدید بود که به طور سیستماتیک می تواند ویژگی های خطر سهام را نشان دهد.در پرداختن به مشکل تطبیق تعریف شده ما ، ما الگوریتم های نمایشی از ویژگی های سهام و اهداف انتخاب سهام را به طور خلاقانه پیشنهاد کردیم ، یک الگوریتم تطبیق عمیق را ابداع کردیم و یک مدل تطبیق عمیق را برای انتخاب نمونه کارها سهام آموزش دادیم. به طور خاص ، بر اساس پروفایل های سهام ، بردار ویژگی هر سهام به صورت x بیان شد1 × متر، جایی که m ابعاد بردارها را از پروفایل های سهام نشان می داد. با توجه به اینکه داده های مالی در قالب سری زمانی رخ می دهد ، ما به ویندوز (W-1) در بردارهای ویژگی تاریخی هر سهام برگشتیم و نمایندگی ویژگی هر سهام به عنوان ماتریس ویژگی سهام X گسترش یافتw × m

واداین شکل از نمایندگی ویژگی های سهام الگوریتم های یادگیری عمیق را قادر می سازد تا در طی فرآیند آموزش هرچه بیشتر سیگنال های مؤثر را ضبط کنند. سپس ما یک الگوریتم بازنمایی را با توجه به بازده سرمایه گذاری برای تولید ماتریس هدف انتخاب سهام طراحی کردیم. با قیاس با یک مشکل پاسخ به سؤال [53] ، یک ماتریس ویژگی سهام یا یک ماتریس هدف انتخاب سهام به ترتیب معادل بازنمایی هر پاسخ یا سؤال است. بنابراین ، الگوریتم های تطبیق متن عمیق [54] می توانند برای رفع مشکل تطبیق ما معرفی شوند. یک الگوریتم تطبیقی عمیق (یادگیری عمیق به مسابقه برای سری زمانی ، TS-Deep-LTM) برای آموزش مدل تطبیق سهام ابداع شد. الگوریتم TS-Deep-LTM با تنظیم شاخص های آماری برای فیلتر و ادغام سه الگوریتم تطبیق متن عمیق که برای ویژگی های مختلف توزیع داده ها اقتباس شده است ، بدست آمد. طراحی چارچوب موازی TS-Deep-LTM باعث شد تا سیگنال ها از داده های سری زمانی و سازگاری با داده های غیر IID بهتر شود. نکته قابل توجه ، در آموزش مدل ، استراتژی تقسیم داده های آموزش توسط نمونه ها را قادر می سازد تا در داده های آموزش محدود به طور کامل آموخته شوند. سرانجام ، ما از الگوریتم TS-Deep-LTM برای انتخاب سهام استفاده کردیم و استراتژی های پرتفوی طولانی را با استفاده از هشت سال بازار سهام ، صورتهای مالی و داده های رسانه های اجتماعی مالی آزمایش کردیم. از طریق پشتوانه این استراتژی ها از سال 2010 تا 2017 ، ما نشان دادیم که بازده های تنظیم شده ریسک به دست آمده توسط استراتژی های نمونه کارها ما از مواردی که توسط شاخص CSI300 به دست آمده و رویکردهای LTR کلاسیک در همان دوره بهتر است. سهم اصلی این مطالعه ، کاهش کارآمد چالش های ناشی از ویژگی های یک SNR کم ، قالب سری زمانی و داده های مالی غیر IID است و پیشنهاد یک رویکرد تطبیق عمیق برای انتخاب نمونه کارها سهام با استفاده از پروفایل های عمیق سهاموادبرای اکثر مدیران صندوق کمی ، وظیفه آنها دستیابی به بازده مطلق نیست بلکه از یک معیار خاص بهتر است. اوراق بهادار سهام ارائه شده توسط الگوریتم TS-Deep-LTM می تواند باعث شود آنها به ترتیب 30 ٪ یا 2 ٪ -15 ٪ بازده سالانه بالاتر از شاخص CSI300 یا رویکردهای LTR کلاسیک ، به ترتیب ، در کل دوره پشتی عبور از گاو نر و بازارهای خرس را بدست آورند.

بقیه این مقاله به شرح زیر سازماندهی شده است. در بخش بعدی ، ما روش پروفایل عمیق سهام و تعاریف مرتبط با آن را شرح می دهیم ، الگوریتم های LTR را مرور می کنیم و رویکرد تطبیق عمیق را معرفی می کنیم. بخش 3 منابع داده های مالی ، جهان سهام و چهار ترکیب متفاوت از داده های آموزشی را شرح می دهد. بخش 4 روش برچسب زدن و استراتژی پارتیشن بندی را برای داده های آموزش و معیارهای ارزیابی در طی دو مرحله از آزمایش ارائه می دهد. بخش 5 نتایج تجربی مدل های انتخاب سهام و استراتژی های معاملاتی را تجزیه و تحلیل می کند و یک چارچوب سیستم هوشمند برای انتخاب سهام را تشریح می کند. یافته های کلیدی استراتژی های معاملاتی کمی بر اساس پرتفوی سهام و مدلهای تطبیق عمیق مورد بحث قرار گرفته و جهت های تحقیق آینده در بخش 6 ارائه شده است. نتیجه گیری اصلی در بخش 7 خلاصه شده است.

روش شناسی

روش پروفایل سهام عمیق

برچسب ها

ثبت دیدگاه

مجموع دیدگاهها : 0در انتظار بررسی : 0انتشار یافته : ۰
قوانین ارسال دیدگاه
  • دیدگاه های ارسال شده توسط شما، پس از تایید توسط تیم مدیریت در وب منتشر خواهد شد.
  • پیام هایی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • پیام هایی که به غیر از زبان فارسی یا غیر مرتبط باشد منتشر نخواهد شد.