当前位置: X-MOL 学术Pers. Ubiquitous Comput. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Enhancement learning on financial text data
Personal and Ubiquitous Computing Pub Date : 2021-01-02 , DOI: 10.1007/s00779-020-01497-x
Xiliu Man , Jianwu Lin

With the fast development of natural language processing (NLP), financial text data processing has gained much attention due to its huge potential business value. Deep learning model based on manual perception-based labeling is commonly used to illustrate implicit meanings behind financial text. However, such manual labeling is costly and subjective, and may not perform well due to its weak link with direct financial trading. This paper therefore proposes a novel learning model called Enhancement Learning (EL) on financial text data by using task-based labeling. Financial text often has its application task. The derived financial trading data from such task called task-based label is objective and links to certain characters of financial text. Compared to model trained only on manual labels, EL consists of two models trained by manual perception-based labels and derived task-based labels respectively. Then, the task-based model will be used as main model to produce initial judgment on text, with the perception-based model as a filter to drop cases which are different from common perception. This task-oriented perception-enhanced approach can improve the performance of financial text data due to its direct link with financial task and further verification from perception. This paper illustrates the proposed Enhancement Learning on financial text data by the case in stock return prediction. Numerical experiments show that EL performs better than both the perception-based model and the task-based model.



中文翻译:

金融文本数据的增强学习

随着自然语言处理(NLP)的快速发展,金融文本数据处理由于其巨大的潜在业务价值而备受关注。基于手动感知的标签的深度学习模型通常用于说明金融文本背后的隐含含义。但是,这样的手动标记既昂贵又主观,并且由于与直接金融交易的联系较弱,因此可能效果不佳。因此,本文提出了一种新颖的学习模型,即通过使用基于任务的标签对金融文本数据进行增强学习(EL)。财务文本通常具有其应用任务。从此类任务(称为基于任务的标签)派生的金融交易数据是客观的,并链接到金融文本的某些字符。与仅使用手动标签训练的模型相比,EL包含两个模型,分别由基于手动感知的标签和派生基于任务的标签训练。然后,基于任务的模型将用作主要模型,以对文本进行初步判断,而基于感知的模型将作为过滤器,以过滤掉与普通感知不同的案例。这种面向任务的感知增强方法由于可以与财务任务直接链接并通过感知进行进一步验证,因此可以提高财务文本数据的性能。本文通过股票收益预测中的案例说明了拟议的金融文本数据增强学习。数值实验表明,EL的性能优于基于感知的模型和基于任务的模型。基于任务的模型将用作对文本进行初步判断的主要模型,而基于感知的模型则作为过滤器来过滤与常见感知不同的案例。这种面向任务的感知增强方法由于可以与财务任务直接链接并通过感知进行进一步验证,因此可以提高财务文本数据的性能。本文以股票收益预测中的案例为例,说明了对金融文本数据的改进学习方法。数值实验表明,EL的性能优于基于感知的模型和基于任务的模型。基于任务的模型将用作对文本进行初步判断的主要模型,而基于感知的模型则作为过滤器来过滤与常见感知不同的案例。这种面向任务的感知增强方法由于可以与财务任务直接链接并通过感知进行进一步验证,因此可以提高财务文本数据的性能。本文通过股票收益预测中的案例说明了拟议的金融文本数据增强学习。数值实验表明,EL的性能优于基于感知的模型和基于任务的模型。这种面向任务的感知增强方法由于可以与财务任务直接链接并通过感知进行进一步验证,因此可以提高财务文本数据的性能。本文通过股票收益预测中的案例说明了拟议的金融文本数据增强学习。数值实验表明,EL的性能优于基于感知的模型和基于任务的模型。这种面向任务的感知增强方法由于可以与财务任务直接链接并通过感知进行进一步验证,因此可以提高财务文本数据的性能。本文通过股票收益预测中的案例说明了拟议的金融文本数据增强学习。数值实验表明,EL的性能优于基于感知的模型和基于任务的模型。

更新日期:2021-01-02
down
wechat
bug