当前位置: X-MOL 学术Arch. Computat. Methods Eng. › 论文详情
Our official English website, www.x-mol.net, welcomes your feedback! (Note: you will need to create a separate account there.)
Crowdsourcing: Descriptive Study on Algorithms and Frameworks for Prediction
Archives of Computational Methods in Engineering ( IF 9.7 ) Pub Date : 2021-04-04 , DOI: 10.1007/s11831-021-09577-8
K. Dhinakaran , R. Nedunchelian , A. Balasundaram

Data mining, data analytics and data processing are three inter-related processes that are carried out on large volume of datasets. Data can be of any form such as text, numeric, ontology, alpha-numeric, images, video, and other multi-dimensional datasets. People dataset is one of the famous datasets from the above datasets. Crowdsourcing is used to solve the large size of data with people. The crowdsourcing input will be from a group of people by collecting a large number of people and analysis it is one the emerging technology, which initiate a new model for big data mining process. To define the nature of data, data mining is one of the traditional process for the exert in analytics domain. Data mining is an expensive process and it also take long time to complete the process. In industry and research area, crowdsourcing has become a very active component. Crowdsourcing uses smart phone users as volunteers and share their annotation process for different type of contributions. This paper is used to review about the bigdata mining from crowdsourcing in recent years. Using crowdsourcing the opportunities and challenges of data analytics are reviewed, and summarize the data analytics framework. Then it is discussed several algorithms of including applications, cost control, quality control, latency control and big data mining framework which must be consider in the field of crowdsourcing. Finally, the conclusion of this project tells about the data mining limitation and give some suggestions for future research in crowdsource data analytics.



中文翻译:

众包:对预测算法和框架的描述性研究

数据挖掘,数据分析和数据处理是在大量数据集上执行的三个相互关联的过程。数据可以采用任何形式,例如文本,数字,本体,字母数字,图像,视频和其他多维数据集。人数据集是上述数据集中著名的数据集之一。众包用于与人一起解决海量数据。众包输入将来自一群人,收集了大量的人,并分析这是一项新兴技术,它为大数据挖掘过程提出了一种新模式。为了定义数据的性质,数据挖掘是在分析领域中发挥作用的传统过程之一。数据挖掘是一个昂贵的过程,并且还需要很长时间才能完成该过程。在工业和研究领域,众包已成为非常活跃的组成部分。众包将智能手机用户用作志愿者,并针对不同类型的贡献共享他们的注释过程。本文用于回顾近年来来自众包的大数据挖掘。使用众包,对数据分析的机遇和挑战进行了回顾,并总结了数据分析框架。然后讨论了众包领域必须考虑的几种算法,包括应用,成本控制,质量控制,延迟控制和大数据挖掘框架。最后,该项目的结论说明了数据挖掘的局限性,并为将来在众包数据分析中的研究提供了一些建议。众包将智能手机用户用作志愿者,并针对不同类型的贡献共享他们的注释过程。本文用于回顾近年来来自众包的大数据挖掘。使用众包,对数据分析的机遇和挑战进行了回顾,并总结了数据分析框架。然后讨论了众包领域必须考虑的几种算法,包括应用,成本控制,质量控制,延迟控制和大数据挖掘框架。最后,该项目的结论说明了数据挖掘的局限性,并为将来在众包数据分析中的研究提供了一些建议。众包将智能手机用户用作志愿者,并针对不同类型的贡献共享他们的注释过程。本文用于回顾近年来来自众包的大数据挖掘。使用众包,对数据分析的机遇和挑战进行了回顾,并总结了数据分析框架。然后讨论了众包领域必须考虑的几种算法,包括应用,成本控制,质量控制,延迟控制和大数据挖掘框架。最后,该项目的结论说明了数据挖掘的局限性,并为将来在众包数据分析中的研究提供了一些建议。使用众包,对数据分析的机遇和挑战进行了回顾,并总结了数据分析框架。然后讨论了众包领域必须考虑的几种算法,包括应用,成本控制,质量控制,延迟控制和大数据挖掘框架。最后,该项目的结论说明了数据挖掘的局限性,并为将来在众包数据分析中的研究提供了一些建议。使用众包,对数据分析的机遇和挑战进行了回顾,并总结了数据分析框架。然后讨论了众包领域必须考虑的几种算法,包括应用,成本控制,质量控制,延迟控制和大数据挖掘框架。最后,该项目的结论说明了数据挖掘的局限性,并为将来在众包数据分析中的研究提供了一些建议。

更新日期:2021-04-04
down
wechat
bug