大数据都是怎么收集的 如何做大数据的数据采集?
浏览量:1222
时间:2023-02-08 17:46:57
作者:采采
如何获取大数据?
大数据的数据来源主要有三个,即物联网系统、传统信息处理系统和互联网应用(Web和App),因此需要从这三个渠道获取大数据。
物联网系统产生的数据在大数据中占有重要比重,物联网产生的数据多为非结构化数据,包括视频、音频、传感数据等。物联网的应用领域很多,比如工业物联网、农业物联网、汽车互联网、智慧城市等。,会产生大量的数据。通常,这些数据的收集是严格要求的,不能对个人开放。如果个人想要获取这部分数据,比较可行的方案是与数据采集者合作,比如做数据分析等服务。
传统的信息系统涵盖的领域非常广泛,包括政务系统、企业ERP、教育信息系统、医疗信息系统等。传统信息系统覆盖的数据多为结构化数据,往往具有较高的准确性和相关性,这部分数据的价值密度相对较高。
而传统信息系统所覆盖的数据往往涉及个人隐私、商业秘密等内容,因此这部分内容通常受到严密保护。随着大数据技术的发展,业界对于政务系统数据开放的呼声越来越高。脱敏数据往往不会侵犯个人隐私,所以未来一些政务系统的大数据会陆续开放。
互联网应用也是产生大数据的重要基础之一,包括各种Web应用和大量App产品。这部分数据多为半结构化,数据内容也难辨真假。但由于这部分数据的价值密度相对较高,现在很多互联网公司 "肖像 "用户根据这些数据,从而做出多维分类。
1.基于web服务器的日志收集。谁在访问网站,用户访问网站的路径,用户在每个页面停留的时间,用户离开网站的位置,用户是否成功完成自己想做的事情等等。
2.客户端收集用户行为数据。通过对用户各个模块的点击率、点击量、访问量,以及用户的停留时间、访问量的数据抓取。
版权声明:本文内容由互联网用户自发贡献,本站不承担相关法律责任.如有侵权/违法内容,本站将立刻删除。