合肥[切换城市][登录][注册]
搜索风云榜 | 免费发布信息 | 会员签到免费发布信息网址大全

我国大数据产业主要影响因素分析

2018-10-19 16:05:03 浏览:95次

  数据质量

  目前,我国大数据需求端以互联网企业为主,覆盖面不广,在O2O趋势下,大型互联网厂商尝试引入外部数据支撑金融、生活、语音、旅游、健康和教育等多种服务。
然而在具体的领域或行业内,我国普遍未形成成型的数据采集、加工、分析和应用链条,大量数据源未被激活,大多数数据拥有者没有数据价值外化的路径。
比如,各医疗健康类应用收集了大量的数据,但没有像Sermo那样面向医药公司售卖数据。
与国外相比我国的政府、公共服务、农业应用基本缺位,电信和银行业更缺少与外部数据的碰撞。
数据质量方面,即便是政府机构这样的权威数据持有方,也存在很多数据缺失、数据错误、噪音多各方面的问题。
理论上我们中国有很多数据,但不同部门数据存在在不同的地方,格式也不一样。
政府内部本身整合各部门的数据就已经是一件很头大的事情,更不要提大规模的数据开放。
同时数据开放面临一个严重问题就是隐私问题,脱敏远远不够,隐私问题是一个无底洞。

  技术水平

  同任何新兴产业一样,科学技术水平是推动产业发展的内在动力,是影响大数据产业发展最重要的因素。
但是目前由于我国科学技术水平等基础条件不够成熟,严重影响了大数据产业的发展速度。
随着大数据概念的火热,做大数据的公司越来越多,产品做得五花八门,但现在数据分析的技术,方法,模型,算法都有了非常大的改进,跟过去六七十年代完全不一样,不是说做几个SAAS软件或者RAAS软件就是大数据了,虽然短期看市场火热,但长远来说这条路是走不通的,大数据行业发展,技术才是真正的发力点,提高行业准入门槛尤为重要。

  其次,中国的数据有它的特色,例如在金融行业,目前大部分银行采用的是风险评分卡,运用专家经验定义风险变量,基于定性认识进行评分,通过事后风险回检优化评分卡,风险预警功能较差。
虽然央行征信中心与国内少数技术领先银行使用的是风险评分模型,但模型方法相对陈旧,如央行所用FICO评分模型为上世纪80年代基于逻辑回归算法构建的评分体系,逻辑回归算法适合处理线性数据,但实际问题往往是非线性的,特别是信用风险评估场景下。
此外,FICO模型没有针对我国具体业务进行场景细分,建模逻辑并不完全符合我国实际情况,因此导致准确率不足,风险预警能力差。

  专业人才

  我们国家大数据发展最大的优势就是市场大,最大的劣势恰巧就是缺乏相应专业人才,人才缺乏的程度非常严重。
首先在国际市场方面,我们要跟国外公司争人才,然而国外大数据行业同样十分火热。
而不论在国内还是国外,跟企业竞争人才都是一项艰巨的事业,比如在世界上最好的大学之一的美国普林斯顿大学,想找数学家也是非常困难,人才很容易被大公司挖走,每年都有非常好的数据分析人才被企业挖走。
所以人才难觅不只是口头说说,更是一个亟待解决的问题。

  目前为止,我们国家仍然没有良好的培育大数据人才的机制,大数据教育主要面临以下三个问题。
首先,大数据是一个交叉学科,涉及统计学,管理,编程等多学科,知识点复杂,培训课程编辑难度大,缺乏系统的学习教程;其次,现阶段大数据教育大多还停留在理论知识上,理论与实战严重脱节,学习者缺乏良好的实践机会;再次,大数据教育的根本目的是为了解决业务上面临的实际问题,用科学的手段推动业务的进展,然而现阶段的大数据教育机构普遍缺乏相应的业务经验,产学研结合并不密切。

“我国大数据产业主要影响因素分析”该信息由会员自行发布。采用请谨慎,不贪小便宜,以防上当!
© 2007 - 2024 版权所有 娃酷网 粤ICP备19125541号-1