欢迎关注天善智能,我们是专注于商业智能BI,人工智能AI,大数据分析与挖掘领域的垂直社区,学习,问答、求职一站式搞定!
作者:挖数 腾讯数据产品经理 & 段子手
说说我最近了解的在线教育行业的大数据应用。
教育行业主要有2块数据:
1、题库数据:比如初高中阶段,大概有3000多个考点,而每个考点下面又有几百上千道例题,这样就构成了一个上亿条的例题数据库;
2、学情数据:简单地说,就是学生在每一个考点下面形成的个性化的强弱程度的评分,比如全国初高中学生大概有1亿人,这1亿人在3000多个考点下面又各自有自己的强弱评分,这样就构成了一个几千亿条的学情数据库。
如果构建了这2块数据并进行打通,对学生的成绩提高,及对学校教学资源分配效率的提高是巨大的。
过去,这2块数据是这样构建的:
1、题库数据:简单地说,就是各种辅导书、参考书、上课笔记等,这些纸质的书散落在各个地方,查看不方便,各种书之间的知识点也不能互相打通,同时你也无法把市面上所有书都买下来,题库数量有限;
2、学情数据:简单地说,就是考试,学生通过每个阶段的考试,获取自己的学情反馈,但考试获取的是一个总体的分数,无法精细到每个知识点反馈你的学习情况,同时考试的时间成本太高,没法天天进行,因此无法实时反馈你的学习情况,再者纸质的试卷难以保存,容易丢失更难以结构化地构建个性化的学情数据。
从以上可以看到,传统的数据构建方法,有非常大的提升空间。
因此最近2年在线教育的大数据应用,主要在于:
1、如何更高效地构建题库数据;
2、如何让用户更高效地获取题库数据和学情数据。
由此而萌生的创业公司,规模较大的有小猿搜题、作业帮、学霸君3家。
在第1点,如何更高效构建题库数据方面,3家都是通过
1、向出版社及民营教辅出版机构购买试卷和答案
2、用户上传
通过以上方式不断积累题目的同时,又通过人工或者智能匹配的方式,给题目挂上各种知识点、难易度、中高考真题、类型题、时间、区域等标签,形成一个庞大的,每道题都有各自多维标签的题库。
而在第2点,如何让用户更高效地获取题库数据和学情数据方面,3家主要通过让学生对着教辅书的题目拍照这个操作,让学生在几秒内,就能获取到该题目的答案、知识点,甚至是跟该题目相似的关联题目,而这就涉及到机器学习方面的技术,因为在识别学生上传的照片的过程中,需要对字符、公式等进行定位、切分,然后再对应地在题库里进行关联匹配。
打着拍照即得答案这个卖点,3家公司迅速圈得一批用户。
用户有了,接下来是如何盈利,这些公司主要有以下2个盈利方式
1.发展线上教育,卖课程
2. 卖打包的题库
势如破竹的发展,和清晰的盈利模式,也让这些公司能够轻易地开展融资:
2017年1月,学霸君宣布获得1亿美元C轮融资;
2017年5月,小猿搜题宣布获得1.2亿美元E轮融资;
2017年8月,作业帮宣布获得1.5亿美元C轮融资。
这种规模,跟2017年1月获得D轮1亿美元融资的知乎是相当的。
靠着开放二胎的风口,未来的互联网教育公司会越来越多,相信大数据在这个行业会有越来越多的应用场景。
=THE END=
作者:天善智能
链接:https://www.jianshu.com/p/3cdd7a378e16