产品核心流程第二步为创建数据集,进行数据建模,如果说数据是海,那么创建数据集并合理建模就是划船的浆,有了浆才能在数据的海洋里畅游。目前创建数据集有两种方式:(1)数据表直接创建数据集 (2)通过自定义sql创建数据集,以实现初步建模。
创建数据集:
(1)直接新建数据集:
如下图,在数据源列表页,找到目标表,点击创建数据集按钮并选择存放文件夹 即可新建,新建后自动进入数据集界面。
(2)自定义sql创建数据集:
目前产品支持MaxCompute和MySQL数据源自定义sql创建数据集,可以实现多表关联、新增目标字段等。如下图,点击‘自定义SQL’进入编辑界面:
目前自定义sql有部分规则需要注意:
MySQL
不支持函数列表:
MaxCompute
MaxCompute数据源原生支持函数即可。
常见问题
Q:MaxCompute数据源,为什么搜索不到目标表?
A:(1) MaxCompute数据源新建表需要约30分钟来进行Meta同步,稍等一下哟,要保证同步表的用户AccessID和AccessKey有效。
Q:MaxCompute数据源,创建表提示没有权限?
A:申请权限,保证具有list、select、create instance权限。
Q:MaxCompute数据源数据集编辑界面刷新预览数据报错:
A:错误原因:2018年1月10日 20点 新创建的项目(project)默认禁止分区表全表扫描,即对该项目的分区表执行全表扫描语句时会返回失败。
1.指定分区条件,自定义sql在对分区表全表扫描的sql语句后加 ‘where pt = xxx’ 限制分区。
2.创建报表时对分区字段添加过滤。
Q:SqlServer、PostgreSQL、Oracle数据源,找不到对应表?
A: 请确认添加数据源schema是否正确
Q:自定义sql创建数据集,字段呈现下图形式,刷新预览数据报错?
A:如上图标识,字符类型用?打标,说明后期对该字段别名进行了修改。字段名称前后有下划线_ 说明字段别名中加了单引号。解决办法:修改自定义sql并保存,在数据集编辑界面同步表结构,将错误字段删除,保存数据集最后刷新预览数据即可。
若有疑问请扫下图二维码加钉钉群,@袁世卿 获取技术支持!
二群