您的位置:

使用Dockersuperset实现高效数据可视化

一、起步

对于数据可视化,Superset是一个非常方便的工具。而为了更快地和更有效地使用Superset,我们可以使用Driverless AI,这条路径会让我们体验到数据科学家在构建复杂模型时所需要的一切。Driverless AI是H2O.ai提供的一个机器学习自动化工具,该工具旨在帮助客户快速,高级地构建先进的AI模型。建立在Driverless AI之上的Superset被命名为dockersuperset。为了展示一个最小化的操作示例,Superset最稍显复杂。

二、dockersuperset的部署

为了使用dockersuperset,我们首先需要在本地部署该工具。在这里,我们使用Docker Compose来简化部署过程。为了自动启动dockersuperset,我们拥有一个名为docker-compose.yml的Docker Compose文件,该文件包含以下内容:

version: '3'
services:
  superset:
    image: amancevice/superset:latest
    container_name: superset
    restart: always
    ports:
      - 8088:8088
    environment:
      - SUPERSET_LOAD_EXAMPLES=yes
    volumes:
      - ./superset:/home/superset
      - ./data:/data

在上面的文本段落中,我们使用了amancevice/superset镜像,使用8088端口启动了容器,并在数据文件夹中使用文件数据。

三、dockersuperset的相关设置

接下来,我们需要输入docker-compose up 命令,这将启动上述docker-compose.yml文件中的所有服务。很快,Superset将在控制台输出“Admin用户创建”的消息。此时,我们可以立即从http://localhost:8088中使用Superset,登录使用用户名和密码admin进行网站验证。在登录后,我们需要先配置数据库连接,这可以通过左侧栏中Database选项来完成。Superset支持多个不同的数据库,包括MySQL,PostgreSQL和Microsoft SQL Server等数据库。

Superset的一个强大功能是可视化元素,例如图表,数据表和仪表板。对于数据可视化,Superset提供了各种图表类型,包括堆栈,多线图表,面积图和散点图等等。所有这些都显示在“仪表板”选项卡上。同时,我们还可以在下拉列表中找到其他可视化元素,例如数据表或数字仪表板。

Superset的另一个值得注意的特点是数据表的视觉编辑器。在Superset的许多版本中,用户必须使用SQL编辑器来构建指向数据库的查询。但是,有了数据表可视化编辑器,用户现在可以通过拖放表、列和连接来构建查询,并使用“查看生成的SQL”复选框来查看最终生成的SQL语句。仪表板图还可以使用Markdown编辑器中的文本来添加交互式容器等元素。

四、启用驱动器自动AI

现在我们已经可以使用Superset进行数据可视化了,但是如果需要更快的高级AI模型,我们需要Driverless AI。直接运行Drivarless AI是非常困难且需要更多的配置工作的。 Luckily,H2O.ai开发了一个名为driverlessai-superset插件的插件,可以通过其在Superset中访问Driverless AI。

并非所有人都能够在不了解其工作原理的情况下正确地安装和使用Driverless AI。但是,我们可以通过使用driverlessai-superset插件来简化这个繁琐的任务。使用这种插件,我们可以在没有任何额外工作的情况下访问Driverless AI的所有设施。有了它,我们可以像使用任何其他Superset插件一样使用Driverless AI,例如:在仪表板中添加图表并查看结果。我们可以在Superset的多个图表类型中使用Driverless AI,例如普通图表或高级数据科学家图表等。

要启用在Superset中使用Driverless AI,我们首先需要下载驱动程序。

H2O.ai为此提供了一个安装脚本,该脚本可以在安装完Driverless AI后使用。使用此脚本,我们可以简单地启用Superset和Driverless AI之间的通信。 请注意,此脚本只需要在首次安装Superset后使用一次。启用插件后,我们将无需再次使用此脚本或其他工具。 同时,您可以在一个步骤中使用pip install -U h2oai-client,因为所有pypi客户端存储库都包含驱动程序。

五、总结

在本篇文章中,我们向大家展示了如何使用Superset进行数据可视化,以及如何使用driverlessai-superset插件访问Highend AI模型的方法。要总结所讨论的主题,我们建议使用Superset进行数据可视化,同时使用H2O.ai提供的Driverless AI在构建体系结构时进行补充。如此,我们可以利用当前最佳的AI和数据可视化技术,对我们关注的数据进行更高效且更有意义的可视化和分析。