Airbyte中文社区

    • 注册
    • 登录
    • 搜索
    • 版块
    • 最新
    • 标签
    • 热门
    • 用户
    • 群组
    • 达之云

    入湖入仓,数据传输管道。开源软件Airbyte中文社区

    微信号:AirbyteCN

    QQ群:114917858

    Airbyte产品介绍

    资讯分享
    1
    1
    1499
    正在加载更多帖子
    • 从旧到新
    • 从新到旧
    • 最多赞同
    回复
    • 在新帖中回复
    登录后回复
    此主题已被删除。只有拥有主题管理权限的用户可以查看。
    • D
      dazdata 最后由 编辑

      一、Airbyte是做什么的?
      替代文字
      简单来讲,airbyte是做数据集成和连接的。将应用程序、API和数据库中的数据同步到数据仓库、数据湖和其他目的地

      支持200个Source类型连接器,100 个Destination类型的连接器

      2021年,9000多家公司使用Airbyte从PostgreSQL、Oracle、MySQL、Facebook广告、Salesforce、Stripe等来源同步数据,并连接到Redshift、Snowflake、Databricks和BigQuery等目的地

      社区:拥有4500名数据从业者和200名贡献者

      预计到2022年底将有500个高质量连接器且涵盖更多类型的数据移动,包括反向ETL和流式接收

      Airbyte解决了什么问题?
      第一:公司总是必须自己构建和维护数据连接器,因为大多数不太流行的“长尾”数据连接器不受封闭源ELT技术的支持。

      第二:数据团队通常必须围绕预建连接器进行定制工作,以使其在其独特的数据基础架构中工作。

      二、整体架构
      Airbyte一些核心概念
      Airbyte Connector——连接器

      在Airbyte的概念中,connector或者是收集从数据源推送过来的数据,或者去跟数据源发送请求去抓取数据。

      Airbyte规定每个connector都放在一个完整的docker镜像中

      Airbyte的connector的类型如下图:
      替代文字

      三、流程演示
      配置同步作业
      1、从Airbyte支持的“Sources”中选择想要连接的数据源,并配置相应信息
      替代文字
      2、从Airbyte支持的“Destinations”中选择数据
      替代文字
      3、刷新数据源schema
      替代文字
      4、数据同步
      替代文字
      5、结果展示
      替代文字
      6、10w数据同步测试
      替代文字

      1 条回复 最后回复 回复 引用 0
      • First post
        Last post