V2EX = way to explore
V2EX 是一个关于分享和探索的地方
Sign Up Now
For Existing Member  Sign In
wh1isper

Spaglim: PySpark 配置、Spark Connect Server On k8s 工具

  •  
  •   wh1isper · Jul 27, 2023 · 1607 views
    This topic created in 1016 days ago, the information mentioned may be changed or developed.

    发现市面上基本没有对 PySpark 进行配置的工具,同时 Spark 3.4.0 引入了 server-client 模式,也没有比较好的解决方案,我这里开源了一个简单的模块,支持以下功能:

    • 通过环境变量配置 Spark ,参见 config spark
    • 在 IPython/Jupyter 中执行 Spark SQL 的 %SQL%%SQL magic
      • SQL 语句可分多行编写,支持使用 ; 分隔语句
      • 支持配置连接客户端
      • TODO: 可视化 SQL 语句的结果( Spark 数据框架)
    • sparglim-server用于 daemon Spark Connect Server ,并支持 on K8S 部署

    更多: https://github.com/Wh1isper/sparglim

    No Comments Yet
    About   ·   Help   ·   Advertise   ·   Blog   ·   API   ·   FAQ   ·   Solana   ·   956 Online   Highest 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 27ms · UTC 20:30 · PVG 04:30 · LAX 13:30 · JFK 16:30
    ♥ Do have faith in what you're doing.