Pyspark系列文章-通过toree项目使用Pyspark 发表于 2020-03-02 | 更新于 2022-10-25 | 分类于 pyspark | | 阅读次数: 本文字数: 1.1k | 阅读时长 ≈ 1 分钟 目录 背景 第一部分 Receiver接口模式 第二部分 Direct接口模式 第三部分 PySpark和Kafka交互 第四部分 任务提交 参考文献及资料 背景第一部分 安装toree1# pip install toree 安装 1# jupyter toree install --spark_home=/opt/spark-2.3.2/ 参考文献及资料1、Improvements to Kafka integration of Spark Streaming,