Cassandra Analytics

Cassandra Spark Bulk Reader

The open-source repository for the Cassandra Spark Bulk Reader. This library allows integration between Cassandra and Spark job, allowing users to run arbitrary Spark jobs against a Cassandra cluster securely and consistently.

This project contains the necessary open-source implementations to connect to a Cassandra cluster and read the data into Spark.

For example usage, see the example repository; sample steps:

import org.apache.cassandra.spark.sparksql.CassandraDataSource
import org.apache.spark.sql.SparkSession

val sparkSession = SparkSession.builder.getOrCreate()
val df = sparkSession.read.format("org.apache.cassandra.spark.sparksql.CassandraDataSource")
                          .option("sidecar_instances", "localhost,localhost2,localhost3")
                          .option("keyspace", "sbr_tests")
                          .option("table", "basic_test")
                          .option("DC", "datacenter1")
                          .option("createSnapshot", true)
                          .option("numCores", 4)
                          .load()

Cassandra Spark Bulk Writer

The Cassandra Spark Bulk Writer allows for high-speed data ingest to Cassandra clusters running Cassandra 3.0 and 4.0.

Developers interested in contributing to the Analytics library, please see the DEV-README.

Getting Started

For example usage, see the example repository. This example covers both setting up Cassandra 4.0, Apache Sidecar, and running a Spark Bulk Reader and Spark Bulk Writer job.

Name		Name	Last commit message	Last commit date
Latest commit History 57 Commits
.circleci		.circleci
cassandra-analytics-core-example		cassandra-analytics-core-example
cassandra-analytics-core		cassandra-analytics-core
cassandra-analytics-integration-framework		cassandra-analytics-integration-framework
cassandra-analytics-integration-tests		cassandra-analytics-integration-tests
cassandra-bridge		cassandra-bridge
cassandra-four-zero-bridge		cassandra-four-zero-bridge
cassandra-four-zero		cassandra-four-zero
cassandra-three-zero		cassandra-three-zero
config/checkstyle		config/checkstyle
githooks		githooks
gradle/wrapper		gradle/wrapper
ide/idea		ide/idea
profiles		profiles
scripts		scripts
.asf.yaml		.asf.yaml
.gitignore		.gitignore
CHANGES.txt		CHANGES.txt
DEV-README.md		DEV-README.md
LICENSE.txt		LICENSE.txt
NOTICE.txt		NOTICE.txt
README.md		README.md
build.gradle		build.gradle
code_version.sh		code_version.sh
gradle.properties		gradle.properties
gradlew		gradlew
settings.gradle		settings.gradle

License

apache/cassandra-analytics

Folders and files

Latest commit

History

Repository files navigation

Cassandra Analytics

Cassandra Spark Bulk Reader

Cassandra Spark Bulk Writer

Getting Started

About

Resources

License

Code of conduct

Security policy

Stars

Watchers

Forks

Languages