Getting started with Cassandra 2.1

GETTING STARTED WITH
BY VISWANATH JAYACHANDRAN

AGENDA
PART 1
• BIG DATA
• INTRODUCTION TO CASSANDRA
• INTERNAL ARCHITECTURE
• WRITE PATH
• COMPACTION
• READ PATH
PART 2
• INSTALLATION
• CASSANDRA TOOLS
• CCM
• OPS CENTRE
• DEV CENTRE
• NODE TOOL AND
• CASSANDRA STRESS
• DATA MODEL
• CASSANDRA QUERY LANGUAGE
(CQL)

RESOURCES
• PLANET CASSANDRA
• HTTP://PLANETCASSANDRA.ORG/
• DATASTAX CASSANDRA DOCUMENTATION
• HTTP://WWW.DATASTAX.COM/DOCS
• APACHE CASSANDRA PROJECT
• HTTP://CASSANDRA.APACHE.ORG/

BIG DATA
EVERYBODY IS DOING IT BUT, NOT MANY KNOW WHAT IT IS.

CHARACTERISTICS REQUIRED FOR BIG DATA
SYSTEMS
• MULTI-REGION AVAILABILITY
• VERY FAST AND RELIABLE
RESPONSE
• NO SINGLE POINT OF FAILURE

RELATIONAL MODEL
• NORMALIZED TABLE SCHEMA
• CROSS TABLE JOINS
• ACID COMPLIANCE
• BIG DATA TABLE JOINS – BILLIONS OF
ROWS, OR MORE – REQUIRE
MASSIVE OVERHEAD
• SHARDING TABLES ACROSS
SYSTEMS IS COMPLEX AND FRAGILE

BIG DATA
PRIORITIES OF MODERN
APPLICATION
1. NEEDS FOR SPEED AND
AVAILABILITY OUTRANKS "ALWAYS
ON" CONSISTENCY
2. COMMODITY SERVER RACKS
INSTEAD OF MASSIVE HIGH-END
SYSTEMS
3. REAL WORLD NEED FOR
TRANSACTIONAL GUARANTEES IS
LIMITED
STRATEGIES FOR MODERN
APPLICATION
1. RELAX CONSISTENCY AND
SCHEMA REQUIREMENTS
2. DISTRIBUTE DATA ACROSS NODES
3. OPTIMIZE DATA TO SUIT ACTUAL
NEEDS

CAP THEOREM
• IN DISTRIBUTED SYSTEMS, CONSISTENCY, AVAILABILITY, AND PARTITION
TOLERANCE EXIST IN A MUTUALLY DEPENDENT RELATIONSHIP.
• PICK ANY TWO.

SOFTWARE. HARDWARE. COMPLETE
• VERTICAL SCALING HAS ITS
LIMITS!

WHAT IS CASSANDRA?
• A DISTRIBUTED DATABASE FOR MANAGING LARGE AMOUNTS
OF STRUCTURED DATA ACROSS MANY COMMODITY SERVERS.
• NEAR-LINEAR HORIZONTAL SCALING ACROSS COMMODITY
SERVERS
• NO SINGLE POINT OF FAILURE: CASSANDRA HAS A MASTER
LESS “RING” DESIGN WHERE ALL NODES PLAY AN IDENTICAL
ROLE; THERE IS NO CONCEPT OF A MASTER NODE.

FAULT TOLERANT
10
50
3070
80
40
20
60
Client
Replication Factor = 3
We could still
retrieve the data
from the other 2
nodes
Node failure or it goes
down temporarily

LINEARLY SCALABLE
• SIMPLY ADD NODES TO DOUBLE, QUADRUPLE PERFORMANCE AND CAPACITY
10
50
3070
80
40
20
60
10
30
2040100 000
transactions
/sec
200 000
transactions
/sec
400 000
transactions
/sec
10
20

MULTI DATA CENTRE SUPPORT
• DATA CENTERS ARE ACTIVE –
ACTIVE
• WRITE TO EITHER DATA
CENTRE
North American
Data Center
European
Data Center
Client
15
55
3575
85
45
25
65
10
50
3070
80
40
20
60
ASYNCHRONO
US
REPLICATION
• BENEFITS
• DATA-LOCALITY
• DISASTER RECOVERY

AVAILABILITY AND RESILIENCY AS A
SERVICE
A SET OF TOOLS (SCHEDULED
AGENTS) THAT DELIBERATELY SHUTS
DOWN SERVICES, SLOWS DOWN
PERFORMANCES, CHECKS
CONFORMITY
• CHAOS MONKEY RANDOMLY
BRINGS DOWN A NODE.
• GORILLA MONKEY SIMULATES THE
OUTAGE OF AN ENTIRE AVAILABILITY
ZONE
• KONG MONKEY SIMULATES THE

Cluster
MULTI DATA CENTRE FOR
WORKLOAD SEGREGATION
• COPY OF PRODUCTION DATA FOR TESTING, BENCHMARKING AND RUNNING
ANALYTICS
Analytics
Data Center
Spark / Hadoop
Production / live
Data Center
Client
15
55
3575
85
45
25
65
10
50
3070
80
40
20
60
ASYNCHRONO
US
REPLICATION

ORACLE VS CASSANDRA DEPLOYMENTS

CLOUDERA: HADOOP'S ANTI FRAUD REFERENCE
ARCHITECTURE

REAL TIME FRAUD DETECTION WITH DSE

HISTORY
• CLUSTER LAYER
• AMAZON DYNAMO DB
PAPER
• MASTERLESS
ARCHITECTURE
• DATA-STORE LAYER
• GOOGLE BIG TABLE
PAPER
• COLUMNS/COLUMNS
FAMILY
• OPEN
SOURCED
SINCE 2008

INTERNAL ARCHITECTURE
Cassandra cluster
Data centre 1
Node
2
Node
1
Node
4
Node
3
Data centre 2
Node
6
Node
5
Node
8
Node
7
• NODE – ONE
CASSANDRA
INSTANCE
• RACK – A
LOGICAL SET OF
NODES
• DATA CENTRE – A
LOGICAL SET OF
RACKS
• CLUSTER – THE
FULL SET OF
NODES WHICH
MAP TO A SINGLE
COMPLETE
TOKEN RING

DATA DISTRIBUTION
• DATA IS STORED ON NODES IN PARTITIONS, THAT’S ANALOGOUS
TO A ROW IN A RDBMS TABLE.
• A PARTITION’S KEY IS PASSED TO A CONSISTENT HASHING
ALGORITHM TO GENERATE A TOKEN.
• TOKEN IS AN INTEGER WHOSE VALUE IS BETWEEN 2-63 TO 263
• TOKEN IS USED TO IDENTIFY THE LOCATION OF A PARTITION
WITHIN A CLUSTER.
• IN OTHER WORDS, TOKEN = HASH (PARTITION KEY)
MurmurHash3 function
12345
329585043
2507136630
test@example.co
m

CONSISTENT HASHING AND PARITIONER
• CONSISTENT HASHING ALLOWS
DISTRIBUTING DATA ACROSS A
CLUSTER WHICH MINIMIZES
REORGANIZATION WHEN NODES
ARE ADDED OR REMOVED.
name
ag
e Car gender
jim 36 camaro M
carol 37 bmw F
johnn
y
12 M
suzy 10 F
Partition
key
Partition
key Murmur3 hash value
jim -2245462676723223822
carol 7723358927203680754
johnny -6723372854036780875
suzy 1168604627387940318
1
3
24
-9223372036854775808
to
-4611686018427387903
4611686018427387903
to
9223372036854775808
-4611686018427387904
to -1
0 to
4611686018427387903
suzy
1168604627387940318
johnny
-6723372854036780875
carol
7723358927203680754
jim
-2245462676723223822
• EACH NODE IN THE CLUSTER IS
RESPONSIBLE FOR A RANGE OF
DATA BASED ON THE HASH
VALUE

V-NODES
• VNODES ALLOW EACH
NODE TO OWN A LARGE
NUMBER OF SMALL
PARTITION RANGES
DISTRIBUTED
THROUGHOUT THE
CLUSTER.
• VNODES ALSO USE
CONSISTENT HASHING TO
DISTRIBUTE DATA BUT
USING THEM DOESN'T
REQUIRE TOKEN

CONSISTENCY LEVELS
• APPLY BOTH TO READ & WRITE AND TUNABLE AT RUNTIME
1. ONE: FAST, MAY NOT READ LATEST WRITTEN VALUE
2. QUORUM: STRICT MAJORITY W.R.T. REPLICATION FACTOR GOOD BALANCE
3. ALL: PARANOID SLOW, NO HIGH AVAILABILITY

WRITE PATH
HOW DATA IS WRITTEN INTO THE STORAGE ENGINE

LOG STRUCTURED STORAGE ENGINE
• IN CASSANDRA, DATA IS SEQUENTIALLY APPENDED, NOT PLACED IN PRE-SET
LOCATIONS

KEY COMPONENTS OF THE WRITE PATH
• TO HANDLE WRITE REQUESTS, EACH NODE IMPLEMENTS 4 KEY COMPONENTS
1. MEMTABLES – IN-MEMORY TABLES CORRESPONDING TO CQL TABLES, WITH
INDEXES
2. COMMIT LOG – APPEND-ONLY LOG, REPLAYED TO RESTORE DOWNED NODE'S
MEMTABLES
3. SSTABLES – MEMTABLE SNAPSHOTS PERIODICALLY FLUSHED TO DISK, CLEARING
HEAP
4. COMPACTION – PERIODIC PROCESS TO MERGE AND STREAMLINE SSTABLES
Process
Artifacts

Memtable corresponding to the CQL table
Node memory
Node file system
Commit log
Coordinato
r
Nod
e
Partition key
3
firstName:Bruc
e
lastName:Wayne age:30
Partition key
2
firstName:Alfre
d
lastName:Pennywo
rth
age:62
Partition key
1
firstName:Jim lastName:Gordon age:42
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
Immutable sorted string
tables
Flush current
state to
SSTable
Commit log
append
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
. . . . . . . . . . . . . . . .
Periodic
compaction

COMMITLOG
• CONFIGURED IN CONF/CASSANDRA.YAML
• WHEN COMMIT LOG SIZE REACHES ITS
THRESHOLD, THE MEMTABLE IS FLUSHED TO
DISK.
• COMMITLOG_TOTAL_SPACE_IN_MB – TOTAL
SPACE TO BE USED FOR ALL COMMIT LOGS
• COMMITLOG_SEGMENT_SIZE_IN_MB – MAX
SIZE OF INDIVIDUAL COMMIT LOG SEGMENT
• FLUSHED COMMIT LOG SEGMENTS ARE
REUSED INSTEAD OF WIPING THEM AND
REUSING THEM.
• FOR EFFICIENCY, ENSURE THAT DATA
DIRECTORIES AND COMMIT LOGS IN
DIFFERENT DRIVES TO MINIMISE WRITE
HEAD CONTENTION.
• COMMIT LOG ENTRIES ACCRUE
IN MEMORY, AND ARE
SYNCHRONISED TO DISK IN
EITHER A BATCH OR PERIODIC
MANNER.
• BATCH – WRITES ARE NOT
ACKNOWLEDGED UNTIL THE LOG
SYNCS TO DISK. DEFAULT IS 50
MS
• PERIODIC – WRITES ARE
ACKNOWLEDGED IMMEDIATELY,
WHILE SYNC HAPPENS
PERIODICALLY. DEFAULT SYNC
CYCLE IS 10 SECONDS.
• SEE COMMITLOG_SYNC

COMPACTION
• IT IS A CRITICAL, PERIODIC SSTABLE
MAINTENANCE PROCESS THAT
1. MERGES MOST RECENT PARTITION KEYS AND
COLUMNS
2. EVICTS DELETED AND TTL EXPIRED
PARTITION COLUMNS
3. CREATES NEW SSTABLE
4. REBUILDS PARTITION INDEX AND PARTITION
SUMMARY
5. DELETES THE OLD SSTABLES
• WHY IT IS NECESSARY?
• SSTABLES ARE IMMUTABLE, SO UPDATES
TEND TO FRAGMENT DATA OVER TIME
• DELETES ARE WRITES AND MUST BE

READ PATH
UNDERSTAND HOW DATA IS READ FROM THE STORAGE ENGINE

Coordinato
r
… … … …
pk7 … … Level:42
Timestamp 1114
Node memory
Node file system
pk1 … … …
pk7 First:Betty
Timestamp:541
Last:Blue
Timestamp:541
Level:63
Timestamp:541
pk2 … … …
pk7 First:Elizabeth
Timestamp: 994
Level:63
Timestamp: 994
pk1 … … …
pk2 … … …
SS Tables
MemTabl
e
Row cache
Pk1
Pk2
pk7Read
<pk7>
Hi
t pk7 First: Elizabeth Last: Blue Level: 42

Coordinato
r
… … … …
Timestamp 1114
Node memory
Node file system
pk1 … … …
pk7 First:Betty
Timestamp:541
Last:Blue
Timestamp:541
Level:63
Timestamp:541
pk2 … … …
pk7 First:Elizabeth
Timestamp: 994
Level:63
Timestamp: 994
pk1 … … …
pk2 … … …
SS Tables
MemTabl
e
Row cache
Pk1
Pk2
Read
<pk7>
Miss
Bloo
m
filter
Bloo
m
filter
Bloo
m
filter
Key
Cach
e
pk
7?
pk
7?
Hi
t
Hi
t
pk7 First:Elizabet
h
Last:Blue Level:42
Merge all data read based on time
stamp

Coordinato
r
… … … …
Timestamp 1114
Node memory
Node file
system
pk1 … … …
pk7 First:Betty
Timestamp:54
1
Last:Blue
Timestamp:541
Level:63
Timestamp:541
pk2 … … …
pk7 First:Elizabeth
Timestamp:
994
Level:63
Timestamp: 994
pk1 … … …
pk2 … … …
SS Tables
MemTabl
e
Row cache
Pk1
Pk2
Read
<pk7>
Miss
Bloo
m
filter
Bloo
m
filter
Bloo
m
filter
Key
Cach
e
pk
7?
pk
7?
Partition
summary
Partition
index
Partition
index
Partition
summary
Miss
Miss
pk7 First:Elizabet
h
Last:Blu
e
Level:42
Merge

TOMBSTONES
• DELETED COLUMNS ARE NOT IMMEDIATELY REMOVED, JUST MARKED FOR
DELETION.
• WHY? IMMEDIATE REMOVAL WOULD REQUIRE A TIME-WASTING SEEK
• WHEN A CQL QUERY DELETES A PARTITION COLUMN, OR ITS TTL IS FOUND TO
BE EXPIRED DURING A READ THE FOLLOWING HAPPENS
1. A TOMBSTONE (DELETION MARKER) IS APPLIED TO THIS COLUMN IN ITS
MEMTABLE
2. SUBSEQUENT QUERIES TREAT THIS COLUMN AS DELETED
3. AT THE NEXT MEMTABLE FLUSH, THE TOMBSTONE PASSES TO THE NEW
SSTABLE AT EACH COMPACTION, TOMBSTONED COLUMNS OLDER THAN
GC_GRACE_SECONDS ARE EVICTED FROM THE NEWLY COMPACTED
SSTABLES

ZOMBIE COLUMNS
• IF A NODE FAILS BEFORE A REPLICATED
TOMBSTONE ARRIVES, THEN IS RESTORED MORE
THAN GC_GRACE_SECONDS LATER, THE
OTHERWISE DELETED COLUMN WILL REAPPEAR, AS
ALL OTHER NODES WILL HAVE EVICTED THE
TOMBSTONE.
THE CURE
• USE NODETOOL REPAIR WHEN RESTORING FAILED
NODES, TO ENSURE ALL ITS PARTITIONS ARE
CONSISTENT, INCLUDING ANY PENDING DELETIONS.

CASSANDRA QUERY
LANGUAGE
(CQL)
PROVIDES A FAMILIAR, ROW-COLUMN, SQL-LIKE APPROACH
PROVIDES CLEAR SCHEMA DEFINITIONS IN A FLEXIBLE (NOSQL)
SCHEMA CONTEXT

Table (Column
Family) -
Contains rows
Keyspace - Contains
all tables. Specifies
replication
Cluster - Contains all nodes.
Even across WAN
LOGICAL CONTAINERS

INSTALLATION
DOWNLOAD ALL NECESSARY SOFTWARE FROM
HTTP://DOWNLOADS.DATASTAX.COM/COMMUNITY/

CASSANDRA CLUSTER
MANAGER
CCM
A LIBRARY (OR META-TOOL) TO CREATE, LAUNCH AND
REMOVE AN APACHE CASSANDRA CLUSTER ON LOCALHOST.
FOR DETAILS, SEE HTTPS://GITHUB.COM/PCMANUS/CCM

CCM – CREATE A TEST CLUSTER
• CCM CREATE TEST -V 2.1.8 -N 2 -S –D
• CREATE A CLUSTER
• NAMED 'TEST'
• USING CASSANDRA VERSION 2.1.8
• WITH 2 NODES
• START IT RIGHT AWAY
• DEBUG OUTPUT FOR START-UP PROCESS.
• CCM WILL INSTALL AND COMPILE THE VERSION OF CASSANDRA IF IT'S
UNAVAILABLE.
• ONCE STARTED, CCM WILL UTILISE THIS CLUSTER AS THE DEFAULT ONE.
• EACH NODE ON CASSANDRA CLUSTER CAN USE A DIFFERENT VERSION.

CCM – EXECUTE AN EXTERNAL FILE

CASSANDRA CLUSTER MANAGER (CCM) – ADD A
NODE

OPS CENTER
A WEB-BASED VISUAL MANAGEMENT AND MONITORING SOLUTION

NODE TOOL
COMMAND LINE CLUSTER MANAGEMENT UTILITY THAT
CONNECTS TO A SPECIFIC NODE VIA JMX

CASSANDRA STRESS
A LOAD TESTING UTILITY THAT PERFORMS INSERTS AND
READS TO A TEST KEYSPACE, IN AN EFFORT TO MEASURE
PERFORMANCE AND BENCHMARK.

DEV CENTER
A VISUAL SCHEMA AND QUERY TOOL THAT ALLOWS
DEVELOPERS TO CREATE AND RUN CQL QUERIES AND
COMMANDS.

DIVERGENCE OF CASSANDRA FROM THE
RELATIONAL WORLD
• IN A RELATIONAL DATABASE, ONE CAN SEARCH ON ANY OF THE COLUMNS
THAT BELONG TO THE TABLE BUT NOT IN CASSANDRA.
• CASSANDRA STORES THE DATA DIFFERENTLY ON THE DISK THAN THE WAY
CQL PRESENTS IT.
• CQL PROVIDES A TWO DIMENSIONAL VIEW OF POTENTIALLY
MULTIDIMENSIONAL DATA
• SIMPLY PUT, CASSANDRA PHYSICALLY STORES DATA AS A MAP OF MAPS.

1
title
Interstellar
runtime
169
year
2014
2
title
Minions
runtime
91
year
2015
3
title
Thor
runtime
115
year
2011
Key Value
Partitions
Partition key
PHYSICAL STORAGE

COLUMN FAMILY
• TABLE IS A SET OF PARTITIONS
• PARTITION MAY BE SINGLE OR MULTIPLE
ROW
• PARTITION KEY UNIQUELY IDENTIFIES A
PARTITION AND MAY BE SIMPLE OR
COMPOSITE
• COLUMN UNIQUELY IDENTIFIES A CELL
IN A PARTITION, AND MAY BE REGULAR
OR CLUSTERING
• PRIMARY KEY IS COMPRISED OF A
PARTITION KEY PLUS CLUSTERING
COLUMNS, IF ANY, AND UNIQUELY
IDENTIFIES A ROW IN BOTH ITS
PARTITION AND TABLE

COLUMN FAMILY
• SET OF ROWS WITH A SIMILAR STRUCTURE.
• SORTED COLUMNS
• MULTI DIMENSIONAL DATA
• SIZE OF A COLUMN FAMILY IS ONLY LIMITED TO THE SIZE OF A CLUSTER
• ROWS ARE DISTRIBUTED AMONG THE NODES IN A CLUSTER
• DATA FROM A ONE ROW MUST FIT ON ONE NODE
• DATA FROM ANY GIVEN ROW NEVER SPANS MULTIPLE NODES
• MAXIMUM COLUMNS PER ROW IS 2 BILLION IN THEORY BUT IN PRACTICE – UP TO
100 THOUSAND
• MAXIMUM DATA SIZE PER COLUMN VALUE IS 2 GB IN THEORY BUT IN PRACTICE IT’S
UP TO 100 MB

UPSERTS
• CASSANDRA DOES NOT PERFORM A READ OPERATION BEFORE A WRITE.
• IT’S AN OPTIMISATION BY DESIGN BECAUSE WITH MASSIVE AMOUNT OF DATA
RESIDING IN THE DATA STORE, A WRITE OPERATION PERFORMED BEFORE
EVERY READ WOULD NOT SCALABLE BY DESIGN.
• CASSANDRA DOES NOT MAKE ANY DISTINCTION BETWEEN AN INSERT AND AN
UPDATE; WHICH MAKES THE TERM UPSERT.
• YOU’LL BE UPSET IF YOU DO AN UPSERT ;)

UPSERTS: CASE 1
• NO PRIMARY KEY VIOLATION EXCEPTION
• CASSANDRA SIMPLY FINDS THE CORRESPONDING PARTITION, PERFORMS AN INSERT
OPERATION AND RETURNS.
• HOWEVER, DEVELOPERS CAN STILL EXPLICITLY ASK CASSANDRA TO PERFORM A READ
PRIOR TO A WRITE OPERATION.

UPSERTS: CASE 2
• UPDATES TO AN NON EXISTING RECORD PERFORMS AN INSERT BY USING THE
WHERE CLAUSE.

LIGHT WEIGHT TRANSACTIONS OR
COMPARE AND SET (CAS)
• A NEW CLAUSE IF NOT EXISTS FOR INSERTS
• INSERT OPERATION EXECUTES IF A ROW WITH THE SAME PRIMARY KEY DOES NOT EXIST
• USES A CONSENSUS ALGORITHM CALLED PAXOS TO ENSURE INSERTS ARE DONE SERIALLY
• MULTIPLE MESSAGES ARE PASSED BETWEEN COORDINATOR AND REPLICAS WITH A LARGE
PERFORMANCE PENALTY
[applied] column returns true if row
does not exist and insert executes
[applied] column is false if row exists
and the existing row will be returned

LIGHT WEIGHT TRANSACTIONS OR
COMPARE AND SET (CAS)
• UPDATE USES IF TO VERIFY THE VALUE FOR COLUMN(S) BEFORE EXECUTION
[applied] column returns true if
condition(s) matches and update
written
[applied] column is false if condition(s)
do not match and the current row will be
returned

TTL OPTION
• TIME-TO-LIVE (TTL) DEFINES EXPIRING
COLUMNS THAT ARE EVENTUALLY DELETED.
• TTL IS SPECIFIED IN SECONDS.
• BENEFIT:
• HELPS KEEP THE SIZE OF A TABLE AND ITS
PARTITIONS MANAGEABLE
• RESTRICTS THE DATA VIEW TO MOST RECENT
DATA
Store a row for 86400 seconds
Re-inserting the same row before it
expires will overwrite TTL.

CLUSTERING COLUMNS
• CLUSTERING COLUMNS GROUP TABLE’S ROWS INTO PARTITIONS.
• CLUSTERING COLUMN COME AFTER PARTITION KEY, WITHIN PRIMARY KEY CLAUSE.
• DOUBLE SET OF PARENTHESES AROUND THE PARTITION KEY IS FOR CLUSTERING
COLUMNS. Partition key
Clustering
column

CLUSTERING COLUMNS
year name id runtime
2014 Interstellar 1 169
2015 Minions 2 91
2011 Thor 3 115
2015 Home 4 94
2015
2014
2011
Minions:id Minions:runti
me
2 91
Home:id Home:runtime
4 94
Interstellar:i
d
Interstellar:runti
me
1 169
Thor:id Thor:runtime
3 115
‘Home’ comes before ‘Minions’ as
names are arranged in ascending
order

QUERYING CLUSTERING COLUMNS
• CLUSTERED COLUMN VALUES ARE STORED IN SORTED ORDER WITH ASCENDING
BEING THE DEFAULT ORDER. HOWEVER, CLUSTERING COLUMN’S ORDERING CAN
BE CHANGED.

QUERYING CLUSTERING COLUMNS
• TO LOCATE A PARTICULAR ROW WITHIN A CLUSTERED PARTITION REQUIRES A
SIMPLE BINARY SEARCH; WHICH IS OF LOGARITHMIC TIME AND HENCE
CONSIDERABLY FAST.
Partition key
Clustering
column

RANGE QUERY ON CLUSTERING COLUMNS
• RANGE QUERIES CAN ALSO BE PERFORMED ON CLUSTERING COLUMNS.
• HOWEVER, RANGE SEARCH CAN BE PERFORMED ONLY ON CLUSTERING COLUMNS;
NOT ANY OTHER
Partition key
Clustering
column

STATIC COLUMN
• STATIC COLUMN VALUES ARE SHARED FOR ALL ROWS IN A MULTI-ROW
PARTITION

UUID AND TIMEUUID
• UNIVERSALLY UNIQUE IDENTIFIERS THAT’S USED TO ASSIGN CONFLICT-FREE
(UNIQUE) IDENTIFIERS TO DATA OBJECTS.
• FORMAT
HEX{8}-HEX{4}-HEX{4}-HEX{4}-HEX{12}
• UUID:
• VERSION 4 UUIDS SEPARATED BY DASHES
• TIMEUUID:
• VERSION 1 UUIDS
• EMBEDS A TIME VALUE WITHIN A UUID - GENERATED USING TIME (60 BITS), A CLOCK
SEQUENCE NUMBER (14 BITS), AND MAC ADDRESS (48 BITS)
• CQL FUNCTION NOW() GENERATES A NEW TIMEUUID
• CQL FUNCTION DATEOF() EXTRACTS THE EMBEDDED TIMESTAMP FROM TIMEUUID

COUNTER
• DATA TYPE FOR A DISTRIBUTED COUNTER FOR TRACKING A COUNT.
• IT ALLOWS RACE-FREE INCREMENTS WITH LOCAL LATENCY ACROSS MULTIPLE
DATACENTERS SIMULTANEOUSLY
• LIMITATIONS
1. INITIALISED WITH ZERO AND CAN ONLY BE INCREMENTED OR DECREMENTED
2. CANNOT BE A PART OF PRIMARY KEY
3. IF A TABLE HAS A COUNTER COLUMN, ALL NON-COUNTER COLUMNS MUST BE PART
OF A PRIMARY KEY

COUNTER
• CASSANDRA READS THE CURRENT VALUE FOR EVERY COUNTER UPDATE AND
APPLIES THE DELTA.
• PERFORMANCE
1. READ IS AS EFFICIENT AS FOR NON-COUNTER COLUMNS
2. UPDATE IS FAST BUT SLIGHTLY SLOWER THAN AN UPDATE FOR NON-COUNTER
COLUMNS
• ACCURACY
• IF A COUNTER UPDATE IS TIMED OUT, A CLIENT APPLICATION CANNOT SIMPLY
RETRY A “FAILED” COUNTER UPDATE AS THE TIMED-OUT UPDATE MAY HAVE BEEN
PERSISTED
• COUNTER UPDATE IS NOT AN IDEMPOTENT OPERATION

COLLECTION COLUMNS
• COLLECTION COLUMNS ARE MULTI-VALUED COLUMNS RETRIEVED IN ITS
ENTIRETY.
• SUPPORTED COLLECTIONS
• SET - TYPED COLLECTION OF UNIQUE VALUES
• ORDERED BY VALUES NO DUPLICATES
• LIST - TYPED COLLECTION OF NON-UNIQUE VALUES
• ORDERED BY POSITION DUPLICATES ALLOWED
• MAP - TYPED COLLECTION OF KEY-VALUE PAIRS
• ORDERED BY KEYS UNIQUE KEYS BUT NOT VALUES
• SIZE LIMITS
• MAXIMUM NUMBER OF ELEMENTS IN A COLLECTION: 64 000
• MAXIMUM SIZE OF EACH COLLECTION ELEMENT: 64 KB
• USAGE LIMITS
• CANNOT BE PART OF A PRIMARY KEY I.E. PARTITION KEY OR CLUSTERING COLUMN
• CANNOT NEST INSIDE ANOTHER COLLECTION

SET MANIPULATION
• DEFINE A USERS TABLE TO ACCOMMODATE MULTIPLE EMAIL ADDRESS
CREATE TABLE USERS (
USER_ID TEXT PRIMARY KEY,
FIRST_NAME TEXT,
LAST_NAME TEXT,
EMAILS SET<TEXT>
);
• INSERT DATA INTO THE SET, ENCLOSING VALUES IN CURLY BRACKETS
INSERT INTO USERS (USER_ID, FIRST_NAME, LAST_NAME, EMAILS)
VALUES('FRODO', 'BILBO', 'BAGGINS', {'FRODO@BAGGINS.NAME',
'BILBO.BAGGINS@ABOUT.ME'});
• ADD AN ELEMENT TO A SET USING THE UPDATE COMMAND AND THE ADDITION (+)
OPERATOR
UPDATE USERS
SET EMAILS = EMAILS + {'BILBO.BAGGINS@THEHOBBIT.ORG'} WHERE USER_ID = 'FRODO';
• REMOVE ALL ELEMENTS FROM A SET BY USING THE UPDATE OR DELETE
STATEMENT.

LIST MANIPULATION
• ADD A LIST DECLARATION TO A TABLE BY ADDING A COLUMN AND MANIPULATE IT
ALTER TABLE USERS ADD TOP_PLACES LIST<TEXT>;
UPDATE USERS SET TOP_PLACES = [ 'RIVENDELL', 'MORDOR' ] WHERE USER_ID = 'FRODO';
UPDATE USERS SET TOP_PLACES[2] = 'RIDDERMARK' WHERE USER_ID = 'FRODO';

MAP MANIPULATION
• ADD A TODO LIST TO EVERY USER PROFILE IN AN EXISTING USERS TABLE
ALTER TABLE USERS ADD TODO MAP<TIMESTAMP, TEXT>;
UPDATE USERS
SET TODO = { '2012-9-24' : 'ENTER MORDOR', '2014-10-2 12:00' : 'THROW RING INTO MOUNT
DOOM' }
WHERE USER_ID = 'FRODO';
UPDATE USERS
SET TODO = TODO + { '2013-10-1 18:00': 'CHECK INTO INN OF PRACING PONY'}
WHERE USER_ID='FRODO';
• COMPUTE THE TTL TO USE TO EXPIRE TO-DO LIST ELEMENTS ON THE DAY OF THE
TIMESTAMP, AND SET THE ELEMENTS TO EXPIRE.
UPDATE USERS USING TTL 86400
SET TODO['2012-10-1'] = 'FIND WATER' WHERE USER_ID = 'FRODO';

SECONDARY INDEX
• A SECONDARY INDEX CAN INDEX
ADDITIONAL COLUMNS TO ENABLE
SEARCHING BY THOSE COLUMNS
• ONE COLUMN PER INDEX
• LIMITATIONS: IT CANNOT BE CREATED
FOR
1. COUNTER COLUMNS
2. STATIC COLUMNS
• DROP A SECONDARY
INDEX
• CREATE A SECONDARY
INDEX

SECONDARY INDEX:
WHEN AND WHEN NOT TO USE IT
• SECONDARY INDEXES ARE FOR
SEARCHING CONVENIENCE SO USE
IT ONLY
1. ON COLUMNS WITH LOW-
CARDINALITY
2. ON COLUMNS THAT MAY CONTAIN A
RELATIVELY SMALL SET OF
DISTINCT VALUES LIKE GENRE OF
MUSIC
3. WITH SMALLER DATASETS OR
WHEN PROTOTYPING
• DO NOT USE ON
1. ON HIGH-CARDINALITY COLUMNS
2. ON COUNTER COLUMN TABLES
3. ON A FREQUENTLY UPDATED OR
DELETED COLUMNS
4. TO LOOK FOR A ROW IN A LARGE
PARTITION UNLESS NARROWLY
QUERIED

USER-DEFINED TYPE
• GROUPS RELATED FIELDS OF INFORMATION
• REPRESENTS RELATED DATA IN A SINGLE TABLE, INSTEAD OF MULTIPLE, SEPARATE
TABLES
• TABLE COLUMNS CAN BE USER-DEFINED TYPES
• A USER-DEFINED TYPE CAN BE USED AS A DATA TYPE FOR A COLLECTION
• REQUIRES THE USE OF THE FROZEN KEYWORD

TUPLE
• FIXED-LENGTH SETS OF TYPED POSITIONAL FIELDS
• ALTERNATIVE TO CREATING A USER-DEFINED TYPE THAT’S USEFUL WHEN
PROTOTYPING
• ACCOMMODATES UP TO 32768 FIELDS, BUT GENERALLY ONLY USE A FEW
• TUPLES CAN BE NESTED IN OTHER TUPLES

BATCH STATEMENT
• COMBINES MULTIPLE INSERT, UPDATE, AND DELETE STATEMENTS INTO A
SINGLE LOGICAL OPERATION

BATCH STATEMENT
• ATOMIC OPERATION
• IF ANY STATEMENT IN THE BATCH SUCCEEDS, ALL WILL
• NO BATCH ISOLATION
• OTHER “TRANSACTIONS” CAN READ AND WRITE DATA BEING AFFECTED BY A
PARTIALLY EXECUTED BATCH
• ORDER
• OPERATIONS WITH IN A BATCH WILL BE EXECUTED IN ANY ORDER SEEN FIT BY THE
EXECUTION ENGINE

BATCH STATEMENT
UNLOGGED
BATCH
• DOES NOT WRITE TO THE BATCH LOG
• SAVES TIME BUT NO LONGER ATOMIC
• ALLOWS OPERATIONS ON COUNTER
COLUMNS

LIGHT WEIGHT TRANSACTIONS IN A BATCH
• BATCH WILL EXECUTE ONLY IF CONDITIONS FOR ALL LIGHTWEIGHT
TRANSACTIONS ARE MET
• ALL OPERATIONS IN BATCH WILL EXECUTE SERIALLY WITH THE INCREASED
PERFORMANCE OVERHEAD

STEPS TO BUILD A DATA MODEL
Application
workflow
Conceptual
Data model
Map
conceptual
to logical
Logical data
model
Physical
optimisation
Physcial
data model

Getting started with Cassandra 2.1

Getting started with Cassandra 2.1

More Related Content

Viewers also liked

Similar to Getting started with Cassandra 2.1

More from Viswanath J

Recently uploaded

Getting started with Cassandra 2.1

Editor's Notes