Data Classes

riderLevels = ifelse(circ$daily < 10000, "low", ifelse(circ$daily > 20000, "high", "med")) riderLevels = factor(riderLevels, levels = c("low","med","high")) head(riderLevels)

Now that we know more about factors, cut() will make more sense:

x = 1:100
cx = cut(x, breaks=c(0,10,25,50,100))
head(cx)

## [1] (0,10] (0,10] (0,10] (0,10] (0,10] (0,10]
## Levels: (0,10] (10,25] (25,50] (50,100]

table(cx)

## cx
##   (0,10]  (10,25]  (25,50] (50,100] 
##       10       15       25       50

We can also leave off the labels

cx = cut(x, breaks=c(0,10,25,50,100), labels=FALSE)
head(cx)

## [1] 1 1 1 1 1 1

table(cx)

## cx
##  1  2  3  4 
## 10 15 25 50

Note that you have to specify the endpoints of the data, otherwise some of the categories will not be created

cx = cut(x, breaks=c(10,25,50), labels=FALSE)
head(cx)

## [1] NA NA NA NA NA NA

table(cx)

## cx
##  1  2 
## 15 25

table(cx,useNA="ifany")

## cx
##    1    2 <NA> 
##   15   25   60

$letters [1] "A" "b" "c" $numbers [1] 1 2 3 [[3]] [,1] [,2] [,3] [,4] [,5] [1,] 1 6 11 16 21 [2,] 2 7 12 17 22 [3,] 3 8 13 18 23 [4,] 4 9 14 19 24 [5,] 5 10 15 20 25

Here is a good chance to introduce lapply, which performs a function within each list element:

> # head(dayList)
> lapply(dayList, head, n=2)

$Friday
      day       date orangeBoardings orangeAlightings orangeAverage
5  Friday 01/15/2010            1645             1643        1644.0
12 Friday 01/22/2010            1401             1388        1394.5
   purpleBoardings purpleAlightings purpleAverage greenBoardings
5               NA               NA            NA             NA
12              NA               NA            NA             NA
   greenAlightings greenAverage bannerBoardings bannerAlightings
5               NA           NA              NA               NA
12              NA           NA              NA               NA
   bannerAverage  daily    newDate   newDate2
5             NA 1644.0 2010-01-15 2010-01-15
12            NA 1394.5 2010-01-22 2010-01-22

$Monday
     day       date orangeBoardings orangeAlightings orangeAverage
1 Monday 01/11/2010             877             1027         952.0
8 Monday 01/18/2010             999             1000         999.5
  purpleBoardings purpleAlightings purpleAverage greenBoardings
1              NA               NA            NA             NA
8              NA               NA            NA             NA
  greenAlightings greenAverage bannerBoardings bannerAlightings
1              NA           NA              NA               NA
8              NA           NA              NA               NA
  bannerAverage daily    newDate   newDate2
1            NA 952.0 2010-01-11 2010-01-11
8            NA 999.5 2010-01-18 2010-01-18

$Saturday
        day       date orangeBoardings orangeAlightings orangeAverage
6  Saturday 01/16/2010            1457             1524        1490.5
13 Saturday 01/23/2010            1202             1210        1206.0
   purpleBoardings purpleAlightings purpleAverage greenBoardings
6               NA               NA            NA             NA
13              NA               NA            NA             NA
   greenAlightings greenAverage bannerBoardings bannerAlightings
6               NA           NA              NA               NA
13              NA           NA              NA               NA
   bannerAverage  daily    newDate   newDate2
6             NA 1490.5 2010-01-16 2010-01-16
13            NA 1206.0 2010-01-23 2010-01-23

$Sunday
      day       date orangeBoardings orangeAlightings orangeAverage
7  Sunday 01/17/2010             839              938         888.5
14 Sunday 01/24/2010             715              711         713.0
   purpleBoardings purpleAlightings purpleAverage greenBoardings
7               NA               NA            NA             NA
14              NA               NA            NA             NA
   greenAlightings greenAverage bannerBoardings bannerAlightings
7               NA           NA              NA               NA
14              NA           NA              NA               NA
   bannerAverage daily    newDate   newDate2
7             NA 888.5 2010-01-17 2010-01-17
14            NA 713.0 2010-01-24 2010-01-24

$Thursday
        day       date orangeBoardings orangeAlightings orangeAverage
4  Thursday 01/14/2010            1194             1233        1213.5
11 Thursday 01/21/2010            1303             1307        1305.0
   purpleBoardings purpleAlightings purpleAverage greenBoardings
4               NA               NA            NA             NA
11              NA               NA            NA             NA
   greenAlightings greenAverage bannerBoardings bannerAlightings
4               NA           NA              NA               NA
11              NA           NA              NA               NA
   bannerAverage  daily    newDate   newDate2
4             NA 1213.5 2010-01-14 2010-01-14
11            NA 1305.0 2010-01-21 2010-01-21

$Tuesday
      day       date orangeBoardings orangeAlightings orangeAverage
2 Tuesday 01/12/2010             777              815           796
9 Tuesday 01/19/2010            1023             1047          1035
  purpleBoardings purpleAlightings purpleAverage greenBoardings
2              NA               NA            NA             NA
9              NA               NA            NA             NA
  greenAlightings greenAverage bannerBoardings bannerAlightings
2              NA           NA              NA               NA
9              NA           NA              NA               NA
  bannerAverage daily    newDate   newDate2
2            NA   796 2010-01-12 2010-01-12
9            NA  1035 2010-01-19 2010-01-19

$Wednesday
         day       date orangeBoardings orangeAlightings orangeAverage
3  Wednesday 01/13/2010            1203             1220        1211.5
10 Wednesday 01/20/2010            1375             1416        1395.5
   purpleBoardings purpleAlightings purpleAverage greenBoardings
3               NA               NA            NA             NA
10              NA               NA            NA             NA
   greenAlightings greenAverage bannerBoardings bannerAlightings
3               NA           NA              NA               NA
10              NA           NA              NA               NA
   bannerAverage  daily    newDate   newDate2
3             NA 1211.5 2010-01-13 2010-01-13
10            NA 1395.5 2010-01-20 2010-01-20

Data Classes:

Character and numeric

Integer

Integer

Logical

Logical

Factor

Factors

Factors

Factors

Factors

Factors

Creating categorical variables

Creating categorical variables

Charm City Circulator data

Creating categorical variables

Creating categorical variables

Creating categorical variables

Creating categorical variables

Cut

Date

Date

POSIXct

Data Classes:

Matrices

Matrix (and Data frame) Functions

Data Selection

Data Selection

Data Frames

Data Frames versus Matrices

Data Frames versus Matrices

Data Classes

Arrays

Arrays

Lists

List Structure

List referencing

List referencing

List referencing

List referencing

Splitting Data Frames

Splitting Data Frames

General Class Information